La sección de datos de Colombiacheck, medio digital que examina mediante el método de verificación de datos cuánta verdad hay en el discurso de los personajes públicos en Colombia, diseñó una herramienta que visualiza los datos de víctimas que se han registrado en cada uno de los 1.102 municipios del país por cada uno de los doce tipos de delito que maneja el Registro Único de Víctimas. El mapa contiene datos desde el año 1984 hasta el 2016.
Miriam Forero, especialista en periodismo de datos y mecanismos de acceso a la información pública para investigaciones y periodista de Colombiacheck, explica la metodología mediante la cual realizó este mapa, la importancia de la visualización de estos datos y los parámetros que se usaron en la búsqueda de la información.
¿Qué herramientas se usaron para hacer el mapa?
Se usaron dos librerías de JavaScript, el lenguaje de programación que es muy reconocido por su facilidad para desarrollar páginas web dinámicas e interactivas. La primera librería fue Mapbox.js, que permitió obtener la base del mapa, y la otra fue D3.js, que permite crear visualizaciones interactivas a partir de bases de datos.
¿Cuál es la importancia de visualizar de manera entendible datos como los del conflicto armado?
En general, es muy útil para la sociedad tener acceso a los datos de manera clara, comprensible y dinámica. En este sentido, las visualizaciones juegan un papel fundamental, pues permiten a los usuarios interactuar con la información, hacer consultas con distintos criterios, ver el panorama general y el particular, etc.; es decir, transforman los datos planos en información digerible. Y en una coyuntura tan especial como la que vive el país, es indispensable ayudar a la comprensión del contexto histórico del conflicto y a la construcción de memoria a partir del acceso a los datos relacionados con lo que vivimos.
¿Cuál es la conclusión que más le sorprendió de esta investigación?
Llama la atención cómo el conflicto se ha ensañado con ciertos municipios y regiones del país, disfrazado con sus múltiples máscaras: en forma de lucha guerrillera, paramilitarismo, bandas emergentes que se reorganizan y revictimizan, injusticias del Estado, etc. Medellín, por ejemplo, a pesar de ser una urbe, ha sido escenario de muchas historias de víctimización, por eso se encuentra en el ranking de nueve tipos de delitos victimizantes. Policarpa (Nariño) y Buenaventura (Valle del Cauca) -azotada, además por una corrupción rampante y agresiva- aparecen en cuatro de esos rankings.
¿Cómo se maneja la confiabilidad de los datos en ejercicios como este, teniendo en cuenta todas las falencias, vacíos y ambigüedades que puede tener una base de datos?
A las fuentes digitales hay que entrevistarlas, cuestionarlas y ponerlas a prueba, de la misma manera que se hace con las fuentes personales o documentales en toda investigación periodística. Por eso, en este, como en todos los ejercicios de periodismo de datos que realizamos en Colombiacheck, pasamos por tres pasos mínimos para verificar la confiabilidad de los datos:
1. Ponderamos la autoridad que tiene la fuente (persona o entidad) para manejar esos datos. ¿Tiene experiencia o es una improvisación?, ¿lo hace por un mandato legal, como parte de su misión organizacional o como un ejercicio esporádico?
2. Buscamos a un representante de la fuente de datos e indagamos a profundidad cómo es el manejo que les dan. ¿Cómo se construye la base de datos?, ¿qué periodo cubre?, ¿cómo se valida la información?, ¿quiénes intervienen?, ¿qué cambios ha habido en el proceso?, etc. En el caso del mapa de víctimas, por ejemplo, escribimos todo un apartado sobre este tema, pues encontramos que el registro se ha convertido a través de los años en un procedimiento muy sólido que da mucha más veracidad a los datos.
3. Antes del análisis de datos, durante el proceso de depuración, hacemos múltiples pruebas para encontrar errores, por ejemplo, en cantidad de municipios y departamentos, fechas, números de identificación, etc.