PERIODISMO DE BASE DE DATOS: VISUALIZAR LA MENTIRA VERSUS REVELAR LA VERDAD

Milagros Salazar, directora de Convoca, nos presenta su investigación sobre el papel de los datos en el periodismo, sus potencialidades y límites. Ensayo presentado en el Global Academic Journal Journalism 2017 Academic Track

 



Por Milagros Salazar
Fecha de publicación: 01 de febrero de 2018*

 


Resumen:

El periodismo está lleno de datos, pero no todo es periodismo de datos. Hay una diferencia entre utilizar datos y establecer una metodología en la investigación periodística que tenga, como aspecto fundamental, la organización, análisis y verificación de datos para encontrar una historia real.

 

Pero los datos sin un contexto y la generación de un conocimiento mayor no son suficientes en el periodismo. Es importante verificarlos y ponerles un rostro humano para encontrar una historia real para contarla a tu audiencia. Si los datos no son puestos a prueba frente a lo que sucede en el mundo real, existe el peligro de que nos muestren mentiras, en lugar de ayudarnos a contar la verdad.

 

Sin una metodología sólida construida con criterio ético, el uso de bases de datos en el periodismo puede llevar a ejercer un mal periodismo a gran escala. Por ello, en este artículo describo la tendencia en el uso de bases de datos y las metodologías en el periodismo de investigación, retos, aprendizajes y prácticas en América Latina. Este análisis incluye mi experiencia en Convoca, medio digital de periodismo de investigación y análisis de datos establecido en Lima, y entrevistas con periodistas de América Latina. Además, el artículo examina la presencia de proyectos periodísticos en la región en la lista de los nominados y ganadores del Data Journalism Awards, organizado por el Global Editors Network y Google, entre 2012 y 2017.

 


Créditos: Global Investigative Journalism Network

 

Las bases de datos pueden mentir más que las personas. Pero un reportero acucioso podrá detectar sus mentiras con la mejor arma que tiene el periodismo: la verificación de los datos más allá de la computadora.

 

“Sin la corroboración de los datos, no hay historia, no hay periodismo”, dice Paul Radu, periodista rumano y fundador de Organized Crime and Corruption Reporting Project (OCCRP), una plataforma dedicada al periodismo de investigación en Europa del Este, con una gran experiencia de trabajo con programadores y científicos de datos para contar historias transfronterizas.

 

“Los datos son disparadores de una historia y una historia hay que buscarla fuera de la base de datos. Yo busco hasta en los servicios funerarios”, cuenta Sandra Crucianelli, periodista argentina conocida por promover el uso de los datos en América Latina, para dejar entrever que se debe confrontar la información incluso entre los muertos.

 

El valor agregado que damos los periodistas a una base de datos está en aquello que hemos aprendido desde siempre: el contacto con la realidad, reportear en el lugar de los hechos y cruzar la información con diversas fuentes.

 

“Para capturar completamente el valor de los datos, nosotros debemos ser capaces de distinguir entre información cuestionable y de calidad, y ser capaces de encontrar historias reales en medio de todo el ruido. Los datos y la tecnología no deberían distraernos de nuestra misión por la exactitud”, explica la periodista costarricense Giannina Segnini, profesora de la Universidad de Columbia (Verification Handbook for investigative reporting, 2015).

 

A la vez el valor agregado que da una base de datos al trabajo periodístico es innegable: permite analizar abundante información de manera más efectiva para mirar todas las piezas de un rompecabezas.

 

“Nunca antes los periodistas tuvieron tanto acceso a la información. Más de 3 exabytes de datos – equivalente a 750 millones de DVDs – son creados cada día, y ese número se duplica cada 40 meses. La producción global de datos es estimado hoy en día en yottabytes (un yottabite es equivalente a 250 trillones de DVDs de datos)”, agrega Segnini.

 

Por eso, para los periodistas que investigan, el trabajo con bases de datos ha sido revolucionario. Ha empoderado a los reporteros para encontrar historias propias sin depender de las filtraciones. También ha permitido ser más contundente para revelar cómo opera un sistema, detectar patrones de corrupción e irregularidades, conexiones y casos únicos.

 

Este poder de los datos ha seducido a los periodistas de América Latina en los últimos años. Cada vez más como se puede ver en el número de proyectos periodísticos con bases de datos nominados en diversas categorías al premio más importante de esta especialidad, el Data Journalism Awards, organizado por el Global Editors Network (GEN) y Google.

 

Después de Estados Unidos y Europa, destacan los trabajos con bases de datos de América Latina. Entre 2012 y 2017, llegaron a la ronda final, 398 proyectos periodísticos de todo el mundo, de los cuales 42, es decir el 11 por ciento, correspondía a América Latina, por encima de Asia, Oceanía y África, según un registro de datos construido por mi colega de Convoca, Aramís Castro Ramos.

 

Y si revisamos qué proyectos periodísticos finalmente son premiados con este reconocimiento global, nuevamente América Latina aparece en el tercer lugar con ocho galardones, mientras que Asia y Oceanía desaparecen de la lista.

 

Fuente: Data Journalism Awards.

Elaboración: Aramís Castro/Convoca.

 

 

Fuente: Data Journalism Awards.

Elaboración: Aramís Castro/Convoca.

 

 

“En los últimos cuatro o dos años ha mejorado el trabajo con bases de datos en América Latina, sobre todo, hay más proyectos de utilidad para los lectores y no solo enfocado en la visualización de los datos y en la fascinación por el volumen de información”, asegura Paul Radu, miembro del jurado del Data Journalism Awards y periodista de OCCRP, en una entrevista realizada para este reporte.

 

Para Radu, una de las razones de este crecimiento es la cooperación entre los periodistas y los programadores. “Eso es importante porque es muy útil para un periodista investigativo unir esfuerzos con personas que trabajan con datos cada día como los científicos de datos que pueden aportar una mirada fresca y más específica”, agrega.

 

Sin embargo, la implementación de unidades de datos en las salas de redacción aún es insuficiente. Sandra Crucianelli asegura que los dueños de los medios de comunicación tienen miedo a invertir en trabajos con bases de datos porque buscan historias en el corto plazo y no están dispuestos a invertir recursos. En este panorama, hay importantes excepciones como el diario La Nación de Costa Rica y el Argentina, así como el equipo Estadão Datos en Brasil, pioneros en el uso de bases de datos en el continente

 

Además, existe un importante movimiento de medios digitales de periodismo de investigación y organizaciones creadas por periodistas que apuestan por trabajar con bases de datos. Entre ellos figuran La Silla Vacía y Consejo de Redacción en Colombia, Plaza Pública en Guatemala,  Agencia Pública en Brasil, Convoca y Ojo Público en Perú, entre otros.

 

Para profundizar en la evolución del periodismo de bases de datos en América Latina, entrevisté a periodistas de la región y elaboré una lista de aprendizajes y buenas prácticas a partir de los aportes de mis colegas y mi propia experiencia en Convoca,  medio digital que fundé hace casi tres años en Perú para investigar con bases de datos y el apoyo de la tecnología.

 

Aquí una especie de guía y algunos casos que, espero contribuyan, a este esfuerzo de no visualizar la mentira y ser cada vez más efectivos en revelar la verdad y llegar a las audiencias.

 

 

1. El trabajo con las bases de datos comienza con una palabra bíblica en el periodismo: cuestionar.

 

 

“La primera regla es cuestionar todo y a todos. No hay tal cosa como una fuente totalmente fiable cuando se trata de usar datos para hacer periodismo meticuloso”, asegura Giannina Segnini (Verification Handbook for investigative reporting, 2015).

 

Para ello, la periodista costarricense propone cinco puntos importantes que debemos tomar en cuenta para la verificación inicial en el trabajo con bases de datos:

 

    • Verificar si los datos están completos. Una buena manera de comenzar es explorando los valores extremos (altos y bajos). De lo contrario, podríamos llegar a una conclusión errada. 
    • Determinar si los registros de datos están duplicados para poder eliminarlos y tener un resultado correcto.
    • Verificar si los datos son exactos. Para ello Segnini recomienda “escoger un registro de la muestra y compararlo con la realidad”. Antes de seguir trabajando con la base de datos es necesario ponerla a prueba desde el inicio. 
    • Evaluar la integridad de los datos. Debido a que una base de datos pasa por diversas etapas de “almacenamiento, transmisión y proceso de registro” de la información, es importante realizar pruebas de integridad. Es decir, revisar si no fueron manipulados por personas o sistemas de información.
    • Descifrar las siglas y los códigos que fueron usados para clasificar los datos para que podamos describir la importancia de esta información y encontrar historias relevantes.

2. Entrevistar a las bases de datos y luego confrontarlas.

 

Así como un reportero debe preparase para entrevistar a una fuente humana, es indispensable saber interrogar a los datos. Existen muchas herramientas y programas informáticos para organizar los datos y obtener importantes hallazgos (Excel, Access, Tableu, SQL, etc). Sin embargo, lo más importante, como sucede en cualquier tema que queremos investigar es ambicionar conocer a la base de datos más que a nadie y  empezar a usar las herramientas según la necesidad de cada proyecto. No hay mejor forma de aprender algo que encontrando su utilidad y aplicándolo sobre la marcha.

 

“Solo si invierte una buena cantidad de horas comprendiendo la estructura de una base de datos será posible entrevistarla adecuadamente y extraer las conclusiones significativas y jugosas que se convertirán en los pilares de un proyecto exitoso”, apunta Hassel Fallas, editora de la Unidad de Inteligencia de Datos del diario La Nación de Costa Rica, que fue entrevistada para ese artículo.

 

Además de entender la estructura de la base de datos, se debe conocer el contexto del tema que se está investigando para detectar las inconsistencias de la base de datos, errores de digitación en las cifras, nombres repetidos o cualquier otra anomalía que nos conduzca a una conclusión equivocada.

 

Una vez que logremos obtener los hallazgos preliminares que arroja la base de datos, debemos confrontar la información con la realidad, ir a la calle y hablar con los protagonistas de los datos. Este paso puede hacer una gran diferencia en la investigación como veremos en los siguientes casos.

 

En febrero de 2011, el diario La Nación de Costa Rica, con Giannina Segnini a la cabeza, se propuso investigar el sistema de otorgamiento de becas de Avancemos, un programa de subsidios para promover que más de 167 mil jóvenes continúen sus estudios. Como punto de partida, el equipo accedió a la base de datos de los beneficiarios, la completó con los nombres de sus padres y las cruzó con la información de los bienes e ingresos de estas familias. En un primer cruce, se determinó que había decenas de becarios con salarios que podían llegar a los 9 mil dólares y que además tenían propiedades y vehículos inscritos a su nombre.

 

Pero la historia cambió cuando los periodistas entrevistaron a estas familias: estos jóvenes tenían padres con recursos económicos pero habían sido abandonados.  

 

Para llegar a esa historia, los reporteros tuvieron que confrontar el análisis que arrojó la base de datos en la computadora con las personas protagonistas de la historia. De esta manera, pudieron acercarse a contar lo que realmente estaba sucediendo, dar contexto, encontrar una explicación y no solo arrojar una cifra.

 

Dos años más tarde, el equipo liderado por Hassel Fallas investigó la deserción estudiantil en colegios estatales a nivel de educación secundaria. Luego de revisar la base de datos, con la información de 643 colegios, destacó un caso que estaba en los extremos del ranking: la fuga de alumnos pasó de 68% de la matrícula en 2011 a 14% en 2014. Se había logrado reducir en 53 puntos. Hassel Fallas narra en su blog La Data Cuenta que buscó al director de ese centro educativo para contrastar las cifras, revisó los documentos y confirmó que se trataba de una mala digitación de la cifra.

 

En otro colegio, de 445 estudiantes que dejaron las clases en 2012, al año siguiente la cifra se redujo a cero. Claramente había un error que luego fue confirmado por el Ministerio de Educación Pública de Costa Rica.

 

En una entrevista realizada a Hassel Fallas para este trabajo académico, ella aseguró que “antes, durante y después del análisis de una base de datos necesitamos salir a la calle a reportear sobre cómo es la vida de las personas afectadas por los fenómenos que descubrimos en los datos y también para validar esa data con fuentes que nos ayuden a entender mejor lo que nos dice y por qué”.

 

Como ven, el ciclo del trabajo con los datos termina donde todo periodista debe llegar: la calle.

 

 

3. Nos toca construir las bases de datos que no existen y revelar lo oculto.

 

La mayoría de bases de datos que necesitan los periodistas de investigación en América Latina para contar historias de gran relevancia pública no existen. Nos ha tocado crearlas muchas veces a partir de documentos, del papel.

 

Para extraer los datos de manera automatizada de estos documentos se puede usar un programa de Reconocimiento Óptico de Caracteres (OCR por sus siglas en inglés) solo si el formato lo permite. Y en otros casos,  la mayoría de veces, tocará construirlas manualmente debido a que los documentos casi siempre son entregados en los pedidos de información al Estado en formatos no accesibles.

 

Hassel Fallas hace una lista de los obstáculos que deben atravesar los periodistas para acceder a los datos:

 

    • Datos en formato PDF o Word.
    • Imágenes de datos en PDF.
    • Hojas de cálculo bloqueadas con clave de acceso.
    • Datos en formatos de programas que requieren licencia.
    • Datos sin estructura.
    • Datos incompletos.
    • Negativa de las autoridades a suministrarnos bases de datos completas. En varios casos solo nos ofrecen hacer cruces específicos, lo que impide ver el conjunto de los datos.
    • Negativa para suministrar la base de datos cuando están disponibles en un buscador en línea. Esto nos lleva a los periodistas a crear un método de extracción automatizada para sistematizarlos en una base de datos con la ayuda de los ingenieros de sistemas a pesar que el Estado cuenta con la información.

 

En Convoca, el medio digital de periodismo de investigación y análisis de datos que dirijo desde Lima, nos tocó ingresar manualmente a una hoja de cálculo cientos de datos de las declaraciones juradas de bienes, ingresos y rentas de los 130 congresistas del Perú.

 

Después de más de dos años de reiterados pedidos de información a la Contraloría General de la República, obtuvimos los documentos pero en formato JPG  (imagen), lo cual hacía imposible pasar los archivos por un programa OCR.

 

Con la información, decidimos construir una base de datos con un equipo integrado por periodistas con experiencia y jóvenes estudiantes de universidades a quienes capacitamos en el uso de estas herramientas y el proceso de trabajo con base de datos.

 

Tempranamente logramos descubrir que en las declaraciones juradas había información parcial, dudosa y no corroborada por los órganos de fiscalización.  Si la información era dudosa, ¿por qué construir una base de datos con estos papeles? Porque eran documentos oficiales considerados por las autoridades como una herramienta eficaz para enfrentar la corrupción y el lavado de activos. Por lo tanto, era de alto interés público conocer y evidenciar la mentira.

 

La construcción de la base de datos y el proceso de verificación nos permitió identificar los patrones del error, omisiones, datos falsos e inconsistencias que aparecían en las declaraciones juradas de los políticos.

 

Para ello fue indispensable cruzar la información con registros públicos de bienes y empresas, visitar las propiedades y acceder a otras fuentes de información.

 

Una de las historias que publicamos en las elecciones de 2016 en Perú como parte de esta serie investigativa a la que llamamos Patrimonio S.A. (ver el proyecto: http://www.convoca.pe/especiales/patrimonio-sa/) , fue la del entonces legislador Joaquín Ramírez, exsecretario general y financista del partido Fuerza Popular de Keiko Fujimori, quien lideraba las encuestas en esos comicios electorales.

 

Como parte del proceso de verificación de las declaraciones juradas pudimos demostrar que Ramírez, ocultó, corrigió y aumentó el número de propiedades a su nombre y a través de sus empresas.

 

Ramírez corrigió los montos del rubro bienes de todas las declaraciones juradas que entregó a Oficialía Mayor del Congreso desde que se convirtió en legislador en 2011. Además que hubo un incremento de compras millonarias de bienes a través de sus empresas cuando empezó a ejercer la función parlamentaria.  Las adquisiciones se concentraron en 2012, precisamente cuando el legislador ocultó en su declaración jurada de ese año propiedades que nunca dejaron de ser suyas (Ver reportaje: http://convoca.pe/investigaciones/el-patrimonio-disfrazado-del-financist...).

 

En este caso era importante evidenciar mediante los reportajes las mentiras consignadas por los congresistas en los documentos y poner la información al alcance de los ciudadanos mediante una aplicación de noticias por un ejercicio de transparencia efectiva y contribución a la fiscalización pública. No solo para conocer más sobre los políticos sino las mentiras de estos documentos públicos que, se supone, debían contribuir a prevenir la corrupción en el Estado. Ver Newsapp: http://www.convoca.pe/especiales/patrimonio-sa/rastreadorpolitico).

 

 

4. Mirar siempre más profundo: cruzar las bases de datos y hacernos preguntas poderosas para generar impacto.

 

¿A qué profundidad quieres llegar con una historia? Esa es una pregunta fundamental que debemos hacernos los periodistas a la hora de iniciar un proyecto de investigación con bases de datos.

 

“A menudo, una sola base de datos no incluye todas las variables que necesitamos, entonces las unimos con otras para ampliar el contexto”, asegura Hassel Fallas.

 

El cruce de bases de datos permite al reportero generar series investigativas potentes con rigor, precisión y efectividad en la búsqueda de información para generar conocimiento.

 

A mediados de 2014, Convoca empezó a construir una base de datos para medir el grado de cumplimiento de las normas ambientales de la gran minería y la industria petrolera en Perú debido a que el mayor número de conflictos sociales se generan en el país por la ejecución de estos proyectos.

 

El tema tenía una gran relevancia pública. La gran pregunta era: ¿qué queremos contar? Giannina Segnini, quien es miembro del comité de asesores de Convoca, nos ayudó a aterrizar la hipótesis: las empresas reinciden una y otras vez en las mismas infracciones porque prefieren que les impongan multas antes que invertir en mejorar sus procesos productivos para no dañar el medio ambiente y la salud de los pobladores que viven alrededor de los proyectos mineros. Incluso, estas compañías prefieren pagar a estudios de abogados para congelar el pago de las multas en el Poder Judicial.

 

Narrar esa historia resultaba más potente que solo contar el número de multas e infracciones que tenía cada empresa y conocer quiénes eran las más infractoras.

 

Para el proyecto tuvimos que crear otras bases de datos con información de miles de documentos y otras fuentes. Por ejemplo, determinar cuántos millones de dólares perdonó en multas el gobierno de Ollanta Humala a las empresas mineras y petroleras infractoras mediante la aprobación del artículo 19 de la ley 30230 que fue aprobada en julio de 2014 en medio de conflictos de intereses. El trabajo con bases de datos, cruces de información y reporteo, nos permitió determinar que se perdonaron más de 17 millones de dólares en multas en los ocho primeros meses de aplicación de la ley a pesar que los inspectores del Estado recogieron las evidencias de las infracciones.

 

Otras bases de datos que construimos nos permitieron detectar las relaciones comerciales y políticas de estas compañías para determinar la capacidad de influencia de estos grupos empresariales en el poder político. Otras hojas de cálculo construidas con la información de cientos de documentos nos ayudaron a determinar que se encarpetaron más de mil informes de supervisión ambiental en el sector hidrocaburos de compañías vinculadas a casos de corrupción y de gran influencia política.

 

Este proyecto al que llamamos ‘Excesos sin Castigo’ ganó el Data Journalism Awards 2016 en la categoría NewsApp, otorgado por el Global Editors Network (GEN), y fue finalista en la categoría Innovación del Premio Iberoamericano Gabriel García Márquez.

 

Pero el mayor impacto fue la derogatoria del artículo de la ley que perdonaba las multas. Después de dos años de publicar reportajes sobre el tema de manera permanente, el Congreso dejó sin efecto esta especie de amnistía ambiental.

 

Para esta investigación cruzamos 14 bases de datos que construimos a partir de miles de documentos obtenidos mediante más de 100 pedidos de información al Estado peruano y otras fuentes.  El registro de datos que construimos se convirtió en una fuente de información fundamental para publicar un reportaje tras otro hasta lograr un impacto público.

 

Un efecto similar ocurrió con la serie investigativa ‘Pesca negra’ que publiqué en IDL-Reporteros entre 2011 y 2013, que demostró el subreporte masivo y millonario de pesca de anchoveta en el mar peruano, la segunda nación pesquera más importante después de China.

 

La falta de control estatal permitió que, en poco más de dos años, 630 mil toneladas de anchoveta, valorizadas en unos 200 millones de dólares, desaparecieran de toda fiscalización estatal.

 

Para esta investigación, se procesó más de 200 mil documentos de desembarques de pescado que fueron vinculados a una gran base de datos mediante un algoritmo. Una parte de la base de datos tuvo que ser construida ingresando dato por dato.  

 

En una primera etapa el trabajo se realizó con la participación del ingeniero de sistemas Miguel López y luego se amplió la investigación con un trabajo colaborativo con el Consorcio Internacional de Periodistas de Investigación (ICIJ, por sus siglas en inglés).

 

Tras dos años de publicaciones permanentes, esta serie de reportajes permitió que se generara una reforma en el sector pesquero en el Perú. Era la primera vez que se realizaba en este país una investigación con datos masivos sobre el sector pesquero (Ver el proyecto: https://idl-reporteros.pe/como-se-esfuman-100-millones-en-pescado/).

 

La investigación con bases de datos permite narrar en varias entregas una gran historia, darle seguimiento al tema y contribuir a generar cambios.

 

 

5. Sigue los datos más allá de las fronteras.

 

Los delitos de corrupción, el crimen organizado y el lavado de dinero no conocen fronteras. La investigación periodística con bases de datos nos permite recorrer diversos países para seguir la pista del dinero y de los delitos con un trabajo colaborativo. El Internet y la tecnología hoy hacen posible la existencia de salas de redacción globales como la que lideró el Consorcio Internacional de Periodistas de Investigación (ICIJ, por sus siglas en inglés) con el proyecto global Panama Papers.

 

Esta investigación se convirtió en un referente poderoso para promover el trabajo colaborativo porque involucró a cerca de 400 periodistas en el mundo con un gran impacto público.

 

Los reportajes se desarrollaron principalmente a partir de la búsqueda de información en más de 11 millones de documentos de la firma de abogados panameña Mossack Fonseca para revelar prácticas financieras opacas, casos de evasión, elusión fiscal y lavado de dinero mediante la creación de empresas offshore en paraísos fiscales.

 

Aunque la fuente principal de la información no era una base de datos estructurada, varios equipos de periodistas construyeron sus propias hojas de cálculo para cruzarlas con otras bases de datos en cada país y encontrar buenas historias.

 

En América Latina, cuatro equipos de periodistas de igual número de medios narraron para ABC Datos, publicación de Convoca que reúne métodos y experiencias del trabajo con datos en el continente, que desarrollaron sus investigaciones con la ayuda de programadores en sus equipos. Entre ellos, los periodistas de La Nación de Argentina, uno de los medios pioneros en el uso de datos en la región (Ver publicación: http://abcdatos.convoca.pe/).

 

“Nosotros hacíamos un trabajo manual (de registrar los nombres de todos los personajes argentinos) mientras el ingeniero intentaba cruzar nuestras bases de datos con los nuevos hallazgos que obteníamos en Panama Papers”, explicó Iván Ruiz (ABCDatos, 2015).

 

Ruiz considera fundamental la experiencia previa que adquirió su equipo en los proyectos Swiss Leaks, Offshore Leaks y Luxemburgo Leaks de ICIJ, para encontrar historias relevantes para Argentina.

 

Siguiendo el modelo de ICIJ, Convoca impulsa el proyecto colaborativo ‘Investiga Lava Jato’ junto a periodistas de Folha de Sao Paulo, para desarrollar reportajes y elaborar bases de datos sobre el megacaso de corrupción que involucra a las empresas brasileñas y altas autoridades en una red de pago de coimas y lava de dinero. Para desarrollar la investigación convocamos a más de 20 colegas de medios de América Latina y África.

 

Entre los aliados figuran el diario Perfil de Argentina, el portal de investigación Mil Hojas de Ecuador, El Faro de El Salvador, Plaza Pública de Guatemala, la organización Mexicanos contra la Corrupción y la Impunidad, Colombiacheck, la Iniciativa Regional para el Periodismo de Investigación en las Américas de ICFJ/Connectas, los portales Runrunes y El Pitazo de Venezuela y del Jornal Verdade de Monzambique.

 

Investigar la red de corrupción de las constructoras brasileñas requiere un trabajo transfronterizo, colaborativo, persistente y eficaz en términos de la evidencia y el tiempo. Por ello, unimos esfuerzos para desarrollar y publicar reportajes, compartir información relevante sobre nuestros países donde Odebrecht confesó que pagó cerca de 800 millones de dólares en coimas, aprender del proceso de investigación con metodología y perseverancia así como echar luces sobre los patrones de la corrupción, lo que se mantiene oculto o se cuenta a medias en la esfera pública.

 

Nuestra primera investigación conjunta se publicó en junio de 2017. La serie de reportajes reveló que en siete países donde la compañía brasileña Odebrecht pagó sobornos a funcionarios e intermediarios, 50 obras que ejecutó la empresa bajo diversas modalidades de contrato, de inversión y concesiones, tuvieron costos adicionales por más de 6 mil millones de dólares en relación a los valores iniciales entre 2001 y 2016. Este primer hallazgo fue posible con la construcción colaborativa de una base de datos de las obras a partir de los contratos, documentos policiales, documentos de justicia, otras bases de datos y fuentes diversas.

 

El análisis de los datos nos llevó a reportear y a llegar a otros hallazgos. La mayoría de los incrementos de presupuesto fueron por extensiones de plazos, obras adicionales y alteraciones de ingeniería, que en varios casos se encuentran bajo investigación por la justicia. Estas operaciones extras no pasaron por concursos públicos y se mantuvieron en manos de la constructora brasileña y sus socias mediante reiteradas modificaciones a los contratos o normas especiales que se saltaron las leyes de contrataciones.

 

De este número de obras con saltos presupuestales en Perú, Panamá, República Dominicana, Ecuador, México, Colombia y Mozambique, 31 se encuentran investigadas por el Ministerio Público o la Contraloría de estos países. Es decir, el 61 por ciento del número total. Mientras que siete de estas obras, el 23 por ciento, aparece en las planillas de la División de Operaciones Estructuradas de Odebrecht conocida como la “Oficina de Sobornos”, de acuerdo al análisis de más de 8 mil documentos realizado por los periodistas de ‘Investiga Lava Jato’ hasta el 15 de junio.

 

La revisión de los documentos de la justicia brasileña también nos permitió conocer otras historias inéditas de pagos de sobornos en México, Venezuela, Argentina, Perú y Mozambique, así como el financiamiento de campañas electorales en El Salvador.

 

Cada periodista puso al servicio del proyecto su talento y profesionalismo. Algunos miembros se enfocaron en la construcción de la base de datos con la asesoría del equipo de Convoca y la colaboración de Colombiacheck, mientras que otros periodistas contribuyeron con el acceso a documentos y a las fuentes humanas.

 

Además, la publicación simultánea de las historias en un proyecto de esta dimensión protege los hallazgos de los reporteros ante las presiones. O lo que la periodista Sandra Crucianelli señala como la existencia de “un aparato propagantístico para ocultar” y mantener la impunidad en América Latina frente a la corrupción.

 

Trabajar de manera colaborativa requiere desarrollar una dinámica de trabajo horizontal y poner al servicio del proyecto lo mejor que cada uno sabe hacer. El resultado: historias reveladoras.

 

6. Trabajar la metodología con rigor y ser transparentes con nuestras decisiones.

 

Bucear en las bases de datos, organizarlas, limpiarlas, interpretarlas y confrontarlas forma parte de un método que construye el reportero para llegar a determinados hallazgos periodísticos. Este proceso debe realizarse con rigor y conocimiento sobre la realidad para contar historias reales.

 

La periodista colombiana y editora de la Unidad de Datos del diario El Tiempo, Ginna Morelo, señala que en la metodología que construimos los periodistas es esencial la reportería, tiene como propósito “estandarizar datos” para descifrar por qué ocurren ciertos fenómenos y hechos de relevancia pública.

 

“El periodismo siempre −desde sus orígenes− ha buscado datos. Antes el problema era dónde hallarlos; hoy el asunto pasa por estandarizar tantos e interpretarlos y eso cobra una importancia tremenda porque nos permite llegar a patrones más complejos sobre por qué y para qué ocurren los hechos”, señala.

 

Un caso que ejemplifica la importancia de la metodología es la investigación transfronteriza ‘Niñas Madres’, una radiografía de las causas y consecuencias del embarazo adolescente en cinco países de América Latina que revela una de las caras de la desigualdad en el continente. En este proyecto participaron los periodistas de Convoca de Perú, Nómada y Plaza Pública de Guatemala y periodistas de Ecuador y Bolivia, con la coordinación de Consejo de Redacción de Colombia y Deutsche Welle Akademie de Alemania.

 

En ‘Niñas Madres’ estuve a cargo de la edición de los reportajes de Perú y Colombia y participé en el debate con los editores y analistas de datos sobre los criterios que debíamos tomar en cuenta al momento de interpretar las bases de datos públicas y cruzar la información.  

 

Una de las dificultades del trabajo con los datos era que en la mayoría de los países donde nos propusimos investigar el problema, la información estaba incompleta (los casos de Bolivia y Ecuador eran los más alarmantes) o los datos públicos se fundamentaban en proyecciones estadísticas.

 

Ante este desafío, revisamos detalladamente la metodología de las bases de datos en cada país y entrevistamos a expertos que nos pudieran orientar a tomar decisiones sobre qué información podía ser confiable para retratar la realidad. Otra decisión que tomamos fue evidenciar en los reportajes las inconsistencias y debilidades de los datos públicos y cómo este problema afectaba el diseño de una política estatal para prevenir el embarazo adolescente.

 

Por ejemplo, entre 2012 y setiembre de 2016, se registraron en Perú 10 casos de suicidio de adolescentes embarazadas entre 12 y 17 años de edad, y 18 en menores de 20 años, según la Dirección General de Epidemiología del Ministerio de Salud. Pero los datos oficiales no presentaban la dimensión del problema porque había un alto subreporte de información en indicadores asociados al embarazo adolescente.

 

Tampoco existía un registro oficial de casos de mortalidad neonatal en adolescentes embarazadas por departamentos. La plantilla empleada para recopilar y analizar estos datos por la Dirección General de Epidemiología del Minsa en Perú no incluía información sobre la edad de la madre, solo el lugar de residencia. Uno de los temores de las autoridades era revelar las posibles prácticas de aborto.

 

El trabajo con bases de datos nos exige a los periodistas ser transparentes con nuestros métodos y decisiones, así como evidenciar las inconsistencias de los datos públicos. Por ello es muy importante explicar de manera clara y didáctica el proceso de trabajo con las bases de datos para que los lectores puedan sacar sus propias conclusiones.

 

Todo proyecto investigativo con bases de datos debe explicar paso a paso el proceso del trabajo. Esa es una de las mayores lecciones que hemos aprendido los reporteros de este continente como vemos en la investigación ‘Decida por su cantón’ que realizó el diario La Nación de Costa Rica sobre las elecciones municipales de febrero de 2016 en ese país.

 

El diario costarricense investigó a los 605 candidatos que postulaban para ocupar 81 alcaldías. Construyó una base de datos con sus antecedentes judiciales, sanciones administrativas, deudas con la seguridad social e información sobre su hoja de vida.

 

Miles de datos se sistematizaron y estructuraron en seis bases de datos para ser analizadas y luego contar las historias y publicar la aplicación web.

 

Este fue el proceso:

 

 

Para la investigación ‘Excesos sin Castigo’ de Convoca sobre el comportamiento ambiental de las industrias extractivas en Perú que con describimos en las primeras páginas de ese trabajo académico, también se hizo una infografía para explicar cómo se procesó los miles de documentos obtenidos mediante más de 100 solicitudes de información. Contar este proceso fue fundamental para desmentir al entonces Ministro del Ambiente, Manuel Pulgar Vidal, que intentó desacreditar la investigación porque cuestionaba la aprobación del artículo 19 de la ley 30230 que perdonaba millonarias multas a pesar de las graves infracciones ambientales cometidas.

 

La transparencia derrumba la mentira de los poderosos. Pero además, como asegura la periodista costarricense Giannia Segnini, los periodistas también debemos ser transparentes con nuestros métodos en la misma medida que exigimos lo mismo a las autoridades.

 

 

 

 

7. Explorar diversos formatos para publicar los hallazgos e involucrar a la audiencia 

 

Usualmente cuando pensamos en publicar hallazgos periodísticos basados en bases de datos, pensamos en mapas, buscadores, rankings, tortas, entre otros gráficos. En la jerga del periodismo de datos le decimos “visualizar los datos”.

 

Sin embargo, hoy es posible publicar estos hallazgos en diversos formatos. En Convoca, hemos experimentado no solo con las News App (o aplicaciones de noticias) sino con podcasts para hacer un balance de las promesas del presidente Pedro Pablo Kuczynski (http://promesasppk.convoca.pe/), cómics para retratar los años de violencia que vivió el Perú en los años 80 y 90 (http://convoca.pe/agenda-propia/episodios-de-la-historia-del-terror-senderista-en-comic) y hasta un videojuego para retratar el impacto social y económico de la evasión y elusión fiscal (Ver: http://ilusionfiscal.convoca.pe/eljuego/).

 

“El formato es uno: contar creativamente una buena historia. Una historia es una vida o varias de ellas. Cuando el número tiene cara, cuenta una vida, engancha a las audiencias. Al final de cuentas es periodismo, es decir historias”, asegura la periodista colombiana Ginna Morelo.

 

Ginna Morelo y la periodista mexicana, Lilia Saúl, ganaron el Premio Ortega y Gasset de Periodismo con un especial multimedia sobre los desaparecidos en Colombia y México. Las periodistas apelaron a los gráficos interactivos, ilustraciones, vídeos y crónicas para retratar el dolor de los familiares de las víctimas y llegar de manera efectiva a las audiencias (Ver: http://www.eltiempo.com/multimedia/especiales/desaparecidos-duelo-eterno/16382245/1/)

 

Otro aspecto importante es involucrar a la comunidad de lectores en el proceso de los proyectos como lo hizo el equipo de La Nación Data de Argentina con el proyecto “Dos años de análisis de las escuchas de Nisman”.  (http://blogs.lanacion.com.ar/data/argentina/el-detras-de-escena-de-la-investigacion-y-clasificacion-de-las-40-000-escuchas-de-nisman/)

 

Luego de la sospechosa muerte del fiscal argentino Alberto Nisman, el equipo de La Nación Data, junto con voluntarios y estudiantes universitarios, inició un largo proceso investigación que abarcó la clasificación de 40.000 escuchas, como describe la Fundación Nuevo Periodismo Iberoamericano (FNPI). Este proyecto fue finalista en la categoría innovación del Premio Iberoamericano Gabriel García Márquez.

 

El análisis de las escuchas implicó subir audios en VozData, una plataforma colaborativa desarrollada por La Nación con apoyo de Knight Mozilla Open News y Civicus Alliance, para que los ciudadanos pudieran ayudar a clasificar la información en base a categoría establecidas que luego era verificada por el equipo de periodistas para que finalmente los ciudadanos pudieran descargar los datos disponibles.

 

Para el periodista argentino, Gastón Roitberg, del diario La Nación de Argentina, el periodismo con bases de datos abre una gran posibilidad de innovar. Y en ese camino de la creatividad y el rigor periodístico andan varios medios y periodistas de América Latina.

 

Puedes leer la versión en inglés aquí

 

 

Referencias:

 

Convoca. ABCDatos. 2016: http://abcdatos.convoca.pe/

Convoca. ABCDatos. 2016.‘Lecciones de Panama Papers en Latinoamérica’.http://abcdatos.convoca.pe/edicion/5/lecciones-de-panama-papers-en-latin...

Convoca. Excesos sin Castigo. 2016 http://excesosincastigo.convoca.pe/

Convoca. Patrimonio SA.

2016.http://www.convoca.pe/especiales/patrim

onio-sa/

Crucianelli, Sandra. Entrevista para este reporte, 2017.

Fallas, Hassel. Entrevista para este reporte, 2017.

Fallas, Hassel. La Data Cuenta. http://hasselfallas.com/

Knigt Center for Journalism in the Americas.2017.

https://knightcenter.utexas.edu/es/blog/00-18479-periodistas-de-11-paise...

Segnini, Giannina. Verification Handbook for investigative reporting, 2015. http://verificationhandbook.com/book2/chapter5.php

Investiga Lava Jato. 2017: http://investigalavajato.convoca.pe/

Morelo, Ginna. Entrevista para este reporte, 2017.

Poderomedia. Manual de Periodismo de Datos Iberoamericano. 2014. http://manual.periodismodedatos.org/milagros-salazar.php

Radu, Paul. Entrevista para este reporte, 2017

Roitberg, Gastón. Entrevista para este reporte, 2017.

*Este paper también ha sido publicado por el Global Investigative Journalism Network y fue seleccionado para ser presentado en la Conferencia Global de Periodismo de Investigación en Johannesburgo en noviembre de 2017.