Big data, comunicación, periodismo e investigación

Por: Ancízar Vargas León

Un grupo de ingenieros de Google construyeron un diseño computacional por medio del cual tenían la opción de determinar en qué parte del mundo aparecían brotes de enfermedades contagiosas y su probable expansión.


Lo impactante es que profesionales que no provenían de las ciencias de la salud, encontraron la manera de detectar epidemias y facilitar la información para que las autoridades respectivas pudieran tomar medidas a tiempo y salvar una gran cantidad de vidas humanas.

La primera acción de este tipo, evitó la posible pandemia conocida como H1N1. También, los ingenieros pudieron calcular la proyección de la gripa de invierno en Estados Unidos, incluyendo estados y regiones. Para ello se basaron en un modelo matemático que tomaba la cantidad de consultas en la red, hechas por personas que indagaban por los efectos del virus gripal.

A través de los Centros de Control y Prevención de Enfermedades – CDC – de Estados Unidos, mediante completos y prolongados métodos estadísticos de registro, los médicos estudian la evolución de enfermedades y proyectan soluciones para su prevención, detección temprana y soluciones masivas, empleando el concepto de salud pública, como se le conoce en Colombia. Los ingenieros lograron descubrir, detectar y aportar información más rápido que todos los métodos utilizados por los expertos en salud, a pesar de su riguroso y comprometido ejercicio.

¿Cómo lo hicieron?

La clave de esta nueva forma estuvo en las lógicas de consultas. Google, a finales de la década anterior, recibía más de tres mil millones de consultas en sus servidores al día, las cuales se archivaban en grandes repositorios de memoria digital.

Desde esta base, tomaron 50 millones de palabras clave utilizadas por los usuarios y efectuaron un comparativo con los registros de CDC, sobre la gripa de las estaciones, desde 2003 hasta 2008. El grupo de Google además, estableció una serie de correlaciones que incluyó, lugar, frecuencia en la búsqueda, tipo de consulta y otras variables pertinentes, con lo cual desarrollaron un programa con 450 millones de modelos para las pruebas de búsqueda, para ser comparados con los datos de CDC entre 2007 y 2008.

Luego de este ejercicio, los ingenieros encontraron los 45 términos más utilizados para las búsquedas relacionadas con la enfermedad respectiva. Para la detección de virus potenciales, CDC, siendo muy veloz, podría demorarse unos 15 días, tiempo en el cual cualquier brote podría convertirse en pandemias. Éstas, en la historia de la humanidad, han causado millones de muertos antes de que los expertos encuentren una cura.

En el caso del modelo matemático de información de la red, la proyección se puede detectar en mucho menos días, incluso en horas, con lo cual, los expertos de la salud pueden diagnosticar y presentar soluciones masivas en muy poco tiempo y salvar gran cantidad de vidas de los habitantes del planeta.

La conclusión de este impactante caso es que el modelo predictivo basado en el uso de tanta información acumulada pudo ponerse al servicio de la humanidad. Muchos ciudadanos del planeta siguen con vida y gozan de buena salud sin imaginar que un adecuado uso de la estadística por parte de unos profesionales anónimos, contribuyó a su bienestar. A la acumulación de esa inmensa cantidad de datos y su uso inteligente es a lo que los expertos hoy llaman big data, o “datos masivos”.

En 2013, Viktor Mayer y Kenneth Cukier publican el libro “Big Data: La revolución de los datos masivos” en el cual exponen el resultado de sus investigaciones. Allí se encuentra el caso de Google y también presentan otros, como el de la búsqueda de tiquetes de vuelo más económicos, el observatorio espacial y el genoma humano entre otros.

Luego de esta exposición puede deducirse que la cantidad de información que hay disponible en el mundo, además de ser gigante, tiende a crecer en una velocidad exponencial. Sin embargo, la mayor parte de la población no lo sabe. Profesiones como ingeniería, medicina, arquitectura y economía, química, física, entre otras, ya empezaron a utilizar big data para sus desarrollos, prospectiva y soluciones.

La inmensa utilidad del sistema de datos masivos también tiene sus alertas. Existe una buena cantidad de riesgos que van desde la entrega de datos personales a diferentes receptores y que serán utilizados sin tener conocimiento de su uso, hasta la vigilancia tecnológica de los individuos, empresas y organizaciones oficiales. Por este motivo, los asuntos éticos y de responsabilidad social deben estar al orden del día.

La pregunta ahora es: ¿los profesionales de la comunicación y el periodismo, cuándo y cómo empezarán a utilizar para sus investigaciones este recurso? La tecnología le permite a esta área del conocimiento realizar indagaciones con mayor calidad. Es el caso del periodismo digital, que además de pensar en el uso de los datos masivos como insumo para su producción, está en capacidad para llegar a públicos más amplios y a la vez específicos, diseñando estrategias eficientes y conscientes.

Ésta es la invitación para los estudiantes de la Facultad de Comunicación, Publicidad y Diseño de la Fundación Universitaria Luis Amigó, quienes con su iniciativa, sacaron adelante el periódico Sextante, que ya va en la versión XXXI y desde el segundo número se presentó en versión electrónica y en red, hasta llegar a este momento, con una nueva versión digital, que tiene las mejores expectativas.