Es necesario comprender plenamente la “revolución” que va a significar Big Data y su convergencia con “pervasive & trusted computing” (computación ubicua y segura). Big Data refiere al sector de tecnologías de la información y la comunicación que manipulan grandes conjuntos de datos.

Las dificultades más habituales en estos casos se centran en la captura, el almacenado, búsqueda, análisis, y visualización de los datos. La tendencia a manipular ingentes cantidades de datos se debe a la necesidad en muchos casos de incluir datos relacionados, tal es el ejemplo de los análisis de negocio, los datos de enfermedades infecciosas, o la lucha contra el crimen organizado.

Las redes que surgen de las interacciones entre personas, sensores de todo tipo y organizaciones van dejando una trama de información que es un recurso clave para la ciencia, la producción y la sociedad. Es fundamental en esta dirección entender el futuro de esta nueva tendencia.

Nuevas oportunidades

Por otra parte, el crecimiento de esta rama o disciplina basada en la informática abre nuevas preguntas en materia de regulación y política, por ejemplo, aspectos legales, privacidad, etc. Al mismo tiempo, pone nuevos desafíos a la ciencia y a la tecnología relacionados con la infraestructura física y humana, y la explotación de esta convergencia (cloud computing, computación de alto rendimiento -HPC-, redes fijas, móviles e híbridas, machine learning, estadística avanzada, visualización, sistemas complejos). Pero fundamentalmente, ofrece nuevas e impensadas oportunidades en temas tales como salud pública, medicina personalizada, educación, ciencias “duras” y “blandas”, medios de comunicación, marketing y finanzas, entre muchos otros.

En lo que sigue se intentará aclarar un aspecto específico que resulta ser, a juicio del autor, el motivo principal de la disrupción que los grandes datos traen consigo. Más allá de los requerimientos de equipamientos, gestión de una impensada hasta hace poco cantidad y variedad de datos, nuevos y viejos problemas acerca de la procedencia, “limpieza” y reducción de los datos, la cuestión cualitativamente diferente que es necesario investigar es el proceso interactivo, que involucra como nunca antes a humanos y máquinas, y posibilita transformar datos en conocimiento. Este proceso se denomina inferencia, un término utilizado desde hace siglos pero que en la era de los grandes datos adquiere un significado muy particular. Será esta capacidad la que distinga la nueva era científico-tecnológica, en la cual toda clase de entidades, desde pequeñas y en algún sentido irrelevantes “cosas”, hasta seres humanos aportarán datos a una red que tendrá inteligencia para aprender y generar conocimiento genuinamente nuevo.

La relación hombres y máquinas

Un tema que será central en relación con estas redes podría denominarse sistemas complejos para la toma de decisiones en redes de hombres y máquinas. Los efectos de estos sistemas complejos son difíciles de sobreestimar, de hecho sistemas de este tipo están siendo aplicados en escenarios de guerra por las Fuerzas Armadas de Estados Unidos con resultados nefastos aunque impactantes. Más allá de esto, su potencial en otro tipo de escenarios, como catástrofes naturales, industrias de procesos y manufacturas, redes eléctricas y de distribución de energía en general parece realmente inmenso. Los sistemas de este tipo son esencialmente el resultado de la irrupción de los grandes datos en la disciplina de la toma de decisiones, una rama importante de la matemática aplicada llamada investigación de operaciones. Esta temática, si bien tiene áreas importantes que dependen de los avances de la ciencia de los datos, presenta especificidades muy importantes cuyo estudio trasciende el presente informe y que deberán ser estudiadas por separado.

Volviendo a nuestro tema de interés, es claro que resulta vital identificar y abordar, en términos de programas de investigación básica, aplicada y desarrollo tecnológico, las principales líneas y problemas que permitirán avanzar la frontera del conocimiento, a la vez que dominar y desarrollar los aspectos tecnológicos que posibilitarán la apropiación de los resultados prácticos de esta nueva disrupción. Enfrentar con éxito el desafío de los grandes datos requiere tener en mente, que nos encontramos frente a la “segunda ola” del desarrollo de una nueva revolución tecnológica, por lo cual no es esperable obtener soluciones simples o “llave en mano”, ni tampoco que las mismas provengan de una única disciplina; más bien, se pueden ofrecer caminos para avanzar en la comprensión del fenómeno y soluciones parciales para algunos de los desafíos.

Múltiples disciplinas

La investigación y el desarrollo necesarios para el análisis de grandes datos trasciende las fronteras de una única disciplina. Los expertos en computación, encargados de la construcción de sistemas de Big Data, deben desarrollar una profunda comprensión de los aspectos relacionados con la inferencia, en tanto los estadísticos deben tomar en cuenta la escalabilidad, los aspectos algorítmicos y los problemas relativos a la necesidad de toma de decisiones en tiempo real. Los matemáticos también tienen un rol importante que cumplir, puesto que áreas como álgebra lineal y optimización (que ya están contribuyendo al análisis de grandes datos) seguirán creciendo en importancia.

Por otra parte, como se ha mencionado el rol del juicio humano es esencial, de modo tal que la contribución de científicos sociales y psicólogos así como la de expertos en usabilidad y visualización serán de gran valor. Finalmente, los expertos en los diferentes dominios y los usuarios de la tecnología tienen un rol esencial que jugar en cualquier sistema para el análisis de datos. Esto es particularmente cierto en el terreno de los grandes datos a causa de la explosión de decisiones de diseño y las posibles direcciones que el análisis puede seguir.

Fuente: Hacia una nueva ola en la revolución de las tecnologías de la información y las comunicaciones / Gabriel Alfredo Baum ; con prólogo de Ruth Ladenheim. – 1a ed. – Buenos Aires : Ministerio de Ciencia, Tecnología e Innovación Productiva, 2015.