Big Data es el concepto que describe todos los esfuerzos para capturar, almacenar, gestionar y analizar información [1,5]. El término no sólo hace referencia a grandes volúmenes de datos sino también a la alta velocidad a la cual los datos son capturados y cuya gran variedad [1] no permite una integración inmediata [2]. Además, el propósito de su análisis es descubrir conocimiento e identificar valor relevante en un contexto incierto por lo que la veracidad, es decir, la precisión y la consistencia, de los datos no está asegurada [4]. Big Data hace referencia entonces a datos secundarios, en el sentido de que ellos no están relacionados normalmente a algún objetivo de investigación, como por ejemplo, los datos obtenidos de procesos administrativos [5]. En otras palabras, este tipo de datos se encuentran, no se generan de acuerdo a un objetivo de investigación bien definido [6], sin instrumentos o métodos diseñados para obtenerlos de manera fiable para su uso científico [5]. Entonces Big Data se puede entender como un proceso.
El proceso completo de Big Data se presenta en la Ilustración 1. Se comienza por la captura de los datos a partir de varias fuentes de gran variedad y de diferente flujo, se continúa con los pasos de extracción, transformación y carga de información relevante, para luego iniciar la etapa de análisis, que comprende el filtrado y el muestreo de datos con el fin de procesarlos computacionalmente y visualmente [5].
Ilustración 1. El proceso de Big Data.
Múltiples tecnologías, algoritmos, métodos y modelos son usados en Big Data con el fin de entender relaciones entre variables y explorar sobre los datos [3]. Las técnicas más desarrolladas son aquellas basadas en aprendizaje, como Machine Learning, Deep Learning, Data stream learning, etc. Con aprendizaje nos referimos a la capacidad que tienen los algoritmos computacionales para mejorar automáticamente a través de la experiencia [7]. La experiencia está incrustada en los datos por lo cual todo algoritmo deberá extraer las características de operación que están codificadas en dicha experiencia. Claramente es una definición abstracta y requiere de un contexto bien definido para ser operacionalizada.
¿Quiénes hacen Big Data?
Los actores, y su interacción, requeridos para llevar a cabo el proceso de Big Data se muestran en la Ilustración 2. La parte tecnológica y computacional está a cargo de ingenieros y arquitectos informáticos y matemáticos y estadístas. La parte de análisis incorpora expertos de la materia guiados por un equipo de investigación los cuales, todos, permitirán dar sentido a los datos y a los resultados del proceso de Big Data [5].
Ilustración 2. Actores y su interacción en Big Data.
¿Por qué Big Data?
Por una nueva relación con la naturaleza. Big Data ha impactado notablemente en la investigación basada en datos en donde la eficiencia energética domina el área de interés de su uso seguido de agricultura inteligente, evaluación de desastres naturales, ciudades inteligentes y sostenibilidad [12].
Por una nueva economía. La economía centrada en los datos favorece la creación, captura y análisis de datos, como forma de mejorar la productividad y de incrementar los ingresos [10]. En efecto, la incorporación de Big Data en las empresas emerge como frente de innovación y competitividad a los retos y oportunidades que nacen de la revolución de la información [9].
Por una nueva forma de gobernanza. El uso de Big Data en el sector público puede ayudar a los gobiernos a mejorar el diseño de políticas y la prestación de servicios. La disponibilidad y el cruce de información gubernamental es esencial para entender y descubrir patrones de manera profunda y acertada. Además, el involucramiento de los principales actores dentro y fuera del gobierno es un importante factor para asegurar el acceso a información relevante y actualizada [1, 11].
Más allá de Big Data
Aunque la economía centrada en datos crea un lazo de retroalimentación operativa y estratégica, la acumulación por si sola de los datos no permitiría un crecimiento sostenido; esta economía requiere de innovación y de desarrollo tecnológico más avanzado [10].
Una posible corriente es la economía circular guiada por la Industria 4.0 que incluye a los sistemas ciber-físicos, Internet de las cosas (IoT), Cloud Computing y herramientas de computación cognitiva que van mucho más allá del Machine Learning que conocemos actualmente [9].
Luego, si bien el proceso de captura, almacenamiento y procesamiento de datos es lo más visible en Big Data, esto nos da una ilusión de que hemos llegado al estudio propio de toda la población [11]. Sin embargo, la exhaustividad en la captura de datos no es el objetivo de Big Data. Todo proyecto de Big Data se guía en un interés claro por parte de la organización o individuo que requiere solucionar, o al menos esclarecer, un problema dado.
A manera de conclusión, Big Data no es una simple tecnología ni es solo un concepto integrado de tecnologías. Big Data es un proceso económico, ambiental y tecnológico que permite a cualquier organización mejorar su impacto humano, ambiental y productivo tomando decisiones informadas acerca de sus procesos internos y de su influencia desde y hacia su contexto.
Referencias
[1] Tomar, L., Guicheney, W., Kyarisiima, H., Zimani, T., Roseth, B., & Acevedo, S. (2016). Big Data in the Public Sector. Inter_Amercian Developmnet Bank.
[2] Vijaylakshmi, S., & Priyadarshini, J. (2015). Big data analysis based on mathematical model: A comprehensive survey. J. Eng. Appl. Sci., 10(5), 2103-2107.
[3] Oussous, A., Benjelloun, F. Z., Lahcen, A. A., & Belfkih, S. (2018). Big Data technologies: A survey. Journal of King Saud University-Computer and Information Sciences, 30(4), 431-448.
[4] Emani, C. K., Cullot, N., & Nicolle, C. (2015). Understandable big data: a survey. Computer science review, 17, 70-81.
[5] Japec, L., Kreuter, F., Berg, M., Biemer, P., Decker, P., Lampe, C., … & Usher, A. (2015). Big data in survey research: AAPOR task force report. Public Opinion Quarterly, 79(4), 839-880.
[6] Taylor, S. (2013). “Real Scientists Make Their Own Data.” Sean J. Taylor Blog, January 25, 2020. Available at https://bit.ly/3cxJPqi.
[7] Mitchell, T. (1997). Machine Learning. New York: McGrawHill.
[8] Wamba, S. F., Akter, S., Trinchera, L., & De Bourmont, M. (2019). Turning information quality into firm performance in the big data economy. Management Decision.
[9] Tseng, M. L., Tan, R. R., Chiu, A. S., Chien, C. F., & Kuo, T. C. (2018). Circular economy meets industry 4.0: can big data drive industrial symbiosis? Resources, Conservation and Recycling, 131, 146-147.
[10] Farboodi, M., & Veldkamp, L. (2021). A Growth Model of the Data Economy (No. w28427). National Bureau of Economic Research. Mars 30, 2021. Available at https://bit.ly/3sOay7P.
[11] Amoore, L., & Piotukh, V. (2015). Life beyond big data: Governing with little analytics. Economy and Society, 44(3), 341-366.
[12] Hassani, H., Huang, X., & Silva, E. (2019). Big Data and climate change. Big Data and Cognitive Computing, 3(1), 12.
¿Quieres suscribirte a nuestro boletin mensual?
Si deseas recibir información de alto valor, puedes dejarnos tus datos y te enviaremos mensualmente nuestro boletín informativo con todas las noticias relacionadas a ciencia, economía, sociedad y tecnología.