Redefiniendo Big Data: una propuesta desde la academia

El rápido crecimiento del número de usuarios en las redes sociales, tales como Facebook y Twitter, no solo logró democratizar la posibilidad de comentar y publicar información en la Web; sino que también provocó un aumento en la generación de datos estructurados como nunca antes. Este fenómeno, ampliamente estudiado por diferentes investigadores, trae consigo el desafío de crear una infraestructura tecnológica capaz de analizar dichos datos, considerando la velocidad de generación, la diversidad de formatos y el volumen de estos.

Esta situación dio origen al concepto de Big Data y este trabajo se enfoca en analizarlo y redefinirlo, recurriendo a la revisión de diferentes propuestas del significado del término. La metodología empleada fue la revisión bibliográfica de diferentes definiciones del concepto para extraer los elementos en común que permitiesen presentar una versión propia.

Un caso especial del Big Data corresponde a la aplicación en el ámbito de la educación. Nuestra intención no es limitarnos a describir aquellos proyectos enfocados en análisis de resultados académicos, ni referirnos a los análisis predictivos en cuanto a la persistencia estudiantil. En particular, los proyectos Big Data en el ámbito de la educación que queremos resaltar son aquellos posibles de ser catalogados como procesos de analítica del comportamiento de los estudiantes, especialmente dado el gran volumen de datos generados producto de la educación virtual.

Luego de analizar las distintas definiciones en torno a Big Data, la característica asociada al tamaño del conjunto de datos es uno de los puntos en tensión. En esta línea, el concepto de volumen (implícito en Big Data) se transforma en un campo de batalla ya que no existe unanimidad respecto a un valor a partir del cual se puede hablar de Big Data. también se vio que algunas de las definiciones se centraban en el volumen de los datos y otras en la infraestructura para procesarlos.

Finalmente, luego de todos los antecedentes analizados, es posible señalar que el concepto de Big Data es un término multivariable y difuso. Sin perjuicio de lo señalado, es posible afirmar que un proyecto Big Data deberá cumplir con tres premisas para ser catalogado como tal; cada una de ellas enlazada con la anterior.

  1. La velocidad con que se generan los datos es un factor que debe llamar la atención.
  2. Lo anterior está motivado por el volumen de datos que se generará en un corto periodo de tiempo.
  3. A partir de los dos puntos precedentes, la infraestructura tradicional no será suficiente para su correcto procesamiento.
    Con todo esto, Big Data debe ser entendido como el concepto que permite describir un conjunto de datos que, dada su velocidad de generación, logra alcanzar una magnitud tal que solo es posible de ser procesado vía el uso de la computación distribuida.

Palabras clave: Aplicaciones de Big Data – Análisis de Datos – Procesamiento de Datos comerciales – Arquitectura Informática – Computación Distribuida

Libro de actas del XI CUICIID 2021, Pagina 54.
ISBN 978-84-09-31464-5
Madrid 6, 7 y 8 de octubre

PDF (Texto Completo)

Deja un comentario

Este sitio utiliza Akismet para reducir el spam. Conoce cómo se procesan los datos de tus comentarios.