Saltar la navegación

3. Big data y minería de datos

Introducción

En la imagen se ve un ordenador con el texto Big Data en el monitor rodeado de símbolo
Pixabay / geralt. Big data (Pixabay License)

Big data se refiere a los conjuntos de datos que son demasiado grandes y complejos para ser procesados y analizados de manera eficiente mediante técnicas de procesamiento de datos tradicionales. Este tipo de datos suele ser generado por empresas y organizaciones en una variedad de ámbitos. El análisis de big data puede ayudar a las empresas y organizaciones a obtener informaciones valiosas, por ejemplo, sobre sus operaciones y clientes.

La minería de datos es el proceso de analizar el big data para extraer información, descubrir patrones y tendencias. La minería de datos se puede utilizar en una variedad de ámbitos, como la tecnología, las finanzas, la salud o la ciencia y suele emplear técnicas de aprendizaje automático y análisis estadístico para procesar y analizar los datos de manera eficiente. El objetivo de la minería de datos es ayudar a las empresas y las organizaciones a obtener nuevas visiones y a tomar decisiones informadas basadas en datos. Para más información, pincha en el siguiente enlace a PDF. 

En este apartado, aprenderás los usos de la minería de datos en el ámbito educativo y algunas aplicaciones que te pueden ayudar a sacar mayor rendimiento a la información que recojas de tu alumnado, tanto para mejorar tu práctica docente como para trabajar la competencia digital de tu alumnado.

3.1. Aplicación de la minería de datos al ámbito educativo

Hay varias formas en las que el big data  y la minería de datos pueden ser aplicadas en el ámbito educativo. A continuación, se muestran algunos ejemplos:

  1. Análisis de datos de rendimiento para identificar patrones en el desempeño académico del alumnado.
  2. Desarrollar sistemas de tutoría personalizada.
  3. Identificación de las maneras más eficientes de incorporar la tecnología en el aula y mejorar la enseñanza.
  4. Analizar los datos de los estudiantes y ofrecer recomendaciones personalizadas sobre carreras profesionales y posibles universidades.

1. Análisis de datos de rendimiento para identificar patrones en el desempeño académico del alumnado

Para hacer un análisis de datos de rendimiento e identificar patrones y tendencias en el rendimiento académico de los estudiantes, es necesario establecer unas pautas de actuación:

  • En primer lugar, hay que obtener los datos, que pueden incluir calificaciones, resultados de exámenes, tareas y otros aspectos relevantes.
  • Después, es importante limpiar y organizar esos datos para eliminar los incorrectos y asegurarse de que están en un formato adecuado para el análisis.
  • Cuando los datos están limpios y organizados, se pueden utilizar técnicas de minería de datos y análisis estadístico para buscar patrones y tendencias en el rendimiento académico de los estudiantes. 
  • Posteriormente, se procede a la interpretación de los resultados del análisis de datos para obtener una visión valiosa.
  • Finalmente, tiene lugar la toma decisiones sobre cómo adaptar la enseñanza para mejorar el rendimiento académico del alumnado.
Varios ordenadores y monitores
Jimena González y David Rodríguez de la Fuente. Análisis de datos (CC BY-SA)

2. Desarrollar sistemas de tutoría personalizada

Utiliza una plataforma que recolecte datos sobre los estudiantes y su rendimiento académico, verás algunas más abajo. Un sistema de big data puede analizar las calificaciones y el historial académico del alumnado, además del tiempo que dedica a realizar tareas y ejercicios en línea. Con esos datos, puedes crear un programa de tutoría personalizada que se adapte a las necesidades individuales y que incluya, por ejemplo, la identificación de áreas de oportunidad en las que el estudiante necesita más ayuda, la selección de material de estudio y los recursos educativos adecuados. A continuación, se muestran algunas herramientas útiles para desarrollar este proceso:

  • Por un lado, tienes herramientas de gestión académica y seguimiento del rendimiento, como BlackboardCanva, o Moodle. No olvides que es importante elegir la plataforma que mejor se adapte a tus necesidades y te ofrezca las funcionalidades necesarias para recopilar y gestionar los datos del alumnado de manera eficiente y segura.

  • Por otra parte, existen aplicaciones para crear encuestas o cuestionarios en línea con el fin de recolectar respuestas de manera fácil y rápida e, incluso, para analizar y visualizar los datos recabados. Las más populares son las siguientes:
    • Google Forms para saber como crear un formulario pincha aquí
    • Microsoft Forms (incluida en educacyl) para saber como crear un formulario pincha aquí,
    • SurveyMonkey para saber como crear un formulario pincha aquí.
Logos de formularios
Jimena González y David Rodríguez de la Fuente. Formularios (CC BY-SA)

3. Identificación de las maneras más eficientes de incorporar la tecnología en el aula y mejorar la enseñanza

Del mismo modo que se puede hacer un análisis del rendimiento de alumnado, se puede analizar el uso de la tecnología educativa y, para ello, es preciso recolectar datos relevantes que pueden ser, entre otros, los siguientes:

  • el tipo de tecnología empleada
  • la frecuencia de uso
  • la forma en que se utiliza
  • el impacto en el rendimiento académico de los estudiantes.

Luego, se deben emplear herramientas de análisis de datos, como Excel, Google Sheets, o Tableau, para realizar cálculos y visualizar los datos de manera gráfica, lo que facilita la identificación de tendencias y patrones. Con los resultados del análisis, sabremos, por ejemplo, qué tipo de tecnología es más efectiva según el contexto, las mejores prácticas para su uso, así como qué medidas pueden tomarse para aumentar su impacto en el rendimiento académico de los estudiantes. Finalmente, se podrán implementar las estrategias seleccionadas y verificar que se están empleando de manera eficiente y que tienen un impacto positivo en la enseñanza y el aprendizaje.  

4. Analizar los datos de los estudiantes y ofrecer recomendaciones personalizadas sobre carreras profesionales y posibles universidades

Primero, se recopilan datos relevantes sobre los estudiantes:

  • rendimiento académico
  • intereses y habilidades
  • metas profesionales. 

Luego, se utilizan técnicas de minería de datos para analizar estos datos y buscar patrones y tendencias que ayuden a identificar carreras profesionales y universidades que se ajusten a las necesidades y habilidades individuales de cada estudiante. Por ejemplo, si un estudiante tiene un alto rendimiento en las materias de ciencias y quiere seguir una carrera en el campo de la medicina, la minería de datos puede ayudar a encontrar universidades que ofrecen programas de pregrado en medicina y tienen una buena reputación en este campo. También se pueden analizar otros datos, como la ubicación de las universidades, su precio y su tasa de admisión para ofrecer recomendaciones aún más personalizadas.

3.2. Herramientas de minería de datos y análisis de big data

Existen varias herramientas de minería de datos y análisis de big data que se pueden utilizar para lo expuesto anteriormente. Si bien, como hemos visto, algunos programas más conocidos como Excel o Forms también sirven para la recogida y el análisis de datos, en este módulo correspondiente a un nivel B2 de competencia digital docente, descubrirás otras aplicaciones menos comunes y de mayor complejidad. 

Imagen con líneas de código en blanco sobre pantalla negra
Pixabay / Xresch. Minería de datos (Pixabay License)
  • Apache Hadoop es un software de código abierto que permite el almacenamiento y procesamiento distribuido de grandes cantidades de datos en sistemas de computación clusterizados. Si quieres saber más sobre Apache Hadoop pincha aquí e irás a la guía de uso. 

  • Apache Spark es un motor de procesamiento de datos de alta velocidad que posibilita el análisis en tiempo real de grandes conjuntos de datos. Fue desarrollado por la Fundación Apache y se basa en el procesamiento de datos de memoria distribuida que cuenta con un procesamiento más rápido y eficiente. Apache Spark se utiliza ampliamente en aplicaciones de análisis de datos, incluyendo la minería de datos, el aprendizaje automático y la visualización de datos.
    También se puede integrar con otras herramientas de análisis de datos y se puede utilizar conjuntamente con lenguajes de programación que suelen usarse en el análisis de datos y la ciencia de datos como son RPythonPython es un lenguaje de programación de alto nivel que se utiliza en aplicaciones de análisis de datos, incluyendo la minería de datos y el aprendizaje automático. R, por su parte, es un lenguaje de programación específicamente diseñado para el análisis estadístico y la visualización de datos. Ambos son de código abierto y se pueden utilizar juntos o de manera independiente, según las necesidades del proyecto y las preferencias del usuario. Si quieres saber más sobre este motor de procesamiento de datos pincha aquí.
  • Tableau es una herramienta de visualización de datos con la que es posible crear gráficos y tablas interactivas a partir de grandes conjuntos de datos. Utiliza un sistema de arrastrar y soltar que hace fácil su uso, incluso para aquellos que no tienen una gran experiencia en programación. 
    Tableau se puede integrar con diferentes fuentes de datos, incluyendo bases de datos relacionales, hojas de cálculo y archivos de texto plano. Tableau no es de código abierto. Es una herramienta comercial desarrollada por la empresa Tableau Software, pero ofrece una versión gratuita de su software para uso personal y educativo. Si quieres saber más pincha aquí. 

  • KNIME  es una plataforma de análisis de datos que ofrece a los usuarios la posibilidad de crear flujos de trabajo visuales para realizar análisis de datos complejos. Estos flujos de trabajo se pueden construir mediante la combinación de diferentes nodos, cada uno de los cuales representa una operación de análisis de datos, como la limpieza de datos, el análisis estadístico o el aprendizaje automático. KNIME es una herramienta de código abierto que se puede utilizar de manera gratuita. Si quieres saber más pincha aquí.

  • RapidMiner es una plataforma de análisis de datos con la que se crean modelos de minería de datos y análisis estadísticos complejos. Si quieres saber más pincha aquí. 

Este término se refiere a la agrupación de elementos en grupos o clusters, que suelen estar formados por elementos que tienen alguna similitud o relación entre sí.