Analítica de datos y su vocabulario aplicado a la educación superior

Analítica de datos

Puntos clave

  • Conozca la diferencia entre inteligencia institucional, análisis de datos y reportes
  • Un diccionario de datos es una colección de información detallada que define un dato, su valor y su uso dentro de una base de datos.
  • Los lagos de datos contienen datos no estructurados y estructurados

¿Confundido por la diferencia entre data lake y data warehouse? Aquí te ofrecemos un minidiccionario para entender algunos de los términos más comunes del idioma tecnológico.

En el mundo de la tecnología para la educación superior, la analítica de datos está de moda y con justa razón. En el pasado, las decisiones en la educación superior se basaban en suposiciones o estimaciones vagas. Ahora, con la adopción de tecnología más avanzada, las instituciones tienen una vasta base de datos a su disposición. El problema es descifrar qué hacer con todos esos datos, cómo organizarlos, y —lo más importante— cómo obtener conocimiento de ellos. Ahí es donde la analítica de datos entra: las instituciones alrededor del mundo están buscando formas de aprovechar todos los datos generados en el campus para usarlos de manera inteligente.

Es inevitable que cualquier campo especializado genere su propio vocabulario y así ocurre con la analítica del aprendizaje. Por esto, hemos reunido algunos de los términos más utilizados para ayudarte a entender el lenguaje alrededor de la analítica de datos.

Big data

El término “big data”, macrodatos en español, se ha utilizado durante los últimos 20 años. En su definición más simple, el big data es toda la información disponible para una institución. Incluye tanto los datos estructurados: información con un alto nivel de organización como los números de matrícula de los estudiantes, fechas de nacimiento, etc.; como los datos no estructurados: información que no está organizada de forma efectiva como emails, publicaciones en redes sociales, etc. Los macrodatos son complejos y caóticos y como el término lo sugiere, contiene mucha información.

Las instituciones de educación superior están nadando en información, desde registros de estudiantes y datos de búsqueda hasta emails, tweets y registros de estacionamiento. El reto para las instituciones actuales es encontrar la manera de interpretar ese conjunto de datos. Básicamente la analítica de datos es el método para examinar todos estos datos, encontrar patrones o respuestas, y convertir todo ese caos en algo útil.

Inteligencia institucional (versus reporting (informes) y analítica de datos)

El significado de estos términos se confunde comúnmente. Pero la principal diferencia se encuentra en la profundidad de la información.

Un reporte o informe esta diseñado para responder a una pregunta especifica (¿qué tanto disminuyó la matrícula el año pasado?) y presenta información en una forma estructurada que puede ser fácilmente digerida. Por otro lado, la analítica de datos ofrece una robusta cantidad de datos diseñados para que el usuario descubra y responda una serie de preguntas (¿por qué disminuyó la matricula? ¿cómo nos desempeñamos en los cinco años anteriores? ¿cómo podemos detenerla? y ¿cuáles son las proyecciones para el siguiente año?) La analítica de datos es multidimensional, permite profundizar, descubrir y mejorar la visión sobre la información. Con la analítica de datos, se obtiene una comprensión más profunda de la relación entre diferentes piezas de información disponible.

La inteligencia institucional es, en cierto sentido, un método para combinar todas nuestras herramientas para ayudarnos a tomar decisiones informadas y así guiar a la institución. La inteligencia institucional reúne informes, analítica de datos y todo tipo de información para proporcionar una visión completa del estado actual de los asuntos y desafíos que la institución enfrenta. Construye una base sólida basada en precisión y profundidad, para que los planes y decisiones sean más informados e inteligentes, antes que basarse en suposiciones.

Dark data

Claro, es un término que suena bastante siniestro y puede hacernos pensar en villanos encubiertos, pero en realidad, dark data se refiere a la información recolectada y procesada, pero no analizada: Notas aleatorias, información de varias partes del campus, etc. Es muy posible que esta información tenga el potencial de mostrar respuestas, pero solo está ahí, ocupando espacio sin ser analizada. Nada más, nada menos.

Data dictionary

Así como un diccionario lingüístico, un data dictionary, o diccionario de datos, es una compilación de información detallada que define conceptos, su valor y su uso dentro de una base de datos. Dentro de la educación superior, por ejemplo, el data dictionary establece definiciones de lo que constituye una hora de crédito, semestre, estudiante de tiempo completo, etc. Establecer estas definiciones permite a las bases de datos compartir el mismo lenguaje, ya sea para entenderse o para que la información pueda ser detallada y analizada en las bases de datos.

A un nivel personal, el data dictionary ayuda a todos dentro de una institución a comprender los significados de los términos y así la información pueda ser manejada y procesada de manera correcta. Un diccionario de datos se asegura de que todos estén en la misma página, así cuando los datos se ingresen o se manipulen, se manejen de acuerdo con la misma definición del concepto. En otras palabras, “horas de crédito al semestre” significará lo mismo para aquellos en el Departamento de Biología como para asuntos escolares, y así la información correspondiente en todas las bases de datos será precisa. También determinara cómo puede ser usada la información, qué valores se le pueden adjudicar y la relación que tenga con otros datos.

Gobierno de datos

Imaginemos al gobierno de datos como un sistema de reglas y regulaciones diseñadas para ayudar a una institución a decidir qué datos son importantes, cómo serán (o no) utilizados y quiénes tienen acceso a ellos. Básicamente, el gobierno de datos tiene dos partes: gestión de datos y seguridad.

La gestión de datos dicta cómo una institución controla y almacena su información, así como el acceso que se tiene a ella. Elimina las sorpresas y la incertidumbre al proveer un marco establecido para el uso de la información de la institución. En cuanto a seguridad se refiere, se establecen protocolos para proteger la información, desde mal uso y abuso de los datos, ya sea de manera externa o interna de la institución.

El gobierno de datos puede ser manejado a través de varios métodos, pero es mejor redactar políticas basadas en las opiniones de personal dentro de la institución. También vale la pena resaltar que el gobierno de datos es parecido a un seguro de auto: todos deberían de tenerlo, pero no todos lo tienen.

Para leer más sobre cómo implementar un gobierno de datos de manera exitosa, lee nuestra entrada en el blog “Cómo iniciar un gobierno de datos”.

Lago de datos (Data Lake) versus Almacén de datos

Un lago de datos y un almacén de datos son dos métodos para guardar información. La diferencia está en cómo se guarda esa información.

Un lago de datos mantiene información sin estructurar, así como información estructurada. Imaginémosla como un contenedor que captura toda la información que genera una institución. Es un gran depósito de información sobre la institución y sus varios departamentos, instalaciones, campus, etc.

Un almacén de datos también guarda información, pero en una forma más estructurada, como archivos o carpetas. Aquí la información se encuentra organizada y la manera de usarla está definida. Podemos explicarlo como que la información dentro de un almacén de datos ha sido depurada y archivada lista para un fácil manejo.

Un lago de datos mantendrá toda la información, al contrario de un almacén de datos, que en algunos casos elimina o descarta información para ajustarse a los parámetros del almacén. Un lago de datos mantiene toda la información, mientras que un almacén de datos puede que no cuente con el espacio suficiente para hacerlo.

Podemos ver las ventajas de tener un lago de datos: al contar con esa cantidad de información histórica contamos con un gran espectro que puede ofrecer ideas valiosas que de otra forma no hubieran sido descubiertas. Un lago de datos, en efecto, permite llegar a resoluciones más profundas y precisas. Sin embargo, algunas instituciones han optado por utilizar un sistema hibrido: conservando un almacén de datos junto a un lago de datos. Como en el caso de la analítica de datos, no hay un enfoque único que se ajuste a todas las instituciones.

Enterprise analytics o análisis institucional

Este termino se refiere a la capacidad para analizar los datos de toda la institución. En otras palabras, son los métodos y el proceso de recolectar, interpretar y analizar la información desde una perspectiva institucional en vez de un ángulo departamental o divisional.

El análisis institucional ofrece a las instituciones una visión integral de la información y factores que afectan a la organización entera.

ETL versus ELT

En términos generales, ambos conceptos se refieren a métodos mediante los cuales los datos se mueven para preparar análisis y reportes. ETL (en español, ETC: extraer, transformar, cargar) es el enfoque tradicional, en donde los datos sin organizar son recuperados de un data pool, movidos a un lugar temporal para organizarlos antes de ser cargados a un almacén de datos para su análisis. Cada etapa (la E, la T y la C) debe ser completada antes de que los datos se puedan analizar o de que los reportes se puedan generar.

ELT (extraer, cargar, transformar), un método relativamente nuevo que cambia el enfoque anterior. Después de extraer los datos, pueden ser cargados a un depósito, como un almacén de datos, y de inmediato ser estructurados para su análisis. Aunque este proceso todavía está evolucionando, su característica es que permite más flexibilidad y velocidad, permitiendo el acceso de grandes cantidades de datos en cualquier momento.

Como en cualquier aspecto de la tecnología, hay varias opiniones y estrategias alrededor de la analítica de datos y los mejores métodos para abordarlos. En realidad, no hay una opción que se adapte a todos. Cada institución tiene sus propias necesidades y exigencias únicas. Pero asegurarse que todos hablen el mismo idioma y entiendan el vocabulario, es la mejor forma de construir las bases para el éxito.

Para leer más sobre los beneficios de la analítica de datos, visita nuestro sitio web.

Meet the authors