Big Data: Desde los datos al conocimiento


Descargar el archivo completo —AQUÍ

Introducción

Es importante disponer de datos y conocer su relación entre variables; sin embargo, su valor está en transformarlos en conocimiento.

Contexto general

“Transformar y traducir los datos en respuestas” es parte de la innovación, y ésta debe ser aplicada con responsabilidad y creatividad [4].

Uno de los siete pasos en la visualización de datos es la extracción y transformación, ya que permite “aplicar métodos de análisis para distinguir patrones”; es aquí donde recobra aún más importancia el contexto matemático [3].

Algunos métodos nos permitirán evaluar su complejidad mediante Inteligencia Artificial (IA), mineríaa de datos o específicamente la aplicación de técnicas de aprendizaje automático (machine learning).

Luego se realiza comparaciones y obtención de conclusiones previas con la extensión de los datos estadísticos mediante “índices” representativos.

Conceptos relacionados

Open data

El objetivo del open data (datos abiertos) es devolver a la sociedad sus datos públicos y fomentar la transparencia y la reutilización.

Características:

  • Formatos digitales, estandarizados y abiertos.
  • Estructura clara que permita la comprensión.
  • Fácil acceso y permanencia en repositorios.

Principales beneficios:

  • Empoderar al ciudadano de la información para que pueda ser interpretada o reinterpretada.
  • Fomentar un mayor grado de transparencia y reutilización.

Retos éticos

  • Si los datos son generados en un espacio público ¿por qué estos datos deben mantenerse en privado?
  • ¿A quién/es le pertenece los datos generados: a las administraciones, al ciudadano, al mundo?
  • ¿Qué pasa con la evolución de la privacidad?
  • ¿Dónde están los límites de la información sobre nosotros, que nosotros no generamos?
  • ¿Qué competencias se deben desarrollar?

Perfiles profesionales

En base a la tendencia actual tenemos algunos perfiles [2]:

  • Chief Data Officer (Oficial Jefe de Datos), lidera la gestión de datos y analítica asociada por el negocio (responsable de los diferentes equipos especialidades en datos).
  • Data Scientists (Científico de Datos), extraen conocimiento e información valiosa de los datos.
  • Citizen Data Scientist (Ciudadano Científico de Datos), no está formado específicamente para ser Data Scientist, pero puede extraer valor, a través de su experiencia, explorando los datos, desde las unidades de negocio.
  • Data Engineer (Ingeniero de datos), proporciona datos de una manera accesible y apropiada a los usuarios y Data Scientists.
  • Data Steward (Administrador de datos), mantiene la calidad, disponibilidad y seguridad de los datos.
  • Business Data Analyst (Analista de datos comerciales), recoge las necesidades de los usuarios de negocio para los Data Scientist y presenta resultados obtenidos.
  • Data Artist (Profesional Creativo), expertos en Business Analytics, crean gráficos, infografías y otras herramientas visuales.

Visualización de datos [1]

Debemos saber que:

  • La información reside en las relaciones, no en los datos.
  • La visualización es representar gráficamente esas relaciones aprovechando nuestra enorme capacidad de analítica visual.

La visualización de datos no es hacer visible la información ante nuestros ojos, sino ante nuestro entendimiento.

Extraer y transformar

Variables derivadas

Agregación de registros

Agregación de registros + Cálculos de métricas

Cuarteto de Anscombe [5]

Representar

Conclusiones

  • La clave del éxito del Big Data no son los datos en sí, sino los modelos de interpretación (extracción del conocimiento).
  • “Todas las opciones por defecto de Excel son erróneas: los ejes, el hecho de que todo se represente mediante efectos 3D, los colores por defecto, las etiquetas, los estilos gráficos por defecto…” (Noah Iliinsky)
  • “Los modelos mentales a menudo están construidos sobre evidencias incompletas, sobre un escaso conocimiento acerca de lo que está ocurriendo, y con un tipo de psicología ingenua que postula causas, mecanismos y relaciones, incluso cuando no existen.” (Don Norman

Referencias

[1] A. Cairo, El arte funcional, Fareso S.A., 2011.

[2] L. Quituisaca-Samaniego, Big data: visión general, Numérica Resumiendo, (2017).

[3] L. Quituisaca-Samaniego, Visualización de datos: siete pasos, Numérica Resumiendo, (2017).

[4] The Software Alliance, Por qué son tan importantes los datos?, 2015.

[5] E. Tufte, The Visual Display of Quantitative Information, Cheshire, CT: Graphics Press, 2001.