La importancia de la interpretación de datos

La importancia de la interpretación de datos
La correcta interpretación de los datos es un factor clave para la toma de decisiones en las empresas

Como decía Stephen Hawking en 2002 (‘El Universo en una cáscara de nuez’), “Si se pusieran en fila todos los nuevos libros publicados, nos deberíamos desplazar a 150 kilómetros por hora para mantenernos al frente de la hilera”. Han transcurrido 20 años desde entonces y, seguramente, ahora deberíamos desplazarnos a velocidades superiores a los 500 kilómetros por hora para seguir al frente de la hilera.

Los volúmenes de datos a escala mundial se están multiplicando a ritmos de vértigo, y los sistemas para analizarlos, gestionarlos y generar conocimiento a partir de ellos también. A pesar de esto, a los problemas derivados de la calidad del dato, se añade ahora el problema de la interpretación de los mismos.

Un caso real

Durante años, un cliente ha estado almacenando datos históricos de valores bursátiles en una base de datos de tipo estructurado (SQL). Él graba de forma diaria los valores de cotización de la empresa. Posteriormente, con su aplicación estadística, decide si las tendencias de dichos valores son al alza o a la baja. En función de esta información, determina si es el momento adecuado para comprar o vender. Hace poco tuvo un importante descalabro, no entendía por qué su algoritmo estadístico le había recomendado la opción contraria a la correcta, lo que supuso importantes pérdidas. 

Me pidió que le ayudara a averiguar el motivo y encontré que casi se arruina por una interpretación incorrecta de los datos. En su sistema de base de datos, los días que no había podido obtener la información del valor bursátil, grababa la fecha y un valor de NULL (ausencia de dato en los sistemas de bases de datos) para el valor de inversión. Hasta ese punto todo funcionaba correctamente, pero su sistema estadístico no interpretaba de forma correcta esos NULL: por comodidad para sus cálculos, los sustituía por 0 (ceros). Al tener varios días seguidos con valores NULL, su sistema le indicó que el valor de sus acciones estaba cayendo y lo que realmente se desplomó fue su propia inversión.

El valor de la interpretación de datos

Los datos son elementos primarios de información que carecen de valor por sí mismos. Solo adquieren valor cuando somos capaces de contextualizarlos, dándoles un propósito, utilidad o interpretación. En ese momento, los datos pasan a considerarse información. Si esta información la comparamos o conectamos con otra y entendemos la forma en la que va a evolucionar, la convertimos en conocimiento.

A los problemas derivados de la calidad del dato, se añade ahora el problema de la interpretación de los mismos

Nacho Davó, ingeniero de datos & ETL en Solver

En el momento en que partimos de la mala interpretación de un dato, obtenemos una información errónea, lo que nos lleva a un conocimiento que podríamos considerar como ficticio. La correcta interpretación del dato en cada una de sus fases de evolución (tanto del dato unitario y atómico, como de las interpretaciones en las diferentes fases) es básica para que tomemos decisiones basadas en conocimiento e información cierta y veraz y, contando así con mayor posibilidad de ser las decisiones correctas.

Las etapas y los valores del dato

De esta manera, en la primera etapa de captura y almacenamiento de cualquier dato aislado y en bruto, debemos conocer cuál es la interpretación correcta tanto del dato como de su ausencia, que significa que no exista el dato (podría ser un simple problema de transmisión de datos, un error en la captura o que en ese periodo no se ha generado dato porque, por ejemplo, nuestro negocio estaba cerrado). También debemos conocer los posibles valores que puede adoptar el dato y cuáles son los valores “anómalos” o que no tienen ningún sentido y deberían interpretarse como erróneos.

Tanto en el proceso de transformación de nuestros datos en información como en el proceso de transformación de la información en conocimiento, hemos de volver a interpretar los diferentes resultados que vamos obteniendo y los motivos por los que hemos llegado a ellos.

La importancia del contexto

Si nos fijamos en las series temporales de ventas en los supermercados españoles durante el año 2020, todos tendrán un pico de ventas muy exagerado para la semana del 9 de marzo para los productos relacionados con el papel higiénico (ante la posible declaración del estado de alarma, los españoles reaccionamos comprando papel compulsivamente). Si no interpretamos de forma correcta esa serie temporal, y no le dotamos de un contexto adecuado, cualquier sistema para generar predicciones de compra de papel higiénico para marzo de 2021, habrían interpretado que en marzo de este año hemos multiplicado por 10 nuestras ventas de papel y, nos habría generado un gran problema de stock.

Para resumir…

Como he mencionado anteriormente, la interpretación de los datos (en todas sus fases) es tan importante o más que disponer de un volumen grande de los mismos. Si no podemos interpretarlos de forma correcta sería como disponer de todos los libros de los que hablaba Hawking, pero en un idioma que desconocemos, por lo que no nos servirían para nada.

Autor: Nacho Davó

Share this post on:

¿Dónde estamos?

Dirección
C/ Luis Vives 6, puerta 1.
46003 Valencia

Horario
Lunes a viernes: de 9:00 a 18:00 h.

Enlaces de Interés

Puedes enviarnos un mensaje con tus preguntas, consultas o simplemente para informarnos sobre tu proyecto y veremos cómo podemos ayudarte. Si necesitas enviar archivos, te agradeceríamos que nos enviaras un correo electrónico a info@iasolver.com

Esta web utiliza cookies. Puede ver aquí la Política de cookies.    Ver Política de cookies
Privacidad