top of page
Abstract Blue Geometric Design
Abstract Blue Light

La ilusión de la precisión: por qué confiamos demasiado en los datos

Private Investigator Questioning The Reports
Private Investigator Questioning The Reports

Por JM Abrams, director de cultura de datos — http://www.dataculturehivemind.com


Tratamos los números como si fueran infalibles. Si una métrica aparece en un panel, una hoja de cálculo o una diapositiva, la aceptamos sin cuestionamientos. El número se convierte en la verdad. El gráfico, en la prueba. ¿Pero lo es? Esta confianza en los datos no siempre se gana. Y puede llevar a malas decisiones.


Confiamos en el paquete, no en el proceso


Hemos heredado un prejuicio arraigado: si algo se publica, debe ser cierto. Ese mismo instinto se ha trasladado discretamente a los datos. Cuando los números se presentan en tablas, gráficos y paneles, parecen serios. Precisos. Fidedignos. Damos por sentado que han sido verificados. Creemos que significan algo importante.


Pero los datos no son neutrales. Se ven influenciados por quién los recopiló, cómo se procesaron y qué se decidió mostrar o excluir.


Números en una bata de laboratorio


Los datos llevan una bata de laboratorio. Parecen objetivos. Pero en el momento en que los visualizamos, los resumimos o los filtramos, les estamos añadiendo interpretación.


Esto es lo que llamo la ilusión de precisión : la idea de que un número con dos decimales debe ser correcto. Un gráfico de líneas debe reflejar la verdad. Un gráfico de barras debe contar la historia completa.


Rara vez nos detenemos a preguntar:

  • ¿Quién creó esta métrica?

  • ¿Qué incluye y excluye?

  • ¿Son estos los datos correctos para la pregunta que estamos haciendo?


Cuatro sesgos que distorsionan nuestro pensamiento


  1. Sesgo de autoridad

    Creemos en las cifras porque parecen oficiales, especialmente si provienen de una herramienta o persona de confianza. Esto se conoce como sesgo de autoridad , donde las personas se inclinan por supuestos expertos incluso cuando el contenido puede ser defectuoso o no estar verificado ( Barron's , Wikipedia ).


  2. Efecto de encuadre

    La forma en que se presentan los datos cambia nuestra interpretación de los mismos, incluso si los hechos permanecen invariables. El efecto de encuadre está bien documentado en la psicología conductual. Las personas toman decisiones diferentes cuando datos idénticos se expresan de forma positiva o negativa ( Wikipedia , Forbes ).


  3. Facilidad cognitiva

    Nuestro cerebro prefiere las cosas fáciles de procesar. Por eso, confiamos más en las imágenes claras y los paneles de control ordenados, incluso si los datos son erróneos. Este truco de fluidez cognitiva hace que las presentaciones impecables parezcan más fiables de lo que son ( preimpresión de arXiv ).


  4. Sesgo de confirmación

    Aceptamos datos que respaldan nuestras creencias y descartamos los que no. El sesgo de confirmación nos lleva a seleccionar métricas cuidadosamente y a ignorar las señales de alerta. Se ha observado ampliamente tanto en decisiones empresariales como en investigación científica ( PMC ).


El efecto halo de la hoja de cálculo


He visto esto demasiadas veces en las organizaciones: una métrica aparece en una hoja de cálculo o presentación, y de repente cobra fuerza. El formato le da legitimidad. Pero nadie pregunta de dónde proviene. Y para cuando alguien lo hace, ya es demasiado tarde: la decisión ya está tomada.


Una mejor manera de pensar en los datos


Necesitamos invertir la pregunta. No: ¿Está ahí el número? Sino: ¿Puedo confiar en cómo llegó ahí?

Ese simple cambio nos lleva a una práctica llamada elaboración de perfiles de datos : una forma de examinar la estructura, la calidad y los patrones de los datos antes de usarlos.


No necesitas ser ingeniero o analista de datos para analizar datos. Necesitas plantear preguntas reflexivas y fundamentadas que revelen la forma, la salud y el comportamiento de los números que analizas.

Comencemos con tres preguntas fundamentales. Deben plantearse en toda reunión donde se utilicen datos:


1. ¿Cuál es la fuente de los datos?


¿Proviene de un sistema confiable? ¿Se ingresó manualmente? ¿Se copió, pegó o modificó en algún momento?


2. ¿Se transformaron, limpiaron o filtraron los datos y cómo?


Cada panel tiene filtros. Cada hoja de cálculo tiene fórmulas. Comprende qué se incluye, excluye o modifica antes de concluir.


3. ¿Qué falta o se excluye?


A veces, la pista más importante no es lo que hay en los datos, sino lo que no. ¿Se omiten ciertos grupos, períodos o métricas? Estas tres preguntas constituyen la base de la alfabetización de datos . Pero se puede ir aún más allá. A continuación, se presentan cinco comprobaciones prácticas que cualquiera puede realizar, incluso sin herramientas técnicas.


4. Compruebe si hay campos vacíos


¿Hay filas o columnas con muchos datos faltantes?


Si el 40 % de las filas tienen espacios en blanco en una columna clave, como "código de diagnóstico" o "fecha de pago", es una señal de alerta. Indica que los datos podrían estar incompletos o ser poco fiables.


5. Observa los rangos de valores


¿Tienen sentido los números?


Si un informe muestra a una persona de 145 años o una factura de $0,01 y $900.000 en el mismo gráfico, es posible que algo esté mal. Busque siempre los valores máximo, mínimo y promedio para detectar valores atípicos.


6. Pregunte sobre la coherencia


¿Están estandarizados los nombres, etiquetas o categorías?


Podría encontrar "Alabama", "AL" y "Ala" como entradas separadas en una columna de estado. Esto indica una mala higiene de los datos. Los datos limpios suelen agrupar los datos de forma coherente.


7. Validar totales y lógica


¿Los subtotales y los porcentajes se suman?


Si el informe indica que el 70% de los pacientes son hombres, el 40% mujeres y el 10% otros… tenemos un problema. Compruebe siempre que las cifras coincidan .


8. Verifique la dimensión temporal


¿Los datos están actualizados o desactualizados?


Un informe que utiliza datos de hace dos años, sin fecha y hora, puede llevar a decisiones completamente erróneas. Asegúrese de conocer el período de tiempo de los datos.


Bono: Pregunte de dónde provienen los datos


¿Son datos sin procesar o resumidos? ¿Alguien los validó o provienen directamente de una fuente sin verificar? ¿Alguien modificó las cifras en Excel después de exportarlas?

Conocer el linaje de los datos (de dónde provienen y cómo se movieron) es una de las mejores formas de evitar sorpresas.


La elaboración de perfiles de datos es simplemente cuestión de sentido común


No necesitas conocimientos técnicos para cuestionar los datos. Necesitas curiosidad y disposición para ir más despacio.


Elaborar perfiles es como corregir un documento. No lo estás reescribiendo, solo estás comprobando si tiene sentido.


En la era de la automatización y la IA, dedicar incluso unos minutos a perfilar sus datos puede ahorrarle horas de limpieza, reelaboración o, peor aún, malas decisiones.


Pensamiento final


Los datos no hablan por sí solos. Hablan por quien los recopiló, los transformó y los mostró.

Si queremos una cultura de datos más sólida, que impulse mejores decisiones, debemos superar la ilusión. Debemos dejar de venerar los números y empezar a cuestionar el proceso que los sustenta.

Porque no todos los datos limpios son buenos. Y no todos los números dicen la verdad.


Escrito por Jose Abrams, creador del blog Data Culture Hive Mind, donde los datos se encuentran con el comportamiento humano. 🔗 Visita el blog aquí.


Descargo de responsabilidad: Las opiniones expresadas en este blog son únicamente las del autor y no reflejan los puntos de vista, posiciones u opiniones de mi empleador.

 
 
 

Comentarios


bottom of page