Datos, datos, datos. Más datos por favor





Los datos mandan… Todo lo basado en datos se presume objetivo, fiable y libre de trampas. Tenemos periodismo basado en datos, big data, y la evidencia sanitaria se ha transformado en un complejo entramado estadístico que casi permite extraer cualquier conclusión. Ya lo decía Coase (Nobel de economía): “if you torture the data enough, nature will always confess“.


La realidad, sin embargo, no es tan objetiva, y los datos que extraemos siempre van a tener sesgos a la hora de obtenerlos o de interpretarlos. Ioannidis es muy claro al respecto: Why most published research findings are false? Cuestiones como la difícil repetición de ensayos con resultados idénticos, los prejuicios o la difusión de resultados parciales no ayudan a desmontar las afirmaciones de Ioannidis, y quizás deberían hacernos pensar un poco sobre esta época de datos, datos y más datos.

Tener todos los datos y toda la información no ayudará a tomar las mejores decisiones, pero es un paso lógicamente. En El Mundo, hace pocos días, Javi Gómez se planteaba si no vivimos en una dictadura del dato. Comparar la popularidad con los likes de Facebook, saber si he caminado un paso más o menos que ayer, o incluso comprobar que el consumo de aquel antiagregante cayó durante las fiestas del pueblo y tuvo un pico con la luna llena de enero.

Los datos son imprescindibles, pero mientras no tengamos clara su utilidad y veamos todas sus posibilidades, nos quedaremos en las anécdotas (este reciente artículo del BMJ lo dice muy claro). La vida, la gestión o la investigación son mucho más que una tabla dinámica, una correlación o una base de datos infinita. La parte cualitativa, las emociones, el entorno, la presión social, las modas (lo que ayer era malo, hoy es bueno) y el hecho de no disponer de (un número suficiente de) profesionales expertos para trabajar adecuadamente los datos son muchos de los factores que nos lanzan señales de humo sobre el riesgo de sacar conclusiones incorrectas.

La verdad es demasiado compleja… De hecho, ¿podemos reducir la realidad a una fórmula o un algoritmo? ¿Y lo altamente improbable?


Nota: la imagen es de Tom Fishburne.

10 comentarios

  1. Enormes cantidades de dinero se han empezado a mover y más que se moverán en financiaciones europeas relacionadas en Big Data. Y la palabra "Big data" va a ir de la mano de otra palabra terriblemente sobada como es la "innovación".
    Sí, el elemento clave, es tener en cuenta el "para qué".
    Y qué impacto en salud y en equidad en salud van a tener poner en marcha maquinarias pesadas que van a costar tanto dinero.

  2. Interesante reflexión sobre lo que es ponerse a trabajar/recopilar datos sin otro objetivo que tenerlos.
    El para qué valen y cuál es el objetivo que hizo necesario su recopilación y ANÁLISIS, aún parece ser secundario.
    Se ha empezado a "correr" sin haber dominado el proceso de "gatear", lo que producirá retrasos en la consecución de los objetivos.

    • Son modas, y en sanidad hay muchas. Otra que tenemos delante es la humanización, una moda muy necesaria pero que quizás algún día haya que evaluar (no su efectividad pero si su difusión). Y si es útil, al ataque con ella 🙂

  3. Varios problemas: el primero intrínseco a las propias fuentes de los datos. Si hablamos de big data, tenemos que hablar de las tres Vs: Velocidad, Volumen y Variabilidad. ¿Y la calidad? ¿Hasta que punto son válidos los datos de los cuales no es posible asegurar la calidad de los mismos? ¿Qué decisiones podemos tomar en base a ellos? Y por último, pero no menos trivial: en pleno siglo XXI seguimos con el mantra de los datos, cuando la realidad es que la avalancha de datos nos impide ver el conocimiento.

    Vale, ya tenemos big data. ¿Sabemos que buscar? ¿Tenemos una ligera idea de qué queremos encontrar? ¿Usamos algoritmos de data mining que nos ayuden a establecer patrones de uso, de comportamiento? ¿O tal vez, en un clásico enfoque bayesiano, retorcemos los datos para que nos muestren lo que queremos demostrar?

    Habláis de datos, de big data, y a continuación habláis de Watson. Un dato: Watson no funciona con datos. Watson funciona con conocimiento. Debemos dejar atrás el discurso caduco de los datos y big data (que para mí cada vez es más big mess) y empezar a modelar los datos como conocimiento. Ese es el futuro.

    • creo que con tu post en HIMSS lo resumes todo… Tenemos datos, de calidad desconocida, y queremos usarlos para algo (sin especificar). Hay muchos incentivos a lanzar proyectos relacionados con Big Data pero pocas veces se plantean como conocimiento.

      Muchas gracias Rafa!

  4. Gran reflexión Manyez, y totalmente de acuerdo con Rafael, es necesario dar sentido a los datos, y no sólo a la hora de interpretar si no de recoger.

    Y reclamar el dato cualitativo omóplatos necesario y tan válido como el cuantitativo, pues es necesario y valido sobretodo en salud.

  5. A este respecto interesante artículo en investigación y ciencia con ejemplos de risa de correlaciones big data http://www.investigacionyciencia.es/revistas/investigacion-y-ciencia/numero/478/correlacin-no-implica-causalidad-14325

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.