Correlación y causalidad: Dos conceptos que muchos confunden y unos cuantos manipulan

Desde el prescolar de la investigación le enseñan a uno a no confundir la correlación con la causalidad. Sin embargo, la idea de causalidad parece prevalecer en la mente de aún aventajados investigadores en áreas no matemáticas, en especial entre investigadores de las ciencias sociales. Es frecuente oír en los medios de comunicación a personas afirmar que tal cosa es la causa de tal otra cosa porque la ocurrencia de la primera precedió a la ocurrencia de la segunda, o porque con frecuencia aparecen casi simultáneamente. Una de estas relaciones de causalidad frecuentes es la de asociar el calor con los temblores. Mi madre con frecuencia la he oído afirmar. "va a temblar porque está haciendo mucho calor". ¿Cómo es eso mamá? Le pregunto. Rápidamente responde: "siempre me acuerdo que ese día del temblor hacía mucho calor, y dice los más viejos que así ha sido siempre". Ese un buen ejemplo de confundir una posible correlación entre altas temperaturas ambientales y movimientos telúricos; lo cual no significa que el calor produzca los temblores. Espero con la breve explicación que presento más abajo contribuir a disipar las dudas más comunes en torno a estos conceptos. Además, es muy importante distinguirlos para no ser presa de aquellas y aquellos que usan las estadísticas para divulgar mentiras, para manipular la interpretación de la realidad.

Todo conocedor de la investigación sobre la formación de los conceptos de probabilidad, aleatoriedad, media, mediana, frecuencia y otros conceptos centrales en la estadística, sabe de lo difícil que resulta apropiarse de estos por parte de la mayoría de nosotros. Su comprensión adecuada requiere del estudio consciente y disciplinado. Pasemos revista pues a los conceptos que nos ocupan en esta oportunidad.

¿Qué es la correlación? La correlación es una medida bi-variada que mide la magnitud de la asociación entre dos variables y la dirección de dicha relación. El valor del coeficiente de correlación entre dos variable varía entre -1 y +1. Si se obtiene un coeficiente de correlación de -1 o de +1 se dice que existe un grado perfecto de correlación entre las dos variables consideradas. En la práctica se usan cuatro tipos de correlación. Des estas la más usada en la correlación de Pearson, la cual se usa para medir la correlación entre dos variables relacionadas linealmente. Un ejemplo muy común de uso de este tipo de correlación es el caso de la bolsa de valores, para determinar si dos valores dados están correlacionados. Una correlación de signo negativo significa, siguiendo con el ejemplo, que si una de las acciones dadas aumenta la otra acción baja, y viceversa. Es decir, que las dos acciones se mueven en direcciones opuestas. Por el otro lado, una correlación positiva indica que las dos acciones consideradas se mueven en la misma dirección.

Es muy importante comprender que la correlación, aún en su valor extremo, no significa causalidad. Por ejemplo, en algunos estudios en los Estados Unidos se ha determinado que existe una correlación de 0,894 entre la variable edad y la variable ingreso. Sin embargo, esto no puede ser interpretado como que la edad produce ingresos o que el aumento del ingreso produce envejecimiento.

¿Qué es la causalidad? No voy a ofrecer aquí una definición de causalidad, este es uno de los conceptos en los que más papel y tinta se ha gastado, y no deja de ser controversial. Para los fines de este breve artículo nos bastará referirnos al llamado análisis causal. Tal como señala Allison (ver: https://statisticalhorizons.com/prediction-vs-causation-in-regression-analysis), en un análisis causal las variables independientes son consideradas como causas de la variable dependiente. El objetivo del estudio causal es determinar si una variable independiente particular realmente afecta a la variable dependiente y, además, estimar la magnitud de tal efecto, si acaso existe. Se trata es de determinar pues si una o varias variables independientes afectan a un variable dependiente determinada.

Tenemos así pues que la correlación es una medida estadística, expresada en un coeficiente de correlación (un número), que describe la magnitud y la dirección de una relación lineal entre dos variables dadas. Una correlación entre dos variable no significa que cambios en una de ellas producirá cambios en la otra. Ésta solo nos indica que los cambios entre dos variables dadas pueden darse en la misma o en opuestas direcciones con determinados grados de magnitud. Mientras que la causalidad nos muestra que la ocurrencia de un determinado evento es producido por la ocurrencia de otro evento dado. Nos referimos al primero como la causa y al segundo como el efecto. Dos eventos pueden estar correlacionados, como por ejemplo fumar cigarrillos y el alcoholismo; sin embargo, esto no puede interpretarse como que fumar causa el alcoholismo.

Por estos días hemos visto en los medios de comunicación del Estado algunas explicaciones sobre el comportamiento reciente de nuestra economía, que para tratar de demostrar "científicamente" que el Gobierno no tiene ninguna responsabilidad, pretenden presentar relaciones lineales de correlación como relaciones causales. Para evitar confusiones y contrarrestar este tipo de manipulaciones, es necesario que la clase trabajadora y el pueblo en general se eduquen en esta materia.



Esta nota ha sido leída aproximadamente 5320 veces.



Julio Mosquera


Visite el perfil de Julio Mosquera para ver el listado de todos sus artículos en Aporrea.


Noticias Recientes: