¿Alguna vez te has preguntado por qué es tan difícil encontrar a la pareja ideal? Si descomponemos algo tan complicado (como salir con alguien) en dos factores: i) Qué tanto te agrada y ii) si te parece simpático/a, quizás pienses que no puedes encontrar esos dos elementos juntos en el mercado #QuéExigente. Tal vez te parece que esa persona es muy atractiva, pero nada agradable; quizá es totalmente tu tipo, pero no te llama a más #DejaDeNegarlo #ATodosLesPasa. Entonces, parece que hubiese una relación negativa entre estas dos cualidades, una especie de trade-off entre ser agradable y físicamente atractivo(a) #NoLoSéRick. Pero…, ¿qué dice la estadística al respecto? La respuesta, en cuatro palabras, es: La paradoja de Berkson.
Explicando la paradoja de Berkson
Antes que nada, en estadística es muy importante diferenciar la causalidad de la correlación. Es casi un pecado capital afirmar que, por ver un gráfico en el que dos rasgos (por ejemplo, educación y nivel de ingresos) vayan de la mano, se afirme que uno cause al otro. Esto solo sirve para decir que están estrechamente correlacionados. Aquí es donde puedes preguntarte: Si tengo un nivel de ingresos más alto, ¿puedo estudiar más? o ¿he estudiado más porque tengo mayor nivel de ingresos? Las correlaciones engañosas reciben el nombre de correlación espuria.
Fuente: tylervigen.com
Un ejemplo de correlación espuria
Ahora bien, en estadística, la paradoja de Berkson es un resultado, bajo probabilidades condicionales, que tiene una interpretación, en su mayoría, contraintuitiva. Se llama paradoja de Berkson en honor a Joseph Berkson, quien expuso este tema por primera vez cuando intentaba encontrar correlaciones entre enfermedades en un hospital. Asimismo, se genera esta debido a que la población de estudio para ambos rasgos no está siendo observada de la misma manera. El ejemplo más común es la falsa observación de una correlación negativa entre dos variables, que en realidad podrían tener una correlación positiva o incluso no tener correlación.
Fuente: Google Correlations
Las búsquedas en Google de “café” y “motivación” tienen alta correlación en Perú
El ejemplo: Tu vida amorosa
En la vida real, la belleza física y el nivel de ser agradable no muestran correlación alguna. Entonces, gráficamente, se vería como el gráfico 1.
Gráfico Nº1: Correlación nula entre variables
Para explicar un poco mejor la paradoja, va a existir una cota que delimite, en promedio, cuán agradable debe ser una persona y qué tanto te debe atraer físicamente. Por lo que el gráfico se vería un poco más como el gráfico N°2. De esta forma, la zona roja estaría, por así decirlo, “descartada”, puesto que está compuesto por personas que no son lo suficientemente agradables ni atractivos para ti. De este modo, deberás “enfocarte” en el triángulo superior. Hey, pero sin escalar tanto #NoTeEmociones, la zona naranja representaría a las personas muy agradables y muy atractivas. Esta es una pequeña proporción del total de la población, por lo que podríamos considerarla como “fuera de tu liga” #NoTePongasSad.
Gráfico Nº2: Zonas descartadas
Como resultado, uno siempre se debe enfocar en el promedio (la zona blanca). Así, la falsa percepción de la vida debería ser similar a la del gráfico 3. Como explica la paradoja, esta relación se genera a partir de la recolección de “datos” basados en nuestra experiencia. Esta puede ser sesgada en caso tengas mayor probabilidad de conocer muchas personas que son muy atractivas, pero poco agradables y viceversa #NotReallyMyFault.
Gráfico Nº3: Relación negativa
En conclusión, las correlaciones entre aspectos que no tienen mucho sentido existen por todos lados. De hecho, algunas pueden estar sesgadas, como el caso de la paradoja de Berkson. Por eso, existe la percepción de que algunas características coincidan, como es el caso de pensar que las personas físicamente atractivas son desagradables, o viceversa, cuando en realidad no existe una causalidad ni mucho menos una correlación cierta. Así que #ÁnimoAbuelita, si expandes mejor tu tamaño de muestra a lo mejor tu situación se encuentre por encima del promedio. O, a lo mejor, consideres otros aspectos al buscar con quién compartir tu tiempo (y el costo de oportunidad de estudiar ese curso matador este ciclo).
Fuentes:
Berkson, J. (1946). Limitations of the Application of Fourfold Table Analysis to Hospital Data. Biometrics Bulletin, 2(3), 47-53. doi:10.2307/3002000
Link externo: Numberphile: Does Hollywood ruin books? – An education video on Berkson’s paradox in popular culture