Tópicos de Estadística.

28 05 2016

Tema 18. MEDIDAS DE CORRELACIÓN.

Sin duda este es un tema bastante interesante de Estadística (“harto interesante”, dirían por ahí… ¡Ja!).

CorrelacionLas Medidas de Correlación te permiten saber el grado de “conexión” que existe entre dos grupos de datos numéricos. Los valores que obtienes al realizar las operaciones matemáticas correspondientes a una medida de correlación varían desde -1 hasta +1. Cuando resulta cero es porque matemáticamente no hay conexión entre los grupos de datos. Si obtienes +1 entonces existe una correlación “perfecta” que muestra proporcionalidad entre dos grupos, es decir, conforme aumentan los valores de uno de ellos sucede lo mismo con el otro. Si obtienes -1, igual tienes una correlación “perfecta” pero en sentido inverso, es decir, conforme un grupo de datos aumenta sus valores, el otro los disminuye. Cualquier valor entre -1 < 0 < +1 es necesario interpretarlo.

Hay diferentes medidas de correlación sin embargo una de las más utilizadas es el llamado: Coeficiente de Correlación Muestral de Pearson.

Bolso Wikipedia¿Quieres una definición técnica al respecto? He aquí lo que señala nuestra ilustre enciclopedia Wikipedia.

……………………………….

En estadística, el Coeficiente de Correlación de Pearson es una medida de la relación lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables.

De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas.

……………………………………………

¿Te quedó tan claro como el azul turquesa del agua de una playa de Cancún?. ¡Ja! Espero que sí.

Veamos un problema de investigación al interior de un grupo.

sherlockEres el encargado de la oficina de Control Escolar de una escuela y en una acción al más puro estilo de Sherlock Holmes, estás investigando a seis estudiantes porque tienes la sospecha de que entre ellos hay un par que tiene una relación perjudicial, para decirlo más claramente: dos de ellos -de acuerdo al acomodo mostrado- se copian en tareas y en exámenes. ¿Matemáticamente cómo podrías confirmar tus sospechas?. Para descubrirlo solo puedes utilizar las calificaciones mostradas.

Te reto a que apliques tu intuición y descubras por simple inspección de las calificaciones a los estudiantes sospechosos de: “trabajar en equipo en exámenes”. 

Califi de 6 estudiantes

Resolvámoslo matemáticamente aplicando La Medida de Correlación Muestral de Pearson

Primero trabajemos “a pie” con la pareja que forman los estudiantes E1 y E2, aplicando la fórmula correspondiente.

coeficiente de correlacion muestral de Pearson

¿Se ve complicado? En realidad no lo es, sólo es un poco laborioso.

De la expresión anterior primero obtengamos el dividendo, posteriormente las dos partes del divisor.

Media Probl CorrelacEl dividendo se lee en lenguaje común como: La sumatoria del producto de cada dato restado a la media aritmética del grupo de datos al que pertenece, multiplicado este por el resultado de la diferencia de cada dato restado a la media aritmética del segundo grupo. ¡Uff! vaya, enredo. Te lo diré de otra manera: “Resta a cada dato la media aritmética de ese grupo de datos, haz lo mismo con el otro grupo de datos, enseguida multiplicas cada par de resultados obtenidos, y después sumas los productos”

Necesitamos pues, la Media Aritmética para cada grupo de calificaciones, misma que te muestro en la imagen de al lado.

¡No te confíes!, comprueba la Media Aritmética (o Promedio) sumando todos los datos de la columna E1 (Estudiante 1) y divide el resultado entre el número de datos. Procede igual con la columna E2.

Enseguida resta la Media aritmética a cada dato y multiplícala por su similar de la segunda columna. Al final suma todos los resultados,

La expresión te quedaría así:

op1

Ahora procedamos a calcular los resultados para cada una de las raíces del divisor:

op2

op3

Así pues, la Correlación de Pearson existente en la pareja de estudiantes E1-E2, es:

op4

Conclusión. Esta pareja de estudiantes tiene un tipo de relación inversa en sus calificaciones, es decir, mientras uno sube el otro baja y viceversa, por tal razón puede presumirse de que al no existir proporcionalidad directa en los datos entonces es menor la sospecha de que exista contubernio entre ambos. En este caso el resultado para el Coeficiente de Correlación es negativo.

excel2013Ahora analicemos la segunda pareja de estudiantes (abreviemos cálculos utilizando Excel).

Las tres operaciones indicadas anteriormente ordenadamente arrojan los siguientes resultados para la pareja E3-E4, cuyas Medias Aritméticas son: 7.625 y 8.125 respectivamente.

11.375; 2.8062; y 4.3445

Así pues…

op5

Conclusión. Esta pareja de estudiantes muestra una relación directa en sus calificaciones, el resultado es muy cercano a 1 (1 es la correlación perfecta). En este caso las calificaciones se comportan de forma directamente proporcional, es decir, cuando un estudiante sube de calificación el otro también lo hace, lo cual -Hmmmm- presume contubernio entre ambos.

Finalmente resolvamos el tercer caso. Igual agilicemos cálculos con Excel.

En este caso la Media Aritmética para el primer grupo de datos (E5) es 8.5, y la correspondiente al siguiente grupo (E6) es 8.25, y el resultado para el dividendo es:

op7

CERO, por lo cual no tiene sentido continuar con las operaciones pues al dividirlo entre cualquier cantidad el resultado finalmente será CERO.

r = 0

Conclusión. Esta pareja de estudiantes no parece tener relación en sus calificaciones, debido a que son opuestas en las diferentes materias.

Conclusión General. Si tienes que enfocar tus baterías a investigar con mayor profundidad a una pareja, la más sospechosa de hacer trampa es la formada por los estudiantes 3 y 4, ya que es la que muestra una correlación positiva, directamente proporcional en sus calificaciones.

Te dejo la imagen completa del problema.

op6final

Por otra parte… ¿Y si en lugar de parejas de estudiantes los datos correspondieran a la variación de los precios de las acciones de seis empresas que cotizan en la Bolsa de Valores, las cuales investigaste -por parejas- para ver si existía una conexión/correlación entre ellas?. En este caso como ya descubriste que cuando suben los precios de las acciones de una, de manera similar suben los de la otra empresa (pareja E3-E4) y que cuando bajan los precios de una igual sucede con los de la otra… ¿Qué deberías hacer si te dedicas al negocio de la compra-venta de acciones al observar que subieron las acciones de una empresa?, y ¿qué deberías hacer si ya viste que bajaron los precios de las acciones de la empresa “ligada” a la que compraste acciones?…

¿Funcionaría?

Bolsa de ValoresPor supuesto que en este caso, tal como está planteado el problema sí funcionaría. No obstante en los hechos, si quieres hacerte millonario comprando y vendiendo acciones en alguna de las múltiples casas ligadas a la bolsa de valores, tendrías que hacer un estudio más profundo de cada par de empresas que eligieras, que abarcara más datos, durante más tiempo. Cabe recordar además, que lo que revisamos hasta aquí es el Coeficiente de Correlación Muestral de Pearson, pero que hay otras formas de determinar correlaciones entre datos.

logo blanco


Acciones

Information

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s




A %d blogueros les gusta esto: