Tópicos de Estadística.

26 03 2015

Tema 8. Moda. 

Una guapa mujer vestida estrafalariamente

Has escuchado a alguien decir: “De la moda lo que te acomoda”. Mi madre fue costurera, así que la frase era bastante común en mi casa. Si eres mujer y quieres lucir bien, o si eres hombre y quieres llamar la atención de las mujeres, te conviene poner en práctica el pensamiento anterior. 

En cuestión de ropa la Moda se refiere a la repetición de una forma de vestir por la sociedad, y en Estadística la Moda es el valor que más se repite en un conjunto de Datos. Así que… relación entre la Moda Estadística y otras modas sí que la hay. 

Si quieres determinar la Moda en un conjunto de Datos sólo busca el que más se repite en ellos y san se acabó.

ModaPor ejemplo en el siguiente conjunto ordenado de Datos: 2, 5, 7, 7, 7, 8, 8, 10, 10, 12, el Dato que más se repite es el 7, pues bien el 7 es la Moda.

La Moda junto con la Media Aritmética y la Mediana forman el trío de Medidas de Tendencia Central más utilizadas para encontrar un valor representativo de un conjunto de Datos.

Si tienes pocos Datos es fácil encontrar la Moda por simple inspección de los mismos, pero si tienes un gran volumen lo mejor es ordenarlos y contar las repeticiones. Obvio, si quieres evitar errores al contar puedes dejar todo en “manos” de programas como Excel o Statistics Calculator Pro (y otros similares). Utilizando software no requieres ordenar los Datos.

khan-logo-vertical-transparent1Te recomiendo que veas el siguiente video de Khan Academy de poco menos de cuatro Minutos en el que un instructor te resuelve un problema sencillo de cálculo de la Media, Mediana y Moda de un conjunto de Datos.

Bien… menos “rollo” y más acción, vayamos directamente a un problema. Para hacerlo un poco más completo determinemos las tres Medidas de Tendencia Central, y comparémoslas entre sí.

Problema. La siguiente tabla muestra las estaturas en Metros de 48 estudiantes…

Estaturas

Determinar:

A). Las estaturas mayor y menor existentes en el grupo.
B). La Moda.
C). La Mediana.
D). La Media.
E). De los tres valores anteriores según tu criterio; ¿Cuál es el más representativo de la estatura de los 48 estudiantes?.

Solución… Leer el resto de esta entrada »





Tópicos de Estadística.

23 03 2015

Tema 7. Mediana. 

MedianaMediana. Es el valor que está posicionado exactamente al centro de un conjunto de Datos ordenados. 

A diferencia de la Media Aritmética que intenta encontrar mediante operaciones matemáticas el valor intermedio y equilibrado de un conjunto de Datos, la Mediana es una Medida de Tendencia Central que en esencia busca lo mismo, pero apoyándose en la posición que guardan éstos.

En la determinación de la Mediana pueden presentarse dos situaciones… 

Cazo1Si el conjunto de Datos ordenados es impar, siempre existirá un Dato colocado exactamente al centro de todos, el cual determinas visualmente en base a su posición, o mediante la fórmula: (N+1)/2, en donde N es el total de Datos.

Por ejemplo en el siguiente conjunto de Datos ordenados: 10, 12, 13, 16, 18. Por simple inspección observamos que el 13 está exactamente al centro de los mismos, por lo tanto el 13 es la Mediana. Pero igual, si aplicamos la fórmula (N+1)/2, al sustituir N=5, dado que son cinco Datos, quedaría: (5+1)/2=6/2=3. Por lo tanto el Dato que corresponde a la Mediana es el que ocupa la tercera posición, el 13 por supuesto. La fórmula es aplicable con pocos o con muchos Datos, pero es lógico suponer que tendrá mayor aplicación cuando el volumen de éstos sea mayor.

Cazo2Si el conjunto de Datos ordenados es par, siempre existirán dos de ellos colocados al centro, en tal caso para determinar su posición puedes hacerlo o bien visualmente, o también mediante las fórmulas: N/2; (N/2)+1. Después que realizas las operaciones para obtener las posiciones de los dos Datos, los localizas y obtienes el promedio de ambos.

Por ejemplo en el siguiente conjunto de Datos ordenados: 11, 12, 14, 18, 19, 20. Por simple inspección localizamos que el 14 y el 18 están exactamente al centro, por lo tanto la Mediana será: (14+18)/2=32/2=16. Pero igual, si aplicamos la fórmula: N/2, al sustituir N=6, dado que son seis Datos, quedaría: 6/2=3. Por lo tanto un Dato corresponde a la tercera posición, el 14 por supuesto. El otro Dato se determina aplicando la formula (N/2)+1, (es igual si sumas 1 al resultado anterior) quedaría: (6/2)+1=3+1=4. Por lo tanto el segundo Dato es el que está en la cuarta posición, el 18 por supuesto.

A veces los valores de la Mediana y la Media Aritmética coinciden.

Por ejemplo en el siguiente conjunto de Datos ordenados: 8, 10, 14, 18, 20. En este caso la Media Aritmética y la Mediana coinciden en el número 14, pero… como dijo el insigne poeta Cachirulo: “A veces sí, a veces no”

Ahora resolvamos un problema con un mayor volumen de Datos. Leer el resto de esta entrada »





Tópicos de Estadística.

20 03 2015

MEDIDAS DE TENDENCIA CENTRAL

¿Qué son las Medidas de Tendencia Central?.

Orando a Santa WikipediaSanta Wikipedia las define así…. 

Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina medida o parámetro de tendencia central o de centralización. Cuando se hace referencia únicamente a la posición de estos parámetros dentro de la distribución, independientemente de que ésta esté más o menos centrada, se habla de estas medidas como medidas de posición. En este caso se incluyen también los cuantiles entre estas medidas.

Entre las medidas de tendencia central tenemos:

Media
Media Ponderada
Media Geométrica
Media Armónica
Mediana
Moda
……………………………………

Considero que no hay mucho que agregar al concepto anterior, me parece que está bastante claro. Esta vez Wikipedia fue muy precisa al respecto. No obstante, simplificando más todavía: Medidas de Tendencia Central son los resultados obtenidos a partir de operaciones realizadas sobre un grupo de Datos, mismos que “tienden” al valor central de la serie.

Así pues… vayamos directamente al primer tema de dichas medidas.

Tema 6. Media Aritmética. 

Media Aritmética¿Qué es la Media Aritmética? Nada más simple… de hecho la utilizas frecuentemente por ejemplo cuando obtienes el promedio de tus calificaciones. La Media Aritmética es el valor numérico considerado como el punto de “equilibrio”, o el “Centro de Gravedad” de tus Datos. A veces está colocada exactamente al centro de todos tus Datos ordenados (p. ej. 6, 7, 8, 9, 10). A veces es cualquiera de ellos (p. ej. 7, 7, 7, 7, 7), y otras veces no (p. ej. 6, 7, 8, 8, 9: 7.6): De cualquier manera la Media Aritmética es el valor representativo de TODOS tus Datos.

A la Media Aritmética también se le conoce como: Promedio o simplemente Media, y se representa con una X testada. 

Veamos un ejemplo sencillo. Leer el resto de esta entrada »





Tópicos de Estadística.

18 03 2015

Tema 5. ¿Redondear o Recortar?. He ahí el dilema.

¿Qué sucedería si en lugar de redondear un número -como hicimos en el problema anterior- lo recortamos?.

Nota. Entiéndase por “redondear” un número a la elección del entero inmediato superior, y por “recortarlo” a la elección del entero inmediato inferior. 

Redondear o Recortar

En el problema anterior teníamos dos opciones: 

Método de la Raíz cuadrada. Cantidad de Clases = √N = √72 = 8.48
Regla de Sturges. Cantidad de Clases = 1+3.322 Log N = 1+(3.322)(Log 72) = 7.17.

Para resolver el problema escogimos el Método de la Raíz Cuadrada, redondeamos el resultado y obtuvimos 9 Intervalos de Clase. No obstante ¿si recortáramos a 8 obtendríamos la misma solución?. La lógica dice que no, pero…

La respuesta a ésta interesantísima cuestión está en los profundos versos del ilustre matemático, filósofo y poeta Cachirulo de la Fontaine que dicen así

Me preguntas si te digo la verdad…
Mi verdad es como la Estadística,
A veces sí, a veces no.

Así pues… quizás lleguemos a la misma solución del problema pero tenemos que comprobarlo, entonces continuemos hasta descubrirlo.

Por lo general al redondear cualquiera de los resultados anteriores el problema se resuelve sin contratiempos, es decir, no hay obstáculos en el camino, pero cuando recortamos números a veces es necesario agregar otra clase a las que obtuvimos por cualquier método.

Pero… Al diablo con las explicaciones, veamos un ejemplo para que lo entiendas “más mejor”. ¡Ja!

Retomemos el problema anterior en la determinación del Número/Cantidad de Clases.

Obtuvimos 8.48 por el método de la Raíz Cuadrada, “recortémoslo” a 8. Entonces en teoría, como solución del problema el gráfico (Histograma) tendría 8 barras. Comprobémoslo, continuemos el procedimiento… Leer el resto de esta entrada »





Tópicos de Estadística.

15 03 2015

Tema 4. Tablas de Frecuencia.

Clasificando datosEn el tema anterior construimos una Tabla de Frecuencias básica, esta vez realizaremos una más amplia, que incluya además de los Intervalos de Clase y de la Frecuencia Absoluta, elementos como: Marcas de Clase, Frecuencia Absoluta Acumulada, Frecuencia Relativa y la Frecuencia Relativa Acumulada. A partir de la misma realizaremos un gráfico de barras (Histograma).

La Tabla de Frecuencias que llenaremos estará conformada de la siguiente manera…

Tabla de Frecuencias

Primero entendamos cada elemento/columna, definamos qué tipo de operaciones tendrás que realizar en cada caso.

Clases, Intervalos y Amplitud de Clases: Relacionados entre sí, son los “niveles” y “espacios” numéricos en los cuales acomodarás tus Datos. Por ejemplo, una Clase/Intervalo de [15-20) significa que buscarás entre tus Datos todos los números 15, 16, 17, 18, y 19. ¿Y el 20? Un paréntesis después de un número en una Clase -como es el caso del 20) indica valores menores de él. Usualmente los paréntesis expresan que el valor mostrado no se incluye, mientras que un corchete si lo contiene. Por ejemplo el siguiente intervalo: [12-16] significa que buscarás entre tus Datos los números: 12, 13, 14, 15 y 16, o si hubiese enteros con decimales entre el 12 y el 16 por ejemplo 13.6, 12.9, etc., también estarían incluidos.

Marca de Clase (MC). Se refiere al valor medio de cada Intervalo de Clase. Por ejemplo el siguiente Intervalo: [20-25). La Marca de Clase sería (20+25)/2 = 22.5; y si el Intervalo fuera: [32-38] la Marca de Clase sería: (32+38)/2 = 35

Frecuencia Absoluta (Fa). Es la cantidad de Datos que “caen” dentro de un Intervalo. Por ejemplo, si el Intervalo es: [24-26) y todos tus Datos son: 14, 20, 26, 24, 23, 18, 25, 24, 30, 25. Al contar resultan cuatro Datos para el Intervalo mencionado, así pues anotarías en la columna de Frecuencia Absoluta (Fa) el número 4. Leer el resto de esta entrada »





Tópicos de Estadística.

10 03 2015

Tema 3. ¿Cómo manejar tus datos para hacer estadísticas?

Primero debes ordenar tus Datos, después debes acomodarlos en una Tabla de Distribución de Frecuencias y a partir de ella realizar gráficos. Por supuesto que todo lo anterior carece de sentido si no obtienes conclusiones a partir de lo que hiciste, siempre debes tener presente que lo que busca la estadística es sacar a la luz lo que tus datos ocultaban.

EstadDescrEl orden de los Datos puede ser de mayor a menor o viceversa, el acomodo de los mismos se realiza en una Tabla de Distribución de Frecuencias (o también llamada simplemente: Tabla de Frecuencias) y para graficarlos puedes hacerlo mediante un Histograma (gráfico de barras vertical u horizontal), un Polígono de Frecuencias, un gráfico circular etc. Todo lo anterior puedes hacerlo “manualmente” en tu cuaderno, o utilizando software. 

¿Qué es una Tabla de Frecuencias?

En Estadística (igual que en Microsoft Word u Open Office Writer) una Tabla es un formato cuadriculado compuesto de renglones y columnas, en donde los espacios que se forman sirven para acomodar tus datos. El tamaño de la Tabla dependerá del número de datos que tengas.

El siguiente formato es el principio de una Tabla de Frecuencias, más adelante la ampliaré.

Tabla Simple de Distribución de Frecuencias 

En la Tabla mostrada aparecen algunos nombres que conviene aprendas su significado…

Frecuencia (o Frecuencia Absoluta. Fa) es la cantidad/número de Datos que “cae/n” dentro de ciertos límites.

En estadística una Clase es la categoría/nivel en el que “cae/n” uno o varios datos. En una Tabla -por pequeña que sea- existen varios niveles o Intervalos de Clases.

¿Qué son los Intervalos de Clase?. Es el espacio numérico dentro del cual se acomodan los datos.

Los Intervalos de Clase a veces se consideran sinónimos de Rango, no obstante este último es la diferencia entre el valor más grande de todos tus datos, y el menor de ellos.

Pero… menos teoría, resolvamos un problema sencillo. Leer el resto de esta entrada »





Tópicos de Estadística.

6 03 2015

Tema 2. ¿En dónde se aplica la Estadística?.

En cualquier lugar en donde se requiera concentrar datos, ordenarlos de acuerdo a las necesidades, mostrarlos gráficamente y a partir de ello sacar conclusiones que permitan al observador decidir algo o simplemente reafirmar su criterio, ahí tiene su aplicación la Estadística.

Piece of a Piece of the PieTú, como alumno, sin saberlo aplicas Estadística. Por ejemplo cuando obtienes el promedio de tus calificaciones de un semestre, o de una evaluación parcial. Para hacerlo sumas todas tus calificaciones y divides el resultado entre el total de materias que sumaste, eso técnicamente se llama Media Aritmética, Promedio, o simplemente Media, y forma parte de las denominadas Medidas de Tendencia Central. El valor que obtienes te da una idea del aprovechamiento que has tenido en todas tus materias y al mismo tiempo es un dato que te ayuda a decidir si continúas por el mismo camino, o si tienes que rectificar. La gente común también utiliza la Estadística sin saberlo por ejemplo cuando la mayoría se viste con pantalón de mezclilla, al hacerlo siguen una moda, y la Moda en Estadística es justamente el valor que más se repite en un conjunto de datos. Etc. Es decir, a veces hacemos cosas sin darnos cuenta, mismas que forman parte de una ciencia o de una técnica.

Los siguientes son ejemplos de aplicaciones de la Estadística.

Una madre de familia que aunque no sepa matemáticas (ni Estadística) tiene perfectamente claro cuánto gastará diariamente en promedio en su casa, de ésta forma concluye cuánto gastará en una semana o en un mes. Eso lo supo por experiencia, porque aunque no hiciera un registro del gasto diario en papel -o en computadora-, mentalmente sí lo estuvo realizando.

Los gobiernos del mundo saben cuál es el índice de nacimientos en un año en su país, e igual saben con aproximación cuántas personas morirán y el promedio de edad en que lo harán. Ello les permite establecer mecanismos de atención a futuro de los habitantes.

En México el Instituto Nacional de Estadística, Geografía e Informática, INEGI, se encarga de concentrar diferentes datos y a partir de ello realizar estadísticas en varios sectores del país como son: el sector agrícola, el económico, el comercial, etc..  Leer el resto de esta entrada »








Seguir

Recibe cada nueva publicación en tu buzón de correo electrónico.

Únete a otros 1.418 seguidores