lunes, 15 de septiembre de 2008

1.4.2 Medidas de dispersión

Acabamos de cumplir con la primera parte que es medidas de tendencia central en lo que seria para datos no agrupados ahora veremos la segunda parte que es: Medidas de dispersión.

¿Que son las medidas de dispersión? ¿para que se utilizan?

cito de nuevo a Wikinpedia:

"Las medidas de dispersión muestran la variabilidad de una distribución, indicando por medio de un número si las diferentes puntuaciones de una variable están muy alejadas de la media . Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos.

Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma de las desviaciones es siempre cero, así que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviación Media ) y otra es tomando las desviaciones al cuadrado (Varianza)."

A continuación veremos cada uno de los elementos que comprenden o que entran en las medidas de dispersión.

La varianza

La varianza se define como la Se define como "la esperanza de la transformación" segun los estadistas.

Su formula es:



La forma reducida de esta ecuación es:

Photobucket

un ejemplo:

En una granja se mide el totla de litros diarios de leche que producen las 100 vacas en el establo> Los resultados diarios de la primera semana de mayo del 2008 fueron: 400, 435, 450,420,410,420 y 440.

Paso uno sacamos el promedio (la media) de litros diarios de leche producidos por las 100 vacas y es:

Photobucket

Lo primero que se hace para calcular la desviacion estadar es:



ahora se eleva al cuadrado:



y



Ahora sustituyendo en la formula de la varianza se obtiene:




Difícil? para nada .. ahora veamos la Desviación Estándar que es una de las medidas de dispersión.

Comprendemos que la desviación estándar es "una medida (cuadrática) que informa de la media de distancias que tienen los datos respecto de su media aritmética, expresada en las mismas unidades que la variable." (cita de wikipedia)

y se expresa como :

su formula es muy sencilla:



ponemos como ejemplo el problema anterior de las vacas, quedamos en que la desviacion media era 308.33



entonces sustituimos en la ecuacion:



y dedujimos entonces que



Esto se pone aun mas divertido cuando entramos a la desviación media que según wikipedia:

La desviación media es la media de las diferencias en valor absoluto de los valores a la media.

Confuso? ya lo creo, ya que entremos a desarrollarlo encontraremos la desviación media como un concepto muy sencillo.

Se expresa como:


Su formula reducida es:



o también :



ejemplo:

si tenemos los siguientes datos: 10,20,30,40 calcular la desviación media

lo primero que hacemos es sacar la media



Ahora sustituimos en la formula:





y sabemos que:



Aquí terminamos por cubrir las medidas de dispersión para datos no agrupados, mas adelante conoceremos dichas medidas pero en datos agrupados abarcando también los Percentiles y Cuartiles.

No hay comentarios: