Breve Resumen
Este video introduce los parámetros de dispersión, que miden cómo de separados están los datos en una variable estadística. Se explican el rango, la desviación media, la varianza, la desviación típica y el coeficiente de variación, junto con sus fórmulas y cómo calcularlos. Se proporciona un ejemplo práctico utilizando las notas de una clase para ilustrar el cálculo de estos parámetros.
- El rango se calcula restando el valor mínimo al valor máximo de los datos.
- La desviación media es el promedio de las distancias de cada dato a la media.
- La varianza mide la dispersión de los datos alrededor de la media.
- La desviación típica es la raíz cuadrada de la varianza.
- El coeficiente de variación permite comparar la dispersión entre diferentes variables estadísticas.
Introducción
El video comienza introduciendo los parámetros de dispersión, que son herramientas estadísticas utilizadas para medir cómo de dispersos o separados están los datos de una variable estadística. Estos parámetros incluyen el rango, la desviación media, la varianza y la desviación típica. El video se enfoca en cómo calcular estos parámetros para tablas de datos simples, y menciona que en un video posterior se abordará el cálculo para tablas de datos agrupados en intervalos, utilizando las marcas de clase como los datos.
Rango o recorrido
El rango, también conocido como recorrido, es el primer parámetro de dispersión que se presenta. Se define como la diferencia entre el dato mayor y el dato menor en un conjunto de datos. Es una medida sencilla de la dispersión total de los datos, indicando la amplitud del intervalo en el que se encuentran los valores.
Desviación media
La desviación media es el segundo parámetro de dispersión explicado. Se define como la media de las distancias absolutas de cada dato a la media del conjunto de datos. La fórmula para calcularla es la suma de los valores absolutos de las diferencias entre cada dato (x sub i) y la media (x̄), multiplicados por su frecuencia (f sub i), todo dividido por el número total de datos (n). Este parámetro proporciona una medida de la dispersión promedio de los datos alrededor de la media.
Varianza
La varianza es un parámetro de dispersión que mide cómo de separados están los datos con respecto a la media. Se denota por "Var" y se calcula mediante la fórmula: la suma de (x sub i - la media de x) al cuadrado, multiplicado por f sub i, todo dividido por el número total de datos (n). Aunque esta fórmula es útil para entender el concepto, para el cálculo práctico se utiliza una fórmula alternativa: la suma de (x sub i al cuadrado * f sub i) dividido por n, menos la media de x al cuadrado.
Desviación típica
La desviación típica es otro parámetro de dispersión que se deriva directamente de la varianza. Se denota por "DT" y se calcula simplemente como la raíz cuadrada de la varianza. La desviación típica proporciona una medida de la dispersión de los datos en las mismas unidades que los datos originales, lo que facilita su interpretación.
Coeficiente de variación
El coeficiente de variación (CV) es un parámetro que permite comparar la dispersión entre diferentes variables estadísticas. Se denota por "CV" y se calcula dividiendo la desviación típica entre la media. Este coeficiente es útil porque es adimensional, lo que significa que no depende de las unidades de medida de los datos, permitiendo comparaciones entre conjuntos de datos con diferentes unidades o escalas.
Ejemplo de cálculo de los parámetros de dispersión
Se presenta un ejemplo práctico para calcular los parámetros de dispersión utilizando las notas de los alumnos en un examen. Se muestra una tabla con los datos y sus frecuencias absolutas. Primero, se calcula el rango restando el dato menor (0) del dato mayor (10), resultando en un rango de 10. Luego, se explica que para calcular la desviación media, la varianza y la desviación típica, es necesario calcular previamente la media. Se añade una columna a la tabla con los productos de x sub i por f sub i, se suman estos productos y se divide entre el número total de datos (20) para obtener la media, que es 5.6.
A continuación, se calcula la desviación media añadiendo una columna con el valor absoluto de la diferencia entre cada x sub i y la media (5.6). Luego, se multiplica esta columna por las frecuencias absolutas (f sub i) y se suman los resultados. Este valor se divide entre el número total de datos (20) para obtener la desviación media, que es 2.04.
Para calcular la varianza, se utiliza la fórmula alternativa. Se añade una columna con los valores de x sub i al cuadrado multiplicados por f sub i, se suman estos valores y se divide entre el número total de datos (20). A este resultado se le resta la media al cuadrado (5.6^2) para obtener la varianza, que es 6.44.
Finalmente, se calcula la desviación típica como la raíz cuadrada de la varianza, resultando en 2.54. También se calcula el coeficiente de variación dividiendo la desviación típica (2.54) entre la media (5.6), obteniendo un valor de 0.45.