Jupyter notebook ESTADÍSTICA DESCRIPTIVA 1 .ipynb
ESTADISTICA DESCRIPTIVA
ANALISIS ESTADISTICO
La exposición que en este apartado se presenta sobre estadística pretende solo dar a conocer los términos utilizados en las diferentes pruebas de corte estadístico que se tratarán en los capítulos posteriores, presentando algunos conceptos, buscando que se comprenda el vocabulario básico, los conceptos utilizados, su aplicación y cómo realizar trabajos estadísticos de una manera sencilla. La investigación educativa generalmente trabaja dos tipos de datos estadísticos: - Análisis estadístico descriptivo. La estadística descriptiva proporciona información acerca de la naturaleza de un grupo en particular por medio de una descripción numérica, los datos sólo describen a este grupo.
• Análisis estadístico deductivo. La estadística deductiva se basa sobre un pequeño grupo denominado muestra que se supone representativo de un grupo más numeroso denominado población o universo para un estudio. Para que la muestra sea representativa de su población o universo debe ser sometida a un procedimiento riguroso de muestreo y los hallazgos que se encuentren sólo son aplicables a la población de donde se extrajo.
1.1** Medidas descriptivas**
1.1.1 Medidas de tendencia central Se refieren valores como promedios, puntuaciones o series de características, definiendo a los grupos de datos en términos de alguna medida que se halla próxima al centro de la distribución y que la puede tipificar. Las más utilizadas son
MEDIA
La media es la medida más usada para encontrar el promedio. De hecho, la gente siempre utiliza la palabra "promedio" para referirse a la "media." Encontrarla es simple: solo suma todos los números en los datos y divídelos por la cantidad de números.
Ejemplo 1 : Calcular la media de los siguientes datos: (46, 54, 42, 46, 32)
MEDIANA
Es otra medida de localización central. Es el valor de enmedio en los datos ordenados de menor a mayor (en forma ascendente). Cuando tiene un número impar de observaciones, la mediana es el valor de enmedio. Cuando la cantidad de observaciones es par, no hay un número enmedio. En este caso, se sigue una convención y la mediana es definida como el promedio de las dos observaciones de enmedio. Apliquemos esta definición para calcular la mediana del número de alumnos en un grupo a partir de la muestra de los cinco grupos de universidad. Los datos en orden ascendente son: (32,42,46,46,54); Como n = 5 es impar, la mediana es el valor de enmedio. De manera que la mediana del tamaño de los grupos es 46. Aun cuando en este conjunto de datos hay dos observaciones cuyo valor es 46, al poner las observaciones en orden ascendente se toman en consideración todas las observaciones.
MODA
medida de posición que se localiza por medio de la observación de los datos o con el valor que aparece más a menudo en la columna de frecuencias. Puede presentarse en ocasiones que algunas distribuciones de frecuencia contengan dos o más modas, cuando presentan dos modas se conocen como bimodales.
1.1.2 Medidas de dispersión
Las medidas de dispersión representan un complemento de las medidas de tendencia central, es por esto que se requiere de un índice que determine cómo están diseminados los puntajes alrededor del centro de la distribución, las medidas de dispersión que se requieren para los análisis estadísticos que se utilizan en los capítulos posteriores son: el rango, la desviación media y la desviación estándar. Las medidas de tendencia central (media, moda y mediana), representan un solo valor, un promedio de una distribución, por eso cuando se utiliza cualquier medida de tendencia central, sólo se obtiene un cuadro completo de un conjunto de datos, que puede conducir a conclusiones equivocadas
Ejemplo 2: ¿Merece la pena estudiar para un examen?
A=(2,5,1,4,2) horas de estudio
B=(80,90,70,90,60) calificaciones
Encontrar: la media y la mediana de las dos variables e interpretar los resultados!
Conclusión:
Se observa que el valor de la media para la variable A indica que el promedio de horas de estudio son 2.8 horas y para la variable B la calificacion promedio es de 78.
Resulta evidente que las medidas de tendencia central no describen en su totalidad el comportamiento del rendimiento de los grupos, por lo que se requiere complementarlas con las medidas de dispersión para comparar los rendimientos de los grupos El rango (R). En algunos textos se le designan también los nombres de Amplitud total o gama, consiste en determinar la diferencia entre el puntaje más alto y el más bajo de la distribución. El rango depende de solo dos valores de puntaje, como consecuencia solo da un índice no procesado de la dispersión de la distribución. - Rango = Puntuación más alta - Puntuación más baja
La desviación típica o estándar (d): Es el resultado que se obtiene de la raíz cuadrada de la suma de las desviaciones de la media de una distribución elevada al cuadrado.
Conclusión
La desviación estándar o típica representa la variabilidad promedio de una distribución, puesto que mide el promedio de las desviaciones de la media, se puede deducir que mientras mayor sea la dispersión alrededor de la media en una distribución, mayor será la distribución estándar, tal es el caso de la desviación estándar de los estudiantes que dedicaron horas A para estudiar y B calificaciones de acuerdo a lo estudiado donde dA = 1.63 mientras que dB = 13.03 La desviación típica también permite determinar el puntaje directo que está situado exacta- mente a una desviación estándar de la media.