CAPÍTULO
2.- CONCEPTOS ESTADÍSTICOS FUNDAMENTALES
Población estadística.
La Distribución de Frecuencias
Vimos que una Población o Universo de datos es un conjunto
muy grande de números. Estos números pueden estar
en un gran listado o puede ser un conjunto hipotético,
es decir, podemos imaginar los números pero no los tenemos
realmente. Una gran tabla de números ordenados al azar
prácticamente no nos muestra información acerca
de la población de datos. Suponiendo que disponemos de
los datos del universo, ¿cómo podemos clasificar
y ordenar los números para obtener más información
acerca de ese universo de datos?.
Una forma sería escribir los números desde el
menor hasta el mayor y colocar encima de cada uno tantas cruces
o cuadraditos como veces que figure repetido en la población.
El número de veces que aparece repetido cada dato es
la frecuencia de dicho valor. La representación gráfica
que hemos visto se denomina Distribución de Frecuencias
de la población.
La
representación gráfica nos permite ver
información que antes no aparecía tan
evidente. Por ejemplo, sin hacer ningún cálculo
nos damos cuenta donde está aproximadamente el
promedio de la población.
También nos muestra cuales son los valores máximo
y mínimo de la población, es decir, el
rango o recorrido. |
 |
En el caso anterior, los datos de la población son números
enteros. Cuando los números no son enteros o cuando tenemos
un número muy grande de datos, se divide el rango total
en subintervalos y se cuenta el número de valores que
cae dentro de cada subintervalo.
Vamos a suponer, ahora, que tenemos una cierta población
de N = 500 datos, por ejemplo el peso de varones adultos de
40 años. Una manera de caracterizar esta población
es construir una distribución de frecuencias o gráfico
de frecuencias. Para ello seguimos los pasos siguientes:
1) Tomamos nota del valor máximo y el valor mínimo
de la serie de datos que estamos considerando.
2) Subdividimos el intervalo entre el máximo y el mínimo
en algún número de intervalos (15 ó 20)
mas pequeños iguales entre sí.
3) Contamos el número de datos que encontramos dentro
de cada intervalo (Frecuencia). Por ejemplo, supongamos que
en el intervalo i hay ni observaciones (S*ni
= N).
4)Para construir el gráfico, colocamos en el eje de abcisas
(Horizontal) los intervalos y levantamos en cada intervalo un
rectángulo de altura proporcional al número ni
de datos dentro del mismo.
Si hacemos el área del rectángulo levantado sobre
el intervalo i-ésimo igual a la frecuencia relativa ni/N,
el área total bajo el histograma será igual a
la unidad:

Obtenemos así un histograma que nos muestra la distribución
de frecuencias de la población:

Esta distribución de frecuencias nos muestra si hay resultados
que son mas frecuentes que otros; si los valores están
ubicados alrededor de un valor central, si están muy
dispersos o poco dispersos. Podemos observar que fracción
de todas las mediciones cae por ejemplo, entre 70 y 80 Kg.
Si elegimos una persona del grupo y la pesamos, el resultado
es un dato que pertenece a la población de datos representada
en el gráfico. Decimos, entonces, que estamos extrayendo
un dato de la población de datos. Pero hay distintas
maneras de elegir la persona, es decir, distintas maneras de
realizar la extracción del dato.
Si nos paramos frente al grupo y elegimos una persona, estaremos
seleccionando al más gordo, al más flaco o al
más alto (y por lo tanto pesa más que otros),
de acuerdo a criterios subjetivos que no podemos evitar. En
cambio, si escribimos los nombres de todas las personas en una
etiqueta, metemos todas las etiquetas en una caja y luego le
pedimos a alguien que retire una etiqueta, la selección
no estará influida por nuestra subjetividad. En este
caso, decimos que la extracción es aleatoria.
Una extracción aleatoria es aquella en que cada miembro
de la población tiene la misma posibilidad de ser elegido.
|
|