1,1. Tablas de frecuencia con datos agrupados.


En Cali habitan 2.530.756 personas

El Dane sólo reveló el consolidado por áreas metropolitanas para las cinco principales ciudades del país. También precisó el número de unidades económicas y agropecuarias que hay en esta capital.

En Cali y su área metropolitana vivimos 2.530.756 personas, según el último censo general de población del Dane.

La cifra fue revelada ayer por ese organismo nacional de estadística y se consolidó para las cinco principales ciudades del país y su área metropolitana.

En el caso de Cali, la cifra incluye a la capital del Valle, Jamundí, Palmira y Yumbo.

El censo también precisa que en esta ciudad hay 680.209 hogares y que el 75% de ellos tiene, en promedio, cuatro o menos integrantes.

De igual manera, los últimos datos revelan que hay 75.996 unidades económicas (organizaciones empresariales de diverso tipo), y 11.357 unidades agropecuarias.

De acuerdo con las cifras del Dane, Cali y su área metropolitana se ubicaron como la tercera zona del país en población, después de Bogotá que tiene 7.864.490 habitantes y Medellín con 3.312.165.

Según Planeación Municipal, el crecimiento poblacional de Cali ha sido influido por la permanente inmigración de personas provenientes de diversas partes del país, especialmente del litoral pacífico de donde llega más del 60% de las personas.

De hecho, la composición general de la población caleña comporta un 39% de personas que no son nacidas en esta ciudad. (Ver gráfico)

Las cifras del censo confirmaron, igualmente, la mayoría de las mujeres (53%) sobre los hombres y la preponderancia de la población joven en la ciudad entre los 10 y 25 años de edad.

El resultado del censo del Dane está muy cerca de la proyección que había hecho Planeación Municipal para el 2005 en la capital del Valle y que era de 2.423.381 habitantes.

De acuerdo con la proyección, la población en la zona rural de Cali es de 48.369 personas.

Las cifras

- 61% de la población de Cali es nacida en esta ciudad y el resto es provenientes de otras partes del país, principalmente del Pacífico.

- 40% de la población colombiana habita en las cinco principales ciudades del país y su área metropolitana, según el censo.

- 50,8% de las viviendas rurales ocupadas con personas tienen actividades agropecuarias, con cultivos permanentes y transitorios.

PARA SOCIALIZAR:

¿QUE ASPECTOS CREES QUE INFLUYERON EN EL CRECIMIENTO DE CALI?
¿QUE ASPECTOS DE LA CIUDAD SE PUEDEN EXPRESAR EN CIFRAS?






Tablas de frecuencias con datos agrupados





- Se busca el valor máximo de la variable y el valor mínimo. Con estos datos se  determina el rango


 - Comenzando por el mínimo valor de la variable, que será el extremo inferior del primer intervalo, se suma a este valor la amplitud para obtener el extremo superior  y así sucesivamente.



Dato mayor - dato menor

Amplitud: La amplitud de un intervalo es la diferencia entre el límite superior y el límite inferior. La amplitud(A) de los intervalos puede calcularse mediante la expresión:
tablas_de_frecuencias_datos_agrupados_amplitud.jpg (273×97)
- Marca clase o centro de la clase: es la semisuma de los límites de cada clase. Representa a todos los datos que están contenidos en una clase.
- Marca clase o centro de la clase: es la semisuma de los límites de cada clase. Representa a todos los datos que están contenidos en una clase.

Frecuencia absoluta Corresponde a la cantidad de veces que se repite un dato. Denotamos este valor por fi.
 Frecuencia absoluta acumulada es la suma de las frecuencias absolutas
Frecuencia relativa Corresponde a la probabilidad de pertenecer a cierta categoría. Se puede expresar en tantos por ciento.
  
Frecuencia relativa acumulada (Hi), Es la probabilidad de observar un valor menor o igual al valor que toma la variable en estudio en ese intervalo.

Se calcula dividiendo Fi por el número total de datos.

Si haces correctamente estos cálculos, el último grupo tendrá una frecuencia acumulada de 1, o muy cerca de 1, permitiendo redondear el error.
Recuerda que este valor se puede expresar como porcentaje, para esto solo debes multiplicar el valor obtenido por 100 y listo!!!


EJEMPLO
→ Con esta información construiremos la tabla
En un centro comercial, se consultó la edad a todas las personas que entraban entre las 12:00 h y 12:30 h. Los resultados obtenidos fueron los siguientes:

tablas_de_frecuencias_datos_agrupados.jpg (416×149)

Construye una tabla de frecuencias cuyos datos estén agrupados en ocho intervalos.



QUE TENEMOS QUE HACER PRIMERO?

1. RANGO
2. AMPLITUD.
3. TABLA
tablas_de_frecuencias_datos_agrupados_2.jpg (624×288)



OTRO EJEMPLO


Y TODA LA TABLA DE FRECUENCIA DE DATOS AGRUPADOS. 
























Responder las siguientes preguntas:
a) Del total de personas encuestadas, ¿cuántas personas tienen entre 31 y 40 años?
Respuesta: Observamos los datos obtenidos en la tabla y tenemos que:

tablas_de_frecuencias_datos_agrupados_3.jpg (624×27)
El dato lo obtenemos de la columna de la frecuencia absoluta.
Recuerda que:
Frecuencia absoluta Corresponde a la cantidad de veces que se repite un dato. Denotamos este valor por fi.
Por lo tanto la respuesta es 6 personas.

b) Del total de personas encuestadas, ¿cuántas personas tienen 60 o menos años?
Respuesta: Observamos los datos obtenidos en la tabla y tenemos que:
tablas_de_frecuencias_datos_agrupados_4.jpg (624×27)

El dato lo obtenemos de la columna de frecuencia absoluta acumulada.

Recuerda que:
Frecuencia absoluta acumulada es la suma de las frecuencias absolutas observadas hasta el intervalo i.
En este caso es el intervalo 6. Por lo tanto la respuesta es 36 personas tienen 60 o menos años.

c) ¿Cuál es la probabilidad de, que al elegir al azar a un persona consultada, esta tenga entre 11 y 20 años?
Respuesta: Observamos los datos obtenidos en la tabla y tenemos que:
tablas_de_frecuencias_datos_agrupados_5.jpg (554×27)

El dato lo obtenemos de la columna de frecuencia relativa.
Recuerda que:
Frecuencia relativa Corresponde a la probabilidad de pertenecer a cierta categoría. Se puede expresar en tantos por ciento.
En este caso es el intervalo 2,  ya que es ahí donde se encuentran las edades entre 11 y 20 años.
Entonces la respuesta es: La probabilidad es  14%.


Por último vamos a repasar el concepto de:

Frecuencia relativa acumulada (Hi), Es la probabilidad de observar un valor menor o igual al valor que toma la variable en estudio en ese intervalo.

Se calcula dividiendo Fi por el número total de datos. También puedes calcularlo Sumando la frecuencia relativa de cada grupo con la frecuencia relativa acumulada del grupo anterior. 

Si haces correctamente estos cálculos, el último grupo tendrá una frecuencia acumulada de 1, o muy cerca de 1, permitiendo redondear el error.
Recuerda que este valor se puede expresar como porcentaje, para esto solo debes multiplicar el valor obtenido por 100 y listo!!!

Este cálculo te sirve en el caso de que te pregunten:

d) Si le preguntas a una persona cualquiera ¿Cuál es la probabilidad de que tenga 50 años o menos?

tablas_de_frecuencias_datos_agrupados_6.jpg (651×27)


Respuesta: La probabilidad es de un 76%



MAS DATOS



 - Se divide el rango en la cantidad de intervalos que se desea tener,(por lo general se determinan 5 intervalos de lo contrario es ideal que sea un número impar por ejemplo 5, 7, 9)  obteniéndose así la amplitud o tamaño  de cada intervalo. 

  
• Otra forma de calcular la cantidad de intervalos es aplicando los siguientes métodos:

1. Método Sturges:   k =  1 +  3,332 log n  

Donde:
k= número de clases
n= tamaño muestral

Debemos tener en cuenta 2 cosas.
·         Primero que el número de intervalos me tiene que dar impar, 
·         Segundo que el resultado se redondea generalmente a la baja. Si al redondear a la baja nos da como resultado un número par debemos redondear al alza. Este es el método que tiene mayor precisión.

2. Método Empírico: este método depende del criterio del evaluador de los datos, por lo tanto es arbitrario. Dice lo siguiente.

         5 ≥ k  ≥ 20


- Puede haber intervalos con distinta amplitud.
- Puede haber intervalos con amplitud indefinida (intervalos abiertos)
3° Ahora podemos comenzar a construir la tabla de frecuencias:
Hay distintas formas de construir los intervalos dependiendo del tipo de variable que estemos trabajando.
a) Variables cuantitativas discretassolo pueden tomar un número finito de valores. Siendo por lo general estos valores los números naturales 1, 2, 3...Un ejemplo son el número de hijos, el número de habitaciones de una vivienda, el número de matrimonios de una persona. Cuando categorizamos variables discretas los límites de clase son idénticos a los límites reales. Por ejemplo, el número de personas que viven en una familia podemos agruparlo, De 1 hasta 2 (0 es imposible no hay ninguna familia sin ningún miembro) De 3 hasta 4, De 5 hasta 7.
b) Variables cuantitativas continuas: Las variables continuas, por el contrario, pueden, tomar un número infinito de valores en cualquier intervalo dado. En este caso los valores se agrupan en intervalos cuyos límites inferior y superior serían los siguientes:
Inferior: Li
Superior: Lsi-1

Habitualmente, los intervalos se consideran cerrados a la izquierda y abiertos a la derecha, es decir que el extremo inferior está incluido en el intervalo, pero el extremo superior no.
Es importante mencionar que las clases o intervalos para las variables continuas pueden ser de tres tipos:
Abiertas: clases abiertas tienen límites determinados (a,b ), pero los valores que la contienen comprenden valores muy cercanos a estos límites sin comprenderlos a ellos mismos, esto se representa con un intervalo definido entre paréntesis (). Esto quiere decir que esta clase contiene valores desde a hasta b pero no contiene exactamente a ni b solo valores muy cercanos.
Cerradas: las clases cerradas, además de los valores que están entre a y b, los contiene a ellos, y se representa con corchetes [a, b].
Semiabiertas: pueden contener a o b más los valores que están entre ellos, y se puede representar con un corchete y un paréntesis, por ejemplo, (a,b], en este caso no contiene el valor a y si los valores de  b, además de los valores que están entre estos.

C) Registro discretos de variables continuas: Cuando la variable considerada es continua pero ocurre que la precisión del instrumento de medida se limita a un número finito de datos, existe la opción de construir los intervalos de tal forma que ambos extremos estén incluidos en él. 


3. Ejemplo: Un grupo de atletas se está preparando para una maratón siguiendo una dieta muy estricta. A continuación, viene el peso en kilogramos que ha logrado bajar cada atleta gracias a la dieta y ejercicios.
0,2
8,4
14,3
6,5
3,4
4,6
9,1
4,3
3,5
1,5
6,4
15,2
16,1
19,8
5,4
12,1
9,6
8,7
12,1
3,2
Elaborar una tabla de frecuencias con dichos valores.
Solución:
·         Hallamos el rango: R = Xmax– Xmin = 19,8 – 0,2 = 19,6.
·         El número de intervalos (k), lo calculamos usando la regla de Sturges: k = 1 + 3,322log(n) = 1 + 3,322.log(20) = 5,32. Podemos redondear el valor de k a 5
·         Calculamos la amplitud de clase: A = R/k = 19,6/5 = 3,92. Redondeamos a 4.
·         Ahora hallamos los límites inferiores y superiores de cada clase, y elaboramos la tabla de frecuencias.
Intervalo
Marca de clase
Frecuencia absoluta
Frecuencia acumulada
Frecuencia relativa
Frec. relativa acumulada
[0 – 4)
2
5
5
0,25
0,25
[4 – 8)
6
5
10
0,25
0,50
[8 – 12)
10
4
14
0,20
0,70
[12 – 16)
14
4
18
0,20
0,90
[16 – 20]
18
2
20
0,10
1
Total
20
1