III.- ORGANIZACIÓN Y PRESENTACION DE DATOS

 ORGANIZACIÓN DE DATOS

¿QUÉ SON LOS DATOS?

Los datos representan la información que ofrece acceso a un conocimiento preciso y concreto. Su organización es importante para un análisis adecuado y su representación grafica.

¿CÓMO SE ORDENAN LOS DATOS?

DIAGRAMA DE TALLO Y HOJAS

El diagrama de tallos y hojas permite obtener una distribución de frecuencias y su representación gráfica de manera simultánea. Se separa cada punto de datos en una "hoja" (normalmente el último dígito) y un "tallo" (el dígito o dígitos principales). 

Por ejemplo:


Éste es un diagrama de tallos y hojas que muestra gráficamente el conteo del número de pares de botas en cada una de las tiendas de una cadena que vende zapatos, la cual se basa en los datos: 17, 18, 20, 25, 28, 34, 34, 37, 38 y 50.

TABLA DE FRECUENCIAS

Herramienta que permite organizar los datos de una muestra estadística, agrupándolos en intervalos y clases para facilitar su análisis.

ELEMENTOS DE LA TABLA DE FRECUENCIAS

  • FRECUENCIA ABSOLUTA (fi)

Es el número de veces que aparece un valor. La suma de las frecuencias es igual al número total de datos.

  • FRECUENCIA RELATIVA (hi)

Se  determina  al  dividir  la frecuencia absoluta entre el número total de datos. La suma de todas las frecuencias es igual a 1.

  • PORCENTAJE (pi)

Se obtiene multiplicando la frecuencia relativa por 100.

  • FRECUENCIA ABSOLUTA ACUMULADA (FI)

Es la suma de frecuencias absolutas de todos los valores numéricos.

  • FRECUENCIA RELATIVA ACUMULADA (HI)

Se obtiene al dividir la frecuencia acumulada entre el número total de datos.

  • PORCENTAJE ACUMULADO (PI)

Se multiplica la frecuencia relativa acumulada por 100.

¿COMO SE ELAVORA UNA TABLA DE FRECUENCIAS?


1.- PARA DATOS PEQUEÑOS

Queremos estudiar la talla de zapato de los alumnos de una clase, obteniendo los siguientes datos:

38  38  38  40  35  39  37  37  40  37  36  35  36  40  40  42  41  42  30  41  38  39  35  36  42  42  

Datos ordenados:

35  35  35  36  36  36  37  37  37  38  38  38  38  39  39  39  40  40  40  40  41  41  42  42  42  47

FRECUENCIA ABSOLUTA (fi)

  • FRECUENCIA RELATIVA (hi)

(fi/total = hi)

3/ 26 = 0.1153
3/ 26 = 0.1153
3/ 26 = 0.1153
4/ 26 = 0.1538
3/ 26 = 0.1153
4/ 26 = 0.1538
2/ 26 = 0.769  
4/ 26 = 0.1538

0.1153 + 0.1153 + 0.1153 + 0.1538 + 0.1153 + 0.1538 + 0.769 +0.1538 = 1

  • PORCENTAJE (pi)

(hi x 100 = pi)

0.1153 x 100 = 11.53%
0.1153 x 100 = 11.53%
0.1153 x 100 = 11.53%
0.1538 x 100 = 15.38%
0.1153 x 100 = 11.53%
0.1538 x 100 = 15.38%
0.769 x 100 = 7.69% %
0.1538 x 100 = 15.38%

11.53% + 11.53% + 11.53% + 15.38% + 11.53% + 15.38% + 7.69% + 15.38% = 100%

  • FRECUENCIA ABSOLUTA ACUMULADA (FI)

(fi + numero anterior = FI)

3 = 3 (El primer numero se coloca igual)
3 + 3 = 6
3 + 6 = 9
4 + 9 = 13
3 + 13 = 16
4 + 16 = 20
2 + 20 = 22
4 + 22 = 26

  • FRECUENCIA RELATIVA ACUMULADA (HI)

(hi + numero anterior = HI)
0.1153 = 0.1153 (El primer numero se coloca igual)
0.1153 + 0.1153 = 0.2307
0.1153 + 0.2307 = 0.3461
0.1538 + 0.3461 = 0.5
0.1153 + 0.5 = 0.615
0.1538 + 0.6153 = 0.7692
0.769 + 0.7692 = 0.8461
0.1538 + 0.8461= 1

  • PORCENTAJE ACUMULADO (PI)

(pi + numero anterior = PI)

11.53% = 11.53% (El primer numero se coloca igual)
11.53% + 11.53% = 23.07%
11.53% + 23.07% = 34.61%
15.38% + 34.61% = 50%
11.53% + 50% = 61.5%
15.38% +  61.5% = 76. 92%
7.69% + 76. 92% = 84.61%
15.38% + 84.61% = 100%

TABLA DE FRECUENCIAS TERMINADA

Xi

fi

hi

pi

FI

HI

PI

35

3

0.1153

11.53%

3

0.1153

11.53%

36

3

0.1153

11.53%

6

0.2307

23.07%

37

3

0.1153

11.53%

9

0.3461

34.61%

38

4

0.1538

15.38%

13

0.5

50.0%

39

3

0.1153

11.53%

16

0.615

61.5%

40

4

0.1538

15.38%

20

0.7692

76.92%

41

2

0.769

7.69%

22

0.8461

84.61%

42

4

0.1538

15.38%

26

1

100.0%

TOTAL

26

1

100%

 

 

 


2.- PARA DATOS GRANDES

Elabora Una Distribución De Frecuencias Absolutas Y Relativas Para Los Datos Agrupados De La Variable Salario Anual Y Represéntalas Con Las Gráficas Correspondientes.

Datos ordenados de menor a mayor:

16950

19255

21150

21450

21750

21900

21900

23565

23725

24000

24280

26250

27320

27750

27900

28350

29100

29640

30380

30730

31050

31350

31360

32100

32550

35085

35100

35560

36000

36180

38850

40200

40800

42000

42250

45000

46430

57500

60375

60985



Las frecuencias y porcentajes se calculan de la misma manera que en la tabla anterior para datos pequeños, sin embargo para datos mas grandes se utiliza el intervalo y la marca de clase.

INTERVALO DE CLASE

Se organizan los datos en una tabla de frecuencias, agrupándolos previamente en intervalos y representándolos en un gráfico estadístico. Siendo N el número de datos:

16950 + 6291 = 23241
23242 + 6291 = 29533
29534 + 6291 = 35825
35826 + 6291 = 42117
42118 + 6291 = 48409
48410 + 6291 = 54701
54702 + 6291 = 60993


MARCA DE CLASE

En estadística, la marca de clase es el valor representativo de una clase o intervalo. En concreto, la marca de clase es el punto medio de los límites de la clase o intervalo.

Por ejemplo, la marca de clase del intervalo [30,40] es 35.

(16950 + 23241) /2 = 20095.5
(23242 + 29533  /2 = 26387.5
(29534 + 35825) /2 = 32679.5
(35826 + 42117) /2 38971.5
(42118 + 48409) /2 = 45263.5
(48410 + 54701) /2 = 51555.5
(54702 + 60993) /2 = 57847.5

TABLA DE FRECUENCIAS TERMINADA

INTERVALOS DE CLASE

Xi

fi

hi

pi

FI

HI

PI

16950 - 23241

20095.5

7

0.175

17.5%

7

0.175

17.5%

23242 - 29533

26387.5

10

0.25

25.0%

17

0.425

42.5%

29534 - 35825

32679.5

11

0.275

27.5%

28

0.7

70.0%

35826 - 42117

38971.5

6

0.15

15.0%

34

0.85

85.0%

42118 - 48409

45263.5

3

0.075

7.5%

37

0.925

92.5%

48410 - 54701

51555.5

0

0

0.0%

37

0.925

92.5%

54702 - 60993

57847.5

3

0.075

7.5%

40

1

100.0%

TOTAL

 

40

1

100%

 

 

 


¿CÓMO SE PRESENTAN LOS DATOS?

Un gráfico muestra una presentación visual de los datos estadísticos revisados o manipulados; permite ver los datos de manera rápida y sencilla facilitando su comparación para conocer tendencias y/o relaciones entre los datos en cuestión.

Las gráficas son un apoyo importante para mostrar:
  • Comparaciones
  • Cambios en un periodo de tiempo
  • Distribuciones de frecuencia
  • Correlación
  • Parte relativa de un todo

El tipo de representación utilizado depende de la clase de datos a evaluar.

DATOS CUALITATIVOS

Son datos que generalmente expresan opiniones, motivaciones o información que no puede expresarse con cifras.

-Estos datos se pueden representar con: graficas de barras o de pastel

Usaremos la siguiente tabla y con base en ella se generan las graficas.

TIPO DE CONTRATO

fi

hi

pi

FI

HI

PI

INDEFINIDO

16

0.4

40

16

0.4

40

ANUAL

16

0.4

40

32

0.8

80

TEMPORAL

8

0.2

20

40

1

100

TOTAL

40

1

100

 

 

 

  • GRAFICAS DE BARRAS
Este tipo de gráfica es una de las más usada por las ventajas que presenta a la hora de presentar datos y la facilidad de leerla. En esta se presentan los datos en forma de barras ubicadas sobre dos ejes cartesianos.

Para generar el grafico podemos utilizar las frecuencias absoluta relativa y el tipo de variable en este caso el tipo de contrato.



  • GRAFICAS DE PASTEL
El gráfico circular se usa generalmente para representar valores porcentuales, es decir, aquellos datos en los que se quiere representar el porcentaje de cada valor. Es por esto que, cada una de las porciones de acuerdo a su tamaño, representa la frecuencia con relación al total, expresado en el círculo completo.


Para generar el grafico podemos utilizar los tipos de contrato y el porcentaje o porcentaje acumulado.


DATOS CUANTITATIVOS

Son datos que expresan cantidades concretas y pueden utilizarse para elaborar estudios estadísticos "duros".

-Estos datos pueden representarse con: histogramas, polígonos de frecuencias y ojivas.

Usaremos la siguiente tabla y con base en ella se generan las graficas.

INTERVALOS DE CLASE

Xi

fi

hi

pi

FI

HI

PI

16950 - 23241

20095.5

7

0.175

17.5%

7

0.175

17.5%

23242 - 29533

26387.5

10

0.25

25.0%

17

0.425

42.5%

29534 - 35825

32679.5

11

0.275

27.5%

28

0.7

70.0%

35826 - 42117

38971.5

6

0.15

15.0%

34

0.85

85.0%

42118 - 48409

45263.5

3

0.075

7.5%

37

0.925

92.5%

48410 - 54701

51555.5

0

0

0.0%

37

0.925

92.5%

54702 - 60993

57847.5

3

0.075

7.5%

40

1

100.0%

TOTAL

 

40

1

100%

 

 

 


  • HISTOGRAMA
Un histograma es tipo de diagrama estadístico en el que se representa un conjunto de datos estadísticos mediante barras rectangulares, de manera que cada barra del histograma es proporcional a su frecuencia correspondiente.

Para generar un histograma podemos utilizar ya sea los intervalos de clase o la marca de clase, junto con cualquier tipo de frecuencia, sea absoluta, relativa, absoluta acumulada o relativa acumulada.


  • POLIGONO DE FRECUECIAS
Un polígono de frecuencias es un tipo de gráfico estadístico en el que se representa el conjunto de datos mediante puntos y se unen con líneas.

Para generar un polígono de frecuencias podemos utilizar ya sea los intervalos de clase o la marca de clase, junto con cualquier tipo de frecuencia, sea absoluta o relativa.




  • OJIVAS
En estadística, la ojiva es la gráfica acumulativa de una serie de datos. Es decir, la ojiva es un gráfico que muestra la frecuencia acumulada asociada a un conjunto de datos.

Por lo tanto, la ojiva sirve para saber el número de datos que se encuentran por debajo de un valor determinado.

Para realizar una ojiva utilizamos ya sea los intervalos de clase o la marca de clase, junto con la frecuencia acumulada.



REFERENCIAS

Comentarios

Entradas más populares de este blog

IV.- MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN: DATOS NO AGRUPADOS