As opiniões emitidas neste blog, salvo aquelas que correspondem a citações, são de responsabilidade do autor do blog, em nada refletindo a opinião de instituições a que o autor do blog eventualmente pertença. Nossos links são verificados permanentemente e são considerados isentos de vírus. As imagens deste blog podem ser usadas livremente, desde que a fonte seja citada: http://ramonlamar.blogspot.com. Este blog faz parte do Multiverso de Ramon Lamar
Mostrando postagens com marcador estatística. Mostrar todas as postagens
Mostrando postagens com marcador estatística. Mostrar todas as postagens

sábado, 10 de dezembro de 2016

Construção de tabelas e gráficos: escolhendo o número de classes.

A Amplitude Total (A) é a diferença entre o maior e o menor valor do conjunto de dados. Num exemplo de 60 indivíduos onde o valor máximo (xmax) seja 158u e o valor mínimo (xmin) seja 96u, A = 158u – 96u = 62u. Logo, a amplitude total da medida para os 60 indivíduos será de 62u.

Fórmula 1: A = xmax - xmin

Uma vez que os dados já estejam em ordem, podemos pensar em agrupá-los em classes, juntando os valores mais próximos, com a finalidade de construir uma tabela e, futuramente, um gráfico.
Como a escolha do número de classes é por tentativa, podemos iniciar com um valor máximo (k=25) e depois combinar estas classes até um valor mais razoável, onde distinguimos um padrão de distribuição, ou usarmos o bom senso e, por exemplo, com os dados variando de 96u a 158u, poderíamos escolher a amplitude de cada classe (h) igual a 10u. Começando a primeira classe com o valor 90u, e utilizando a amplitude constante (h=10u), teríamos a primeira classe de 90u a 100u; a segunda classe de 100u a 110u, etc, até a última classe de 150u a 160u. Desta maneira estaríamos construindo uma tabela com 7 (k=7) classes de tamanho 10u cada (h=10u) onde incluiríamos todos os dados.
Sturges elaborou uma fórmula para se construir tabelas e podemos utilizá-la se não estivermos dispostos a pensar muito em uma maneira de agrupar os dados.

Seja k = número de classes
n = número total de observações
h = amplitude de cada classe
A = amplitude total do conjunto de dados

Fórmula 2: k = 1 + 3,32 log n

Fórmula 3: h = A / k

No exemplo citado, k = 1 + 3,32 log 60 = 6,91; então k = 7 e a amplitude de cada classe seria h = 62/7 = 8,86. Usaremos h = 9.
Portanto, Sturges recomenda uma tabela com 7 classes com intervalos ou amplitudes de classe iguais a 9.
Antes de iniciar a construção da tabela, convém notar que o símbolo “|--” significa um intervalo fechado à esquerda e aberto à direita. Em outras palavras, se temos 96 |-- 105, isto significa que as observações de 96 a 104,99 estão incluídas neste intervalo e a observação 105 não está.
Como vimos, a fórmula de Sturges não precisa ser seguida à risca, é só uma boa escolha inicial.

(Adaptado da APOSTILA DE ESTATÍSTICA I
 do Prof. Alceu Cota Júnior – ICEX/UFMG)