As opiniões emitidas neste blog, salvo aquelas que correspondem a citações, são de responsabilidade do autor do blog, em nada refletindo a opinião de instituições a que o autor do blog eventualmente pertença. Nossos links são verificados permanentemente e são considerados isentos de vírus. As imagens deste blog podem ser usadas livremente, desde que a fonte seja citada: http://ramonlamar.blogspot.com

sábado, 10 de dezembro de 2016

Construção de tabelas e gráficos: escolhendo o número de classes.

A Amplitude Total (A) é a diferença entre o maior e o menor valor do conjunto de dados. Num exemplo de 60 indivíduos onde o valor máximo (xmax) seja 158u e o valor mínimo (xmin) seja 96u, A = 158u – 96u = 62u. Logo, a amplitude total da medida para os 60 indivíduos será de 62u.

Fórmula 1: A = xmax - xmin

Uma vez que os dados já estejam em ordem, podemos pensar em agrupá-los em classes, juntando os valores mais próximos, com a finalidade de construir uma tabela e, futuramente, um gráfico.
Como a escolha do número de classes é por tentativa, podemos iniciar com um valor máximo (k=25) e depois combinar estas classes até um valor mais razoável, onde distinguimos um padrão de distribuição, ou usarmos o bom senso e, por exemplo, com os dados variando de 96u a 158u, poderíamos escolher a amplitude de cada classe (h) igual a 10u. Começando a primeira classe com o valor 90u, e utilizando a amplitude constante (h=10u), teríamos a primeira classe de 90u a 100u; a segunda classe de 100u a 110u, etc, até a última classe de 150u a 160u. Desta maneira estaríamos construindo uma tabela com 7 (k=7) classes de tamanho 10u cada (h=10u) onde incluiríamos todos os dados.
Sturges elaborou uma fórmula para se construir tabelas e podemos utilizá-la se não estivermos dispostos a pensar muito em uma maneira de agrupar os dados.

Seja k = número de classes
n = número total de observações
h = amplitude de cada classe
A = amplitude total do conjunto de dados

Fórmula 2: k = 1 + 3,32 log n

Fórmula 3: h = A / k

No exemplo citado, k = 1 + 3,32 log 60 = 6,91; então k = 7 e a amplitude de cada classe seria h = 62/7 = 8,86. Usaremos h = 9.
Portanto, Sturges recomenda uma tabela com 7 classes com intervalos ou amplitudes de classe iguais a 9.
Antes de iniciar a construção da tabela, convém notar que o símbolo “|--” significa um intervalo fechado à esquerda e aberto à direita. Em outras palavras, se temos 96 |-- 105, isto significa que as observações de 96 a 104,99 estão incluídas neste intervalo e a observação 105 não está.
Como vimos, a fórmula de Sturges não precisa ser seguida à risca, é só uma boa escolha inicial.

(Adaptado da APOSTILA DE ESTATÍSTICA I
 do Prof. Alceu Cota Júnior – ICEX/UFMG)

Nenhum comentário:

Postar um comentário

Clique em "Participar deste site" e siga o blog para sempre receber informações sobre atualizações. O seu comentário será publicado após ser lido pelo administrador do blog.