Logística/Técnicas de previsão/Estatísticas univariadas, bivariadas e autocorrelação

Fonte: testwiki
Saltar para a navegação Saltar para a pesquisa

Considera-se uma estatística o resumo numérico de um determinado conjunto de dados. (Makridakis, 1998, p. 28-29).

As estatísticas descritivas mais usadas tanto para conjuntos de dados univariados únicos, como séries temporais únicas são a média, o desvio padrão e a variância. No caso de existirem dados bivariados (par de variáveis aleatórias), as estatísticas mais usadas para descrever a relação entre os dois conjuntos de dados são a covariância e a correlação. Finalmente, as estatísticas mais comuns para efectuar a comparação entre as observações de uma única série temporal em dois períodos de tempo distintos são a autocovariância e a autocorrelação.


Estatísticas univariadas


A medição do valor em relação ao qual 50 por cento dos desvios estão acima e 50 por cento dos desvios estão abaixo é dada pela média (ou média aritmética), ou seja, a soma dos desvios em torno desta é zero. Por exemplo (DeLurgio, 1998, p. 41):


Tabela 1. Vendas de um determinado produto.

t Predefinição:01 Predefinição:02 Predefinição:03 Predefinição:04 Predefinição:05 Predefinição:06 Predefinição:07 Predefinição:08 Predefinição:09

Xt Predefinição:08 Predefinição:08 11 Predefinição:07 Predefinição:08 12 10 13 13


onde Xt, na Tabela 1, é o valor de vendas de um determinado produto nos últimos nove meses. A média das vendas é dada por:


X=t=1nXtn=8+8+11+7+8+12+10+13+139=909=10


onde t=19Xt é o somatório de t = 1 até t = 9.


Desvios


Um desvio médio (xt) é definido pela subtracção da média a um valor observado (Xt) e é dado por:


xt=XtX


Tabela 3. Cálculo dos desvios.

t Predefinição:01 Predefinição:02 Predefinição:03 Predefinição:04 Predefinição:05 Predefinição:06 Predefinição:07 Predefinição:08 Predefinição:09

Xt Predefinição:08 Predefinição:08 11 Predefinição:07 Predefinição:08 12 10 13 13

xt -2 -2 Predefinição:01 -3 -2 Predefinição:02 Predefinição:00 Predefinição:03 Predefinição:03


t=111xt=(2)+(2)+1+(3)+(2)+2+0+3+3=0


Como a soma dos desvios é sempre igual a zero, é útil desenvolver uma estatística descritiva para estes desvios, que, ou são elevados ao quadrado, ou, ocasionalmente, toma-se o seu valor absoluto.

O desvio médio absoluto é denominado de DMA e é dado por:


DMA=t=1n|XtX|n


Neste caso:


DMA=|810|+|810|+|1110|+|710|+|810|+|1210|+|1010|+|1310|+|1310|9


DMA=2+2+1+3+2+2+0+3+39=209=2,22


Por seu lado, o desvio médio quadrado, é designado por DMQ e é dado por:


DMQ=t=1n(XtX)2n


Neste caso:


DMQ=(810)2+(810)2+(1110)2+(710)2+(810)2+(1210)2+(1010)2+(1310)2+(1310)29


DMQ=4+4+1+9+4+4+0+9+99=449=4,89


Intimamente relacionado com o desvio médio quadrado (DMQ), está a variância. Esta é definida da seguinte maneira:


S2=t=1n(XtX)2n1


Neste caso:


S2=(810)2+(810)2+(1110)2+(710)2+(810)2+(1210)2+(1010)2+(1310)2+(1310)28


S2=4+4+1+9+4+4+0+9+98=448=5,5


onde n1 representa os «graus de liberdade», que podem ser definidos como o número de observações a subtrair pelo número de parâmetros estimados (Makridakis, 1998, p. 31-32).

A variância é menos intuitiva que o DMQ mas possui propriedades matemáticas desejáveis, porque, ao contrário do DMQ não é uma estimativa tendenciosa.

Tanto a variância como o desvio médio absoluto fornecem medidas de dispersão. Medem aproximadamente o desvio médio das observações em relação à sua média. Se as observações estiverem muito dispersas, estarão longe da média (acima e abaixo). Neste caso tanto o desvio médio absoluto como a variância terão um valor elevado. Quando as observações estão próximas entre si, o desvio médio absoluto e a variância terão valores pequenos. Ambos têm a mesma unidade que as observações.


O desvio padrão é a raiz quadrada do desvio médio quadrado (DMQ) e é dado por (DeLurgio, 1998, p. 43):


S=t=1n(XtX)2n1


Neste caso:


S=(810)2+(810)2+(1110)2+(710)2+(810)2+(1210)2+(1010)2+(1310)2+(1310)28


S=4+4+1+9+4+4+0+9+98=448=5,5=2,35


Muitos conjuntos de dados verificam as seguintes regras empíricas (Makridakis, 1998, p. 32):

  • Aproximadamente dois terços das observações distam até 1 desvio padrão da sua média;
  • Aproximadamente 95% das observações distam até 2 desvios padrões da sua média.


Quando se ordena o número de observações por ordem crescente, como acontece na Tabela 2, e este for ímpar, a mediana é o valor em relação ao qual 50 por cento dos valores são maiores e 50 por cento são menores, ou seja, a mediana é a observação a meio. Nos casos em que o número de observações for par, a mediana é igual à média entre os valores das duas observações centrais.


Tabela 2. Valores de vendas ordenados por ordem crescente.

Xt Predefinição:07 Predefinição:08 Predefinição:08 Predefinição:08 10 11 12 13 13


Para as nove observações da Tabela 2, quatro estão acima de 10 e quatro estão abaixo de 10. A mediana é, portanto, 10.

A média e a mediana providenciam uma medida numérica do centro do conjunto de dados, bem como a medição da sua dispersão, de modo a saber se estes estão fortemente agrupados ou espalhados por uma vasta gama de valores (Makridakis, 1998, p. 29-30).


O número, ou conjunto de números, que ocorre mais vezes dá pelo nome de moda. Nos dados da Tabela 2, o número que aparece com maior frequência é 8, logo é a moda(DeLurgio, 1998, p. 41).


Predefinição:AutoCat