Essa postagem é um pouco mais rebuscada para quem não tem intimidade com econometria e técnicas estatísticas, mas resolvi postar assim mesmo porque na verdade apenas corrobora o que todo bebedor de cerveja já sabe...HAhUhaUhAU! Quando o preço aumenta, a quantidade comprada diminui, quando está calor se vende mais da loira gelada e quando o Cabrone recebe aumento salarial ele corre pra bebemorar! Aqui vai o estudo completo.
São Paulo, 3 de fevereiro de 2016
O
presente trabalho procura medir a interferência de algumas variáveis no volume
de cerveja vendido no Brasil, quais sejam: Preço, renda real do trabalhador e
temperatura. A teoria indica que variações nessas três variáveis influenciam
diretamente a venda da bebida. O objetivo deste trabalho é observar em que
medida isso acontece e se realmente acontece.
Para
esse artigo, foram coletadas informações de volume de cerveja vendida no Brasil,
preço da cerveja, a renda nacional representada pelo rendimento do trabalhador
e dados de temperatura média no Estado de São Paulo.
A
primeira série foi extraída do site da Receita Federal que a disponibiliza
através do Sistema de Controle de Produção de Bebidas – SICOBE. São informações
de volume em litros com início em 2011.
A
série de preços foi elaborado utilizando-se dados da receita líquida e volume
de vendas de cerveja Ambev, cuja fonte é o site da própria empresa. Sabe-se que
a Receita é definida pela seguinte fórmula: R = p * q; Onde: R = receita, p =
preço e q = quantidade. Daí depreende-se o preço da cerveja
A
Ambev tem market share em torno de
64%, segundo a A/C Nielsen. Foram calculadas correlações entre a venda
proveniente da produção de cervejas no Brasil com as vendas da Ambev. O
coeficiente de correlação calculado é igual a 96,4%. Portanto, pode-se utilizar
a preço da cerveja vendida pela Ambev como variável proxy do preço no Brasil.
Para
a renda foi utilizada a série de rendimento real do trabalhador, extraída do
IBGE.
Estudos mostram que a temperatura
é uma variável relevante para explicar a quantidade demandada de cerveja. A
variável temperatura foi extraída do site
do Instituto Nacional de Pesquisas Espaciais (INPE). Para a utilização da
variável temperatura, foi necessário ultrapassar alguns obstáculos. Em primeiro
lugar, o site do INPE não
disponibiliza uma tabela com as temperaturas médias no Brasil. O que é
disponibilizado são as estações que coletam os dados sobre temperatura. No caso
do Brasil, são em torno de 263 estações medidoras de temperatura. Logo, seria
necessário coletar os dados para cada estação e depois calcular a temperatura
média para o Brasil. Dada a envergadura desse procedimento, optou-se por
utilizar os dados de temperatura para o Estado de São Paulo, principal mercado
consumidor de cerveja no Brasil. No caso do Estado de São Paulo, são 10
estações medidoras de temperatura. No entanto, ocorreu outro problema, as
séries que compõem essas estações não possuem a mesma extensão temporal. Dada
essa restrição, foi utilizada como proxy
da temperatura, os dados da estação medidora de São Carlos, pois somente essa
estação disponibiliza uma série suficientemente longo que possa ser utilizada
no modelo.
Todos os dados vão de janeiro de
2010 até setembro de 2015. Abaixo uma tabela resumida das variáveis utilizadas
|
Variável
|
Significado
|
|
Quantidade de cerveja
|
Produção de cerveja no Brasil em milhões
de litros
|
|
Preço da cerveja
|
Preço por litro de cerveja
|
|
Renda
|
Rendimento real do trabalhador
|
|
Temperatura
|
Temperatura média na cidade de São
Carlos - SP
|
A equação que define o modelo que busca
prever o resultado da influência das variáveis independentes sobre a variável
dependente por meio da regressão linear múltipla, está descrita abaixo:
Quant = β+ β1Preço + β2Rendimento
+ β3Temp + ε
Onde:
Quant – quantidade de cerveja produzida
β - constante
β1 – coeficiente angular do
preço da cerveja
β2 – coeficiente angular do
rendimento real do trabalhador
β3 – coeficiente angular da
temperatura média na cidade de São Carlos
ε – Componente de erro aleatório
Primeiro foi feito uma análise de
correlação entre a variável dependente e as demais variáveis independentes. A
correlação (de Pearson) pode assumir valores entre -1 a +1, em seus extremos, à
medida que uma variável muda, a outra muda na mesma direção e com valor igual.
corr(Quantidade, Preco) = -0,69117151
corr(Quantidade, rendimentorealbr) =
0,75297007
corr(Quantidade, tempmedia) = 0,62877962
Todas as variáveis apresentaram boa
correlação ao nível de significância de 5%. Testes de correlação entre as
variáveis independentes também foram feitos e não se verificou correlação
significativa entre elas, afastando assim possíveis problemas de
multi-colinearidade, conforme tabela abaixo.
|
Tabela
de correlação
|
Preço
|
Rendimento
|
Temperatura
|
|
Preço
|
1
|
-0,3
|
-0,4
|
|
Rendimento
|
-0,3
|
1
|
0,35
|
|
Temperatura
|
-0,4
|
0,35
|
1
|
Analisando
a tabela de correlação pode-se constatar que o maior valor de correlação entre
duas variáveis independentes distintas é de 0,4, correlação esta, que ocorreu
entre as variáveis independentes preço e temperatura. Segundo Field (2009),
valores de correlação entre variáveis independentes superiores a 0,90 indicam a
possível existência de problemas de multi-colinearidade entre as mesmas. A
partir dos dados da tabela de correlação do modelo, pode-se afirmar de maneira preliminar,
que o mesmo não apresenta problemas de multi-colinearidade.
A regressão linear múltipla foi feita
utilizando o logarítmo das variáveis acima citadas no software Gretl. Abaixo segue o modelo tal como
resulta no software.
Modelo 2: MQO, usando as observações 2010:01-2015:09 (T =
69)
Variável dependente: l_Quantidade
|
|
Coeficiente
|
Erro Padrão
|
razão-t
|
p-valor
|
|
|
const
|
6,87006
|
0,703794
|
9,7615
|
<0,0001
|
***
|
|
l_Preco
|
−0,458323
|
0,0603746
|
−7,5913
|
<0,0001
|
***
|
|
l_tempmedia
|
0,347852
|
0,0664203
|
5,2371
|
<0,0001
|
***
|
|
l_rendimentorealbr
|
0,832416
|
0,092073
|
9,0408
|
<0,0001
|
***
|
|
Média var. dependente
|
13,91966
|
|
D.P. var. dependente
|
0,130401
|
|
Soma resíd. quadrados
|
0,189723
|
|
E.P. da regressão
|
0,054026
|
|
R-quadrado
|
0,835922
|
|
R-quadrado ajustado
|
0,828349
|
|
F(3, 65)
|
110,3843
|
|
P-valor(F)
|
1,84e-25
|
|
Log da verossimilhança
|
105,5155
|
|
Critério de Akaike
|
−203,0309
|
|
Critério de Schwarz
|
−194,0945
|
|
Critério Hannan-Quinn
|
−199,4855
|
|
rô
|
0,194030
|
|
Durbin-Watson
|
1,594379
|
Análise dos Resultados
O
modelo apresenta um valor de R2 igual a 0,836, significando que
83,6% da variação da variável dependente Quantidade pode ser explicada pelas
três variáveis independentes apresentadas pelo modelo que são: Preço,
Temperatura média e rendimento real do trabalhador.
Segundo
Field (2009), a diferença entre R2 e R2 ajustado indica o
quanto um modelo pode ser generalizado, o ideal é que esta diferença seja igual
a zero. O valor de R2 ajustado é igual a 0,828. Assim, a diferença
entre os dois valores é igual a 0,008, o que é muito bom.
O
teste estatístico de Durbin-Watson verifica se os resíduos são correlacionados,
fornecendo indícios de que a premissa de independência de erros é satisfeita. O
resultado do teste pode variar de 0 e 4, valores inferiores a 1 e superiores a
3 podem representar problemas, sendo 2 o valor ideal para este teste. O valor
apurado para o teste de Durbin-Watson é 1,59 que pode ser considerado aceitável
por estar próximo de 2 que é o valor ideal.
Todos
os coeficientes são significativos ao nível de menos de 1%, portanto as variáveis
estão contribuindo de forma significativa para o modelo.
O
coeficiente da variável preço está negativo, indicando que quando o preço
aumenta, a quantidade demandada cai. Portanto de acordo com a teoria econômica.
Como os coeficientes estão em logaritmo, nos fornecem diretamente a
elasticidade. No caso presente a equação diz que, na média, quando o preço sobe
1% a quantidade demandada cai 0,46%, configurando uma relação inelástica. Isso
é bom para o vendedor de cerveja. Até certo ponto ele pode aumentar seu preço
sem perder rentabilidade.
Um
choque de 1% na renda real do trabalhador aumenta a quantidade de cerveja
vendida em 0,83%, configurando uma relação inelástica e próximo da unitária
entre essas duas variáveis. O sinal positivo está de acordo com a teoria
econômica (considerando a cerveja um bem normal), ou seja, quando o trabalhador
tem ganhos de renda, aumenta o consumo da cerveja.
Finalmente
em relação à temperatura, o aumento de 1% faz o consumo da cerveja aumentar
0,35%, configurando uma relação bem inelástica. O sinal positivo está de acordo
com a teoria, ou seja, quanto mais quente está o clima mais propenso o
consumidor está em demandar cerveja, porém é um aumento moderado.
O
teste F, que é o teste de comparação de variâncias, também indica boa
adequabilidade do modelo, já que o F calculado foi bem alto. Quanto maior o F
calculado melhor, pois significa que os quadrados médios do modelo são maiores
que os quadrados médios residuais.
Comentários
Postar um comentário