Em 2009 comecei a coletar dados sobre o preço e demais característcas das histórias em quadrinhos lançadas no brasil e que se encontravam no varejo de Belo Horizonte. De lá pra cá, consegui coletar informações sobre 95 histórias em quadrinhos de 15 editoras. A tabela abaixo fornece algumas características gerais sobre o banco de dados, foram coletadas informações sobre a editora, preço, número de páginas, material monocromático ou colorido, tamanho (em cm²) e tipo de capa. As informações estão resumidas na tabela 1.
Tabela 1. - Características Gerais do Banco de Dados Sobre HQ's no varejo de BH.
...|...Editora....|.Nº.|PçMédio|.páginas|Tamanho.|.P&B..|cartão ===========================================================================
1..| Conrad ......| 18 | 31,81 | 148,83 | 475,18 | 0,61 | 0,78
2..| Desiderada ..| 3..| 37,77 | 173,33 | 423,67 | 0,67 | 1,00
3..| Devir .......| 12.| 32,61 | 136,00 | 488,43 | 0,50 | 1,00
4..| Gal .........| 1..| 39,90 | 144,00 | 588,00 | 1,00 | 1,00
5..| HQM .........| 2..| 25,90 | 118,00 | 396,00 | 0,50 | 1,00
6..| Mithos ......| 2..| 27,40 | 203,00 | 475,38 | 0,50 | 1,00
7..| Panini ......| 21.| 20,20 | 181,86 | 368,29 | 0,43 | 0,62
8..| Pixel .......| 2 .| 22,90 | 123,00 | 396,00 | ...0 | 1,00
9..| Quad na Cia .| 7 .| 40,97 | 388,86 | 433,49 | 0,71 | 1,00
10.| Quarto Mundo*| 4 .| .8,73 | .67,50 | 428,75 | 0,50 | 0,50
11.| Record...... | 1 .| 27,90 | .64,00 | 566,50 | ...0 | 1,00
12.| Via Lettera .| 1 .| 22,00 | .64,00 | 368,00 | 1,00 | 1,00
13.| Zarabatana ..| 2 .| 32,50 | 128,00 | 368,00 | 1,00 | 1,00
14.| Independentes| 17 | .5,14 | .39,00 | 446,21 | 0,82 | 0,24
15.|.Outros.......|.2..|.35,00.|.104,00.|.481,00.|.0,50.|.1,00 ===========================================================================
...| TOTAL .......| 95 | 27,38 | 138,89 |.446,86 | 0,58 | 0,88
===========================================================================
Fonte: dados coletados pelo autor.
* O quarto mundo é um coletivo de autores independentes.
pç médio = preço médio
Tamanho = cm²
P&B = proporção exemplares em Preto & Branco.
Cartão = capa de cartão.
Esse Banco de Dados tem dois problemas principais: 1) As HQ's escolhidas atendem ao meu gosto pessoal. Como sou um consumidor recorrente é possível que os preços desse banco de dados estejam subestimados, lembrando que a amostragem foi não probabilística. Além disso, o momento da compra pode ter sido influente para a coleta dos preços (promoção ou lançamento, momento de alta ou baixa). Minha impressão é de que a média dos dados está um pouco abaixo do preço do varejo daqui em Belo Horizonte (consumidores recorrentes sabem encontrar pechinchas). Tentei contornar esse problema captando algumas informações sobre lançamentos não adquiridos, com a ampliação do banco é possível eliminar um pouco o viés.
2) O Banco de dados foi construído para uma janela de tempo, sem uma data única de referência. Portanto, nesse período, é possível que tenha havido uma correção de preços devido a inflação. A coleta de dados recorrente e a informação sobre o local de compra pode ser importante para contornar esse efeito em pesquisas futuras.
Na tabela 1, organizada de acordo com o preço médio, podemos notar que editora "Quadrinhos na Cia" possui a média mais elevada de preços. No entanto, esse é um indicador que pode ser ilusório já que a escolha editorial da Q&C parece ser a de trabalhos com mais páginas. De outra maneira, vemos que os independentes estão entre os mais baratos, porém possuem o número reduzido de páginas.
Tabela.2 - Editoras por Preço médio.
=======================================
...|Editora..........|Preços |Paginas
=======================================
9. |Quad na Cia......|40,97 .|388,86
4. |Gal..............|39,90 .|144,00
2. |Desiderada.......|37,77 .|173,33
15.|Outras ..........|35,00 .|104,00
3. |Devir............|32,61 .|136,00
13.|Zarabatana.......|32,50 .|128,00
1. |Conrad...........|31,81 .|148.83
11.|Record...........|27,90 .| 64,00
6. |Mithos...........|27,40 .|203,00
5. |HQM..............|25,90 .|118,00
8. |Pixel............|22,90 .|123,00
12.|Via Lettera......|22,00 .| 64,00
7. |Panini...........|20.20 .|181,86
10.|Quarto Mundo*....|8,73 ..|.67,50
14.|Independentes....|5,14 ..|.39,00
=====================================
Fonte: Dados do Autor.
Preço = Preço Médio
Páginas = Número médio de páginas por exemplar
Dada essa característica, o mais interessante é analizar a informação de preço/página, isto é, quanto custa cada página da história em quadrinho que está sendo analizada. Para essa informação temos a tabela 3 abaixo:
Tabela.3 - Editoras por Custo de uma página.
======================================
11.| Record.......|0.4400000
12.| Via Lettera..|0.3400000
15.| Outros.......|0.3300000
4. | Gal..........|0.2800000
13.| Zarabatana...|0.2800000
3. | Devir........|0.2683333
1. | Conrad.......|0.2516667
2. | Desiderada...|0.2266667
5. | HQM..........|0.2250000
9. | Quad na Cia..|0.1514286
8. | Pixel........|0.1450000
6. | Mithos.......|0.1450000
14.| Independentes|0.1441176
10.| Quarto Mundo*|0.1350000
7. | Panini.......|0.1242857
==============================
Fonte: dados do Autor.
O que também pode ser representado pelo gráfico:
Gráfico 1 - Editoras por Custo/página decrescente.Temos 9 editoras acima do preço médio e 6 abaixo do preço médio.
Esse ainda não é o resultado final, pois sabemos que há várias medidas de qualificação para diferentes preços. Sabemos que histórias monocromáticas (geralmente em preto e branco) são mais baratas que as coloridas, e que números menores, tipo de papel e capa, influenciam bastante. Tomando cada uma das características da Tabela 1 e uma variavel identificadora para cada editora (comparadas às editoras independentes), nós temos o seguinte resultado da regressão:
custo/pagina = Intercepto + B1*(Tamanho) + B2*(Cor) + B3*(Capa_cartão) + B4*(Capa_dura) +Be*(editoras)
Tiramos a editora nº 14 (Independentes) como comparação.
Tabela.4 - Coeficientes estimados para a regressão de quadrinhos.
Coefficients: Estimate .Std. Error .t value .Pr(>|t|)
(Intercept).-2.636e-02..4.604e-02..-0.573 0.568565
Tamanho......3.262e-04..9.511e-05...3.430 0.000980 ***
Cor..........8.033e-02..2.084e-02...3.854 0.000241 ***
Capa_c.......4.571e-02..3.039e-02...1.504 0.136763
Capa_d.......1.115e-01..4.273e-02...2.609 0.010930 *
E_1..........3.146e-02..3.632e-02...0.866 0.389079
E_2..........4.235e-02..5.628e-02...0.752 0.454085
E_3..........4.950e-02..3.894e-02...1.271 0.207519
E_4..........6.885e-02..8.844e-02...0.779 0.438690
E_5......... 3.632e-02..6.593e-02...0.551 0.583367
E_6.........-6.957e-02..6.547e-02..-1.063 0.291305
E_7.........-6.492e-02..3.458e-02..-1.877 0.064331 .
E_8.........-8.385e-02..6.803e-02..-1.233 0.221556
E_9.........-3.227e-02..4.346e-02..-0.743 0.460052
E_10........-4.151e-02..4.663e-02..-0.890 0.376158
E_11.........1.555e-01..8.843e-02...1.759 0.082619 .
E_12.........2.006e-01..8.737e-02...2.296 0.024431 *
E_13.........1.406e-01..6.564e-02...2.142 0.035376 *
E_15.........1.136e-01..6.547e-02...1.735 0.086807 .
--- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.08156 on 76 degrees of freedom Multiple R-squared: 0.6333, Adjusted R-squared: 0.5464 F-statistic: 7.291 on 18 and 76 DF, p-value: 2.131e-10
Esses resultados são bastante interessantes e intuitivos. Sobre as características das revistas temos quatro fatores importantes:
1. Tamanho - Um Gibi com mais 1 cm de cada lado custa R$0,30 a mais. Outro exemplo: partindo de um formato A5 (15x21) para um gibi de tamanho americano (17,5x27), com as mesmas 100 páginas, temos, em média, R$ 5,14. Então, você consumidor final paga 5,14 para mudar de tamanho com as mesmas 100 páginas.
2. Cor - Uma HQ de 100 páginas colorida, tudo mais constante, acrescenta, só pela cor, R$ 8,00 no preço em relação a uma mesma HQ preto e branca de mesmo tamanho e da mesma editora.
3. Capa cartão - A capa do tipo papel cartão ou brocura (p-valor = 0.13) acrescenta R$ 4,57 a uma história de 100 páginas.
4. Capa dura - A capa dura, ou seja, histórias com capa encadernada em papelão grosso e impressão, fazem uma página ficar R$0,11 mais cara. Em uma revista de 100 páginas isso equivale a dizer R$11,15 a mais pela capa diferenciada. A comparação é a capa de folha comum, tipo folha de revista ou papel.
Para as editoras, chamam a atenção alguns detalhes. O maior deles é que mesmo em comparação às edições independentes, as editoras não são muito distintas. Em outras palavras, controlando pelas diferenças das revistas, número de páginas, tamanho, cor e capa, as editoras são relativamente semelhante entre si. De maneira mais curta e grossa, pela minha base, as editoras são iguais. no entano, elas diferem na colocação de mercado. As editoras independentes tendem a colocar revistas menores, com menos páginas, em preto e branco e com capa de folha, por consequência mais baratas. A Devir, por exemplo, tem revistas maiores, capa cartão, e metade das revistas são coloridas. O fato das editoras não diferirem muito é interessante e pode sinalizar por um setor competitivo.
Há alguns pontos de atenção, destaque para:
7. Panini;
11. Record;
12. Via Lettera;
13. Zarabatana;
15. Outras (que tem a Dupla Criação e a CosacNaify)
A Panini apresenta uma tendência a ter uma página mais barata do que as editoras indepententes. A cada 100 páginas, uma HQ dessa editora é R$ 6,50 mais barato, esse dado é significante a 10%, o que não é muito. Mas o que ele quer dizer é um tanto intuitivo. Se você encontrar uma revista independente de 100 páginas (o que é raro) e uma HQ da Panini para comparar, o exemplar da Panini será R$6,50 mais barato, isso deve ser porque a editora tem muito mais escala que os independentes. Para as editoras Record, o raciocínio é o contrário, uma revista da Record com 100 páginas, tudo mais constante, custará R$15,55 mais caro que uma independente. Para a Via Lettera o valor é R$ 20,06, para Zarabatana R$ 14,00 e para as "Outras" será R$11,36.
Observo que a significância das editoras nº 11, 12, 13, 15 são de 10%, 5%, 5% e 10%. O banco precisa de mais dados de quadrinhos destas editoras acima. Então, os valores anteriores podem estar apresentando significância pelo fato da pequena amostra para essas editoras. Isso também vale para as demais que não são significativas. Chamo atenção para as editoras:
6. Mithos;
8. Pixel;
9. Quadrinhos na Cia; e
10 Quarto Mundo.
Estas possuem sinal negativo, o que quer dizer que elas podem ser mais baratas do que as independentes da minha base, mas não se pode dizer com certeza pois não foram significaticavas. As três últimas da relação acima foram significativas no teste da ANOVA indicando que são diferente dos demais conjuntos, isso acontecer para a Devir também, com a difença o sinal é positivo, ou seja, tem página mais elevada do que as independentes.
Por fim, acho que essa análise tende a mostrar o que todo consumidor já sabe intuitivamente: tamanho, qualidade da capa e cores importam muito no preço. As editoras nem tanto. No mais, parece ser um mercado competitivo, de acordo com a base o índice de Hirschman-Herfindall para medir uma concentração de um mercado é de 0.15 a 0.21 dependendo de como se encaram as independentes (esse índice é igual a um para o mercado monopolista e zero para perfeita concorrência).
Uma ressalva é que os bens não são nada homogêneos, isso quer dizer que não há uma substitubilidade muito alta entre um quadrinho e outro. Se o cosnumidor deseja a obra de determinado autor, aquele livro passa a ser único e não mais comparável com as demais opções. O consumidor pode se tornar também cativo de uma série. Ainda assim, não há sinais de que quando se considera a qualidade dos diferentes materiais por editora, os preços do mercado não são muito mais altos do que os preços das editoras independentes. Minha impressão como leitor é de que as HQ's no geral poderiam ser mais baratas. Há duas possibilidades: ou os preços estão todos competitivamente elevados ou eles competem em patamares de concorrência normais e o custo e estratágias no varejo que os diferencia. Acho que para testar concorrência, eu preciso de uma base maior, talvez minha base tenha sido afortunda em ter preços comparativos, pois R$20 a R$ 40,00 cada exemplar, é o preço medio no qual eu compro HQ's.
Interessante que a Panini, que é uma das poucas que ainda trabalha com distribuição mais massiva em bancas e preço tabelado, tenha aparecido como a única editora significante das mais mais baratas. Talvez isso explique seu market share. Um achado menos intuitivo: a medida que as histórias em quadrinhos ganham mais características positivas tais como cores, capa dura, encadernação maior e mais páginas, parece que seu preço varia mais. Em termos estatísticos estou dizendo que desconfio de uma heteroscedasticidade dos dados em relação à tamanho e cor principalmente.
Fiz alguns testes para ver se os erros são normais.
Gráfico2. - Resíduos da Regressão.
Será que meus resíduos são normais, tendo a ver que eles possuem uma dispersão positiva maior do que os dados de resíduos menores do que zero. Abaixo fiz um teste para a normalidade dos resíduos:
Gráfico3. - Teste da normalidade dos resíduos.
Basicamente, o teste é comparar a distribuição normal (vermelha) com a resíduos observada (preto). Fiz o teste da distribuição F 100 vezes (a geração da normal foi aleatória), em 12% dos casos rejeitei a normalidade, e aí?!
Acho que o modelo está bom, mas não dá pra ficar 100% seguro, faltam algumas informações importantes, essas podem ser:
1. Estabelecimento da compra.
2. Mais exemplares para algumas editoras.
3. Outras características tais como qualidade do papel e autores.
Para finalizar com uma lista de referência fácil:
Tabela.6 - Os dez mais baratos custo página:
=======================================================
Nome.....................- Editora..... - Custo Página
=======================================================
1. .Jacaré Alegre....... - Independente - R$0,00
2. .Homunculus1......... - Panini...... - R$0,04
3. .Homunculus7......... - Panini...... - R$0,05
4. .Umbigo Sem Fundo.... - Quadr na Cia - R$0,06
5. .O corno que sabia... - Pixel....... - R$0,06
6. .A.T.U.M. ........... - Independente - R$0,06 (olha o jabá :))
7. .Tex Gigante......... - Mithos ..... - R$0,08
8. .Retalhos............ - Quadr na Cia - R$0,08
9. .Melofia Infernal.... - Conrad...... - R$0,09
10. Patacoada........... - Independente - R$0,09
10. Prego 3 ............ - Independente - R$0,09
10. Graffitti 76% Qua... - Independente - R$0,09
========================================================
Tabela.7 - Os dez mais caros custo página:
========================================================
Nome..................... - Editora.... - Custo Página
========================================================
1. .Sábado dos Meus Amores - Conrad.... - R$0,61
2. .Big Guy............... - Conrad.... - R$0,48
3. .Predadores............ - Devir..... - R$0,47
4. .Clic 4................ - Conrad.... - R$0,44
5. .Asterix e Seus Am..... - Record.... - R$0,44
6. .Tocaia ............... - Devir..... - R$0,40
7. .A Casta dos Metabarões - Devir .... - R$0,38
8. .Xampu Lovely Losers... - Devir..... - R$0,37
9. .Che................... - Conrad.... - R$0,37
10. O Prolongado Sono SrT. - Zarabatana - R$0,36
10. Gente Feia na TV...... - Independen - R$0,36
10. Demolidor o Homem sem. - Panini.... - R$0,36
=========================================================
Espero que tenham curtido o post :)
Posso passar o banco a quem se interessar e podem me ajudar também com mais informação. A Parte da Rotina está nos comentários.
Obrigado!
Um comentário:
HQS <- read.csv("Hqs.csv", header = TRUE, sep = ",", dec=",")
plot(HQS$Tamanho, HQS$Custo)
reg_1 <- lm(Custo~Tamanho, data = HQS)
abline(reg_1, col="red", lty=2, lwd=2)
summary(reg_1)
summary(HQS)
m <- NULL
for (i in 1:15){
m[[i]] <- c(mean(HQS$Custo[HQS$editora==i]),i)
}
m <- matrix(c(m[1][[1]],
m[2][[1]],
m[3][[1]],
m[4][[1]],
m[5][[1]],
m[6][[1]],
m[7][[1]],
m[8][[1]],
m[9][[1]],
m[10][[1]],
m[11][[1]],
m[12][[1]],
m[13][[1]],
m[14][[1]],
m[15][[1]])
, ncol=2, byrow=TRUE)
s <- sort(m[,1], method = "sh", index.return=TRUE, decreasing=TRUE)
plot(s$x, xaxt="n", main="Do mais caro ao mais barato, custo-pagina", ylab="custo página", xlab="editora")
lista <- c("11 12 15 4 13 3 1 2 5 9 8 6 14 10 7")
title(sub=lista, line=0)
segments(0,mean(HQS$Custo),96,mean(HQS$Custo), lty=2, lwd=2, col="red")
reg_2 <- lm(Custo~Tamanho+Cor+Capa_c+Capa_d+E_1+E_2+E_3+E_4+E_5+E_6+E_7+E_8+E_9+E_10+E_11+E_12+E_13+E_15, data = HQS)
summary(reg_2)
anova(reg_2)
plot(HQS$Tamanho, reg_2$residuals)
plot(reg_2$residuals, ylab="resíduos", main="Resíduos Normais?!")
segments(1,0,95,0, lty=2, lwd=2, col="red")
#============================================================================
# Testando a normalidade dos resíduos
#============================================================================
hist(reg_2$residuals, freq=FALSE, xlab="resíduos", main="Comparação de Distribuições")
lines(density(reg_2$residuals))
y_res <- dnorm(reg_2$residuals,0,.1)
teste <- rnorm(95,0,1)
m <- matrix(c(reg_2$residuals,y_res), ncol=2)
y_res_x <- sort(m[,1], method = "sh", index.return=TRUE)
y_res_y <- m[y_res_x$ix,2]
lines(y_res_x$x,y_res_y, col="red", lwd=1.5)
plot(reg_2$residuals, teste)
anova(lm(reg_2$residuals~teste))
#============================================================================
# Testando a heteroscedasticidade no tamanho no tamanho
#============================================================================
plot(HQS$Tamanho, HQS$Custo)
reg_1 <- lm(Custo~Tamanho, data = HQS)
abline(reg_1, col="red", lty=2, lwd=2)
plot(HQS$Tamanho,reg_1$residuals)
hist(reg_1$residuals, freq=FALSE)
lines(density(reg_1$residuals))
y_res <- dnorm(reg_1$residuals,0,1)
teste <- rnorm(95,0,1)
m <- matrix(c(reg_1$residuals,y_res), ncol=2)
y_res_x <- sort(m[,1], method = "sh", index.return=TRUE)
y_res_y <- m[y_res_x$ix,2]
lines(y_res_x$x,y_res_y, col="red", lwd=1.5)
plot(reg_1$residuals, teste)
anova(lm(reg_1$residuals~teste))
test_het <- matrix(c(reg_1$residuals, HQS$Tamanho), ncol=2)
het <- sort(test_het[,2], method = "sh", index.return=TRUE)
het_r <- test_het[het$ix,1]
test_het1 <- matrix(c(het_r, het$x), ncol=2)
mean(HQS$Tamanho)
test_het1 <- fix(test_het1)
m1 <- mean(test_het1[,1][test_het1[,3]==0])
m2 <- mean(test_het1[,1][test_het1[,3]==1])
m1 - m2
sd(test_het1[,1][test_het1[,3]==0])
sd(test_het1[,1][test_het1[,3]==1])
plot(density(test_het1[,1][test_het1[,3]==0]))
lines(density(test_het1[,1][test_het1[,3]==1]), col="red")
s1 <- test_het1[,1][test_het1[,3]==1]
s2 <- c(test_het1[,1][test_het1[,3]==0],sample(test_het1[,1][test_het1[,3]==0],7))
plot(s1,s2)
anova(lm(s1~s2))
# Não há muita Heteroscedasticidade, mas temos de conferir.
#============================================================================
# FAZER MAIS TESTES
#============================================================================
Postar um comentário