terça-feira, 23 de novembro de 2021

As Chances do Atlético Mineiro ser campeão Brasileiro de 2021

EDIT: 29/11/21, 11:06: [Achei um erro em uma linha de código da simulação completa que estava atrapalhando um pouco os resultados (no detalhe: os pontos dos ganhadores não estavam sendo computados apenas os empates e os zero pontos dos times que haviam perdido na simulação). Atualizei no GITHUB e aqui nos gráficos e resultados, no texto marcadas em vermelho. E as chances do Galo são corrigidas para cima, ficam bem mais próximas do modelo simples (naïve), mas ainda assim um pouco menores, vou mandar a atualização após a vitória sobre o Fluminense, aí a chance é muito grande].

No último fim de semana eu tirei um tempo para fazer um exercício que funcionou mais como um passatempo para mim: calcular as chances do Atlético Mineiro (o GALO) ser campeão brasileiro em 2021, um jejum de 50 anos.

Como nada para o Atlético é fácil, não dá pra soltar ainda o grito de "É CAMPEÃO!" Não só por conta da sina de time azarado, mas porque eu fiz um modelo sofisticado que leva em conta dois fatores:
  1. A série do Flamengo até o final do campeonato é bem mais fácil do que a do atlético (e ainda com um jogo a menos).
  2. A maioria dos matemáticos está errada (infelizmente pro Galo) no seu cálculo de chances. Eles não parecem considerar muito as chances reais de confronto a confronto.
Considerando isso eu desenvolvi duas simulações. Uma simples que considera as chances de vitória, empate e derrota como 1/3, 1/3 e 1/3 para quaisquer dois times que se enfrentam. Ou seja, não importam muito os times, mas sim os pontos com que eles se iniciam na simulação e a aleatoriedade vai seguindo a fórmula acima de confrontos ao acaso.

Curioso é que esse modelo calcula as chances mais ou menos igual a maioria dos modelos matemáticos que são divulgados pela imprensa. Arredondando, na ocasião da 34ª rodada, ocorrida na maior parte até o último domingo dia 21 de Novembro, a chance do Galo é de 98% e a do Flamengo de 2%.

Fonte: Cálculos desse Blogueiro a partir dos dados do brasileirão, 34ª rodada.

No entanto, até a matemática para o atleticano é sofrida. O Flamengo tinha até o domingo passado 2 jogos a menos que o Atlético, e uma série relativamente mais fácil até o fim do brasileirão, como já falei. Não me parece nada muito realista, nem para os times envolvidos, nem para a natureza de um jogo de futebol, supor chances de 1/3 para vitórias, empates e derrotas. No blog do Brendan Sudol eu encontrei que ele coloca uma chance de um pouco mais de 20% de empate para o começo de uma partida com dados da Premier League, série A do futebol inglês.

Então, eu decidi fazer uma segunda segunda rotina que é mais sofisticada ao ponto de considerar as chances do time conforme o desempenho deles no campeonato até a rodada de início da simulação. Ou seja, para o Flamengo (66% de aproveitamento) enfrentar o Sport (32% de aproveitamento), isso dá uma chance de vitória muito maior para o Flamengo. O mesmo é feito para todos os outros times. É uma comparação de forças ao escolher o vencedor, perdedor e as chances de empate de uma partida. No caso desta última, as chances de empate são calculadas de acordo com o número de empates que os dois times confrontantes já tiveram (acho que isso não é muito realista pra final de campeonato, mas melhorar isso é mais difícil).

Não considerei ainda o famoso 'fator casa'. Ele não me parece ter sido muito relevante em 2020, mas parece que voltou a ter alguma relevância em 2021, ainda mais com o público voltando aos estádios tal como ocorreu do meio para o final desse ano. Pretendo incorporar esse fator em rotinas futuras.

Tá, mas como ficam então as chances nesse novo modelo?!

As chances do Galo ainda são boas, mas não tão boas quanto a maioria dos modelos matemáticos divulgados. Fiquei impressionado como o modelo inseriu uma diferença. Minha simulação não está considerando o Palmeiras 2 x 2 Atlético - MG e o Grêmio 2 x 2 Flamengo desta última terça-feira, 23/11, que para o atlético foi válida para a 35ª rodada do brasileirão e para o Flamengo foi a 2ª rodada! As chances do Galo devem ter aumentado após esses dois jogos, mas apenas ligeiramente, e agora o Flamengo tem apenas um jogo a menos do que a maioria dos times da série A do brasileirão.

No novo modelo, o Galo tem 97% de chance de ser campeão e o Flamengo 3% de chance. É de assustar qualquer Edward Murphy (aquele da lei) atleticano.* Mas ainda assim é uma boa chance para o Galo ser campeão. Infelizmente pra mim, que sou atleticano, é uma chance que ainda dá ao flamenguista alguma chance. 
                    Fonte: Cálculos desse Blogueiro a partir dos dados do brasileirão, 34ª rodada.


Mas como diz aquela máxima: "O futebol é uma caixinha de surpresas." E por isso eu digo: - "Vai Galo! Vai Galo!" 

Para quem quer saber quem tem chance (ou não) de ficar no G4 e assim garantir uma vaga direta pra libertadores, segue o gráfico e a tabela com as chances.

Fonte: Cálculos desse Blogueiro a partir dos dados do brasileirão, 34ª rodada.

Chances para o G4
Fonte: Cálculos desse Blogueiro a partir dos dados do brasileirão, 34ª rodada.
Obs: Sim, eu achei o modelo sofisticado um pouco "selvagem" para essas chances
de participação no G4. Acho que deve ficar algo entre o modelo simples e o sofisticado.

Quem está preocupado com o time cair, também calculei as chances. E logo depois também vai uma tabela.


                    Fonte: Cálculos desse Blogueiro a partir dos dados do brasileirão, 34ª rodada.

Chances de Rebaixamento para a série B (Uhh....)

Fonte: Cálculos desse Blogueiro a partir dos dados do brasileirão, 34ª rodada.
Obs: Mesma coisa, também achei o modelo sofisticado "selvagem" para essas chances
de participação no Z4 (rebaixamento). Acho que deve as chances reais devem
ficar algo entre o modelo simples e o sofisticado.

É claro que vou deixar isso tudo público. Segue aqui meu GITHUB para esse projeto desenvolvido todo na linguagem R, lá você pode baixar as rotinas. É um Projeto Open Source, quem quiser colaborar será muito bem vindo. Vou atualizar os dados com os jogos mais recentes e colocarei aqui. Essa rotina poderá ser usada também para calcular as chances até um pouco antes, 10 rodadas antes do término do campeonato, por exemplo. Porém, antecipar as chances em muitas rodadas não terá muito efeito prático para entender o campo de chances de cada time, eu sugiro algo sempre perto de 10 rodadas. Pretendo, no futuro e nas horas vagas, aperfeiçoar essas rotinas, incluindo o 'fator casa', apurando melhor as razões de chances de vitórias, derrotas e empates e deixando assim o modelo ainda mais sofisticado.

Para o modelo simples (naïve) fiz 13 mil simulações de fim de campeonato e para o modelo sofisticado (complexo ou melhor) fiz 400 simulações de fim de campeonato. Fazer as mesmas 13 mil simulações do modelo simples levaria muito tempo pra terminar as computações nesse modelo complexo. [Edit: Consegui otimizar o modelo nisso, agora dá pra fazer as mesmas 13mil simulações no modelo complexo sem perder tempo muito maior para isso].

* Mesmo que bem menor, qualquer valor positivo aqui deixa o Murphy atleticano ressabiado.

OBS Importante: Não calculei para a série B, apenas série A, assim o cruzeiro ficou de fora de qualquer chance >:-D