AtualidadesPolítica

Dissecando as teorias de fraude nas eleições brasileiras de 2022

Escrito em coautoria com Marcelo Guterman

Neste artigo, procuramos analisar, de maneira o mais imparcial possível, as principais denúncias de fraude referentes ao segundo turno das eleições presidenciais de 2022.

Em primeiro lugar, é preciso dizer que, mesmo a fraude sendo tecnicamente possível, ela requer uma tal cooptação de funcionários do TSE que se torna bastante arriscada: em primeiro lugar, seria preciso identificar as pessoas chaves, incluindo as que cobrem todas as etapas da fraude; em seguida, seria preciso comprá-las uma a uma. Qualquer falha pode ser fatal, ou para a pessoa que desnuda o esquema ou para todo o processo de fraude, se for a público. Aliás, este é um ambiente perfeito para chantagens polpudas… E não nos esqueçamos que Brasília deu uma vitória folgada a Bolsonaro. Ou seja, não devem faltar bolsonaristas no TSE dispostos a denunciar um esquema desse tipo, caso existisse.

Além disso, a votação paralela (processo de auditoria que simula uma votação real com urnas sorteadas, no mesmo horário da votação real) confere bem o processo da votação verdadeira, conforme explicamos neste artigo, exceto por uma “pequena” grande falha: não é possível simular a biometria, pois não se consegue voltar dos dados codificados para o dono da digital, ou seja, fica impossível simular um eleitor chegando com as suas digitais para o sistema eleitoral. Portanto, bastaria o processo fraudado se limitar a adulterar urnas em que aparece pelo menos um voto com biometria.

A boa notícia, é que esse ano, pela primeira vez, foi realizado um teste paralelo com biometria, em pequena escala, envolvendo eleitores reais, tornando a fraude bem mais difícil de se implementar, pois envolve complexos algoritmos de inteligência artificial, virtualmente impossíveis de serem feitos ou, no limite, o vazamento da identidade de todos esses eleitores.

A despeito de que a fraude seja difícil de acontecer na prática, parece claro que algum processo de transparência no sistema de urnas eletrônicas seria desejável, para transformar a segurança real, mas invisível, em uma segurança efetiva, com uma camada adicional que proporcione uma sensação de segurança para o cidadão leigo.

✱✱✱

Dentre as teorias disseminadas nos últimos dias, é possível destacar 5 vertentes, sendo as duas primeiras mais prevalentes (e assim, objetos de uma análise mais detalhada). Para tal, baixamos o resultado de todas as 472.027 urnas, incluindo o modelo de cada uma.

1 – Há mais de 100 urnas em que Bolsonaro não tem votos

De fato, houve 143 urnas sem votos para Bolsonaro e 4 urnas sem votos para Lula (duas delas em Caracas!).

Contexto da suposta fraude

A princípio, isto parece altamente intrigante. No entanto, só a princípio. Ao se examinar com mais detalhes, a razão fica cristalinamente clara.

Antes de refutarmos a fraude, vamos procurar nos colocar no lugar do fraudador, que desenha um algoritmo para simular votos em uma urna. O que você faria? Se o interesse é manipular e, ao mesmo tempo, passar despercebido, zerar votos de uma urna é, obviamente, a forma menos esperta de fazer isso. Primeiro, porque uma urna zerada chama a atenção de todos (aliás, não estaríamos escrevendo sobre isso se não houvesse urnas zeradas). E, em segundo lugar, porque uma urna zerada é o ambiente perfeito para uma auditoria informal: basta encontrar alguém com nome e CPF que tivesse votado naquela seção no candidato com zero votos, e que estivesse disposto a denunciar a fraude. Por incrível que pareça, até o momento, nas 143 urnas, que somam 11.858 votos para Lula, não se encontrou nenhuma boa alma que viesse a público para denunciar a fraude.

Convenhamos que este é um risco que um fraudador minimamente esperto não precisaria correr. Seria muito mais inteligente fazer uma redução percentual dos votos de Bolsonaro (na casa de uns 5%) e transferi-los para Lula, poupando as urnas onde Bolsonaro aparece com poucos votos. Isso tornaria o processo de detecção da fraude, apenas olhando para os boletins de urna, uma tarefa praticamente impossível. Só esse processo aumentaria a diferença a favor de Lula em torno de 10 pontos percentuais, o que seria mais do que suficiente para garantir a vitória em uma eleição apertada.

Refutação da fraude

         Mesmo assim, vamos analisar em maior profundidade essa “denúncia”:

Em primeiro lugar, separamos estas urnas sem votos para Bolsonaro em duas categorias:

  1. Urnas com 100 votos válidos ou mais: 66
  2. Urnas com menos de 100 votos válidos: 77

Fizemos esta divisão porque é menos provável que uma urna com mais votos seja unânime do que uma urna com menos votos. Por isso, o grupo 1, de 66 urnas, foi examinado em grande detalhe, observando e pesquisando os locais de votação: 42 destas urnas estão em locais indígenas, 19 em locais quilombolas e uma em um assentamento do MST, em município com altíssima votação pró-Lula. Das 4 urnas restantes, todas estão em ambiente rural de cidades bem pequenas do sertão nordestino, no Maranhão, Ceará e Piauí, e com mais de 85% de votos para Lula.

Apenas para ilustrar, uma dessas urnas do grupo 1 está em Charrua – RS, onde, em uma seção com 302 votos válidos, Lula obteve a unanimidade. Este caso chama a atenção, porque a votação no município ficou praticamente dividida, com Bolsonaro recebendo 51,5% dos votos e Lula, 48,5%. No entanto, o caso deixa de ser estranho quando se examina de perto o perfil étnico do município. Segundo o site infosanbas (uma das fontes que usamos para esta pesquisa), o município de Charrua está praticamente dividido ao meio em termos de perfil étnico, como podemos ver no gráfico abaixo, retirado do site:

Etnias do ambiente rural e urbano em Charrua – RS

Esta divisão entre “brancos” e “indígenas” provavelmente explica a votação dividida entre Bolsonaro e Lula no município, e é provável que os indígenas tenham votado, todos, no Ginásio Municipal da cidade, onde estão as três seções em que Lula obteve a esmagadora maioria dos votos.

O grupo 2 foi examinado com menos detalhe, procurando deduzir pelo nome do local de votação e mirando municípios com quilombolas oficialmente estabelecidos. Isto resultou em 7 urnas em locais indígenas, 39 em locais quilombolas, 11 em presídios, 18 em ambiente rural e 2 no exterior (Havana, em Cuba e Puerto Iguazú, na Argentina).

Das 18 seções em ambiente rural, 15 estão no Nordeste (com alta votação em Lula), uma está em uma comunidade remota e rural de Teresina e duas estão em comunidades remotas de cidades pequenas: Novo Cruzeiro, MG (77% votaram em Lula em uma seção com 71 votos) e Juruti, PA (59% votaram em Lula, em uma seção com 30 votos).

Com relação à votação em zonas indígenas e quilombolas, a baixa votação em Bolsonaro é compreensível. Bolsonaro referiu-se mais de uma vez de forma depreciativa aos quilombolas e territórios indígenas, referindo-se às demarcações e outras questões. Então é uma seara onde Bolsonaro deve ter tido mesmo muito pouco voto, ainda mais se levando em conta as lideranças fortes neste tipo de comunidade. No entanto, mesmo assim, há várias seções em quilombolas e aldeias indígenas onde Bolsonaro teve votos!

Com relação às zonas rurais, vamos fazer uma análise probabilística. Considere uma seção que tenha recebido 95% dos votos válidos para Lula. Qual a chance de uma urna com 99 votos válidos não ter nenhum voto em Bolsonaro? Cerca de 1 para 160 (0,9599). Fizemos um exercício em que levantamos todos os municípios em zonas rurais em que Lula recebeu mais de 50% dos votos e, nesses municípios, as seções com menos de 100 votos. Encontramos 3.687 seções com essas características. Para cada uma destas seções, usamos a fórmula acima para calcular a probabilidade de que Bolsonaro tenha recebido zero votos em cada uma das seções consideradas. Somando todas essas probabilidades, chegamos a aproximadamente 16 urnas em 3.687 seções. Portanto, o número de 18 urnas em zonas rurais com zero votos em Bolsonaro parece compatível com uma análise básica de probabilidades.

No grupo 1, temos 4 urnas em zonas rurais, sendo 3 com até 119 votos, o que diminui a chance para 1 em 448. Apenas uma urna, no sítio Ponta da Serra, que é uma comunidade agrícola, teve mais de 119 votos (159, para ser mais exato). Não se pode descartar, neste caso, compra de votos e/ou uma liderança forte.

2 – Urnas antigas “não-auditadas” foram fraudadas

Contexto da Suposta Fraude

Essa tese, segundo a qual Lula teve desproporcionalmente mais votos em urnas antigas, o que não condiz com uma distribuição aleatória dos votos, começou a ser difundida pelas redes sociais a partir do texto do argentino Fernando Cerimedo, publicado no canal do YouTube via o periódico “La Direcha Diario”. Esta não pode ser considerada uma fonte imparcial, porque o autor é assumidamente bolsonarista, tendo, inclusive, se encontrado com Eduardo Bolsonaro pouco antes do 2º turno.

O TSE desmentiu a tese do argentino, reforçando que os modelos antigos de urnas passaram por rigorosos testes antes de 2020, e em 2020 testou-se apenas o hardware novo, porque os modelos anteriores já haviam sido escrutinados. O modelo novo conta com um processador bem mais rápido, tela colorida, bateria mais possante, melhorias no teclado e na biometria e software embarcado do sistema operacional mais seguro. Reparem que não se trata do software eleitoral, mas do ambiente operacional, sobre o qual o software eleitoral roda. É como o Windows, que serve de base para todos os softwares que rodamos em nossos computadores. Uma versão nova do Windows não faz com que o Excel, por exemplo, seja diferente.

O ponto é que, obviamente, o software eleitoral é rigorosamente igual para todos os tipos de urna. Se o software fosse fraudado, ambas os tipos de urnas seriam alvos de fraude e não apenas as urnas mais antigas. Afinal, a urna, independentemente do modelo, não detectaria se o software foi fraudado ou não.

Cerimedo declarou que diferenças em um determinado log (registro em arquivo de todas as operações feitas em um determinado computador, e os resultados e mensagens exibidos) provaria que o software é diferente entre o modelo novo e os modelos antigos.  Isto não faz o menor sentido, porque estas diferenças podem ser devidas simplesmente à própria diferença entre as urnas (hardwares diferentes causam logs diferentes em sua inicialização), o que não tem nada a ver com o software das urnas em si.

Desenvolver dois softwares diferentes e manter isso incógnito seria uma conspiração rocambolesca e virtualmente impossível, é muito mais fácil fraudar um software único, com uma lógica só.

Refutação da Suposta Fraude

Já publicamos um artigo refutando essa tese do ponto de vista da localização dos municípios que receberam urnas novas e antigas (veja aqui). Em resumo, as urnas não foram distribuídas aleatoriamente, o que é condição inicial para qualquer análise probabilística. Em geral, foram as capitais e alguns municípios limítrofes que receberam urnas novas, enquanto os municípios do interior do país receberam as urnas antigas.

Então, quando se separa os resultados das urnas novas e antigas, na verdade está se separando os resultados das capitais e do interior. No Nordeste, onde Bolsonaro recebeu proporcionalmente mais votos nas capitais do que no interior, fica a impressão de que isso é devido à “idade” da urna, quando, na verdade, a diferença de votos se explica pelo perfil do eleitor. Esse é o efeito de uma distribuição não aleatória das urnas.

Além disso, há alguns outros problemas conceituais com a análise realizada:

  • Considerar apenas o tamanho do município como critério para apontar as ditas diferenças a favor de Lula, nas urnas antigas;
  • O nível socioeconômico do eleitor é muito mais relevante que o tamanho do município onde ele mora;
  • Comparações de municípios de mesmo tamanho entre estados diferentes, geralmente, são completamente espúrias. No mapa abaixo, observa-se que, mesmo dentro do mesmo estado, existem diferenças regionais muito relevantes, ainda que os municípios tenham tamanho similar.
No mapa fica claro pelas manchas as diferenças regionais, mesmo dentro de cada estado

Neste artigo, vamos procurar entrar mais no detalhe das características dos municípios, realizando um trabalho minucioso que tem por objetivo eliminar vieses decorrentes dos problemas citados acima.

Em primeiro lugar, vamos identificar os municípios que receberam somente urnas do modelo 2020 (de agora em diante chamadas de “urnas novas”), aqueles que receberam urnas de modelos anteriores a 2020 (de agora em diante chamadas de “urnas antigas”) e aqueles que receberam urnas dos dois tipos.

Dos 5.709 municípios brasileiros, em 581 (10,2% dos municípios, que respondem por 50,3% dos votos válidos) houve coexistência das urnas novas com as antigas. Nestes 581 municípios “mesclados”, Bolsonaro obteve 52,8% dos votos. Por outro lado, Lula obteve 54,4% dos votos nos municípios que receberam somente as urnas antigas (um total de 4.471 municípios) e 56,4% dos votos nos municípios que receberam exclusivamente as urnas novas (um total de 657 municípios).

Até aqui, somente estatística descritiva. Vamos ao cerne da questão. O argumento apresentado é de que urnas antigas favorecem Lula. Portanto, seria de se esperar que, em municípios mesclados, Lula tivesse proporcionalmente mais votos nas seções com urnas antigas em relação às seções com urnas novas. Ocorre que, nestes municípios, Lula tem apenas 0,7 pontos percentuais de votos a mais na apuração pelas urnas antigas (26,2% dos votos válidos nesses municípios) em relação às urnas novas, ajustado pelo número de votos válidos em cada município.

Vale destacar que este número é uma média dos municípios de todo o Brasil que receberam ambos os tipos de urnas, com eleitores que votaram tanto a favor como contra Lula, e comparando a votação de Lula em urnas novas e antigas dentro de cada município. Ou seja, não há, aqui, como identificar viés de qualquer tipo, o que se reflete no quase empate dos resultados obtidos.

Para entender por que essa diferença a favor de Lula (0,7 pontos percentuais em municípios “mesclados”) é irrelevante, vale constatar que essa diferença é de apenas cerca de 183 mil votos e é praticamente 100% concentrada no estado de São Paulo, em um total de mais de 14 milhões de votos válidos. O estado de São Paulo tem quase 60% dos votos apurados nos municípios mistos em urnas dos modelos antigos, sendo que, no resto do Brasil, este percentual se reduz a apenas 4,3% dos votos válidos. Assim, seria muito estranho montar um enorme esquema de fraude apenas restrito ao Estado de São Paulo. Portanto, aparentemente, podemos descartar fraude nesse universo das cidades “mescladas”.

 No entanto, mesmo assim, vamos avançar um pouco mais no detalhe e usar uma outra metodologia para testar os resultados nos municípios que receberam os dois tipos de urnas. Para tanto, vamos selecionar municípios que não pertencem a regiões metropolitanas, e cujos resultados possam ser comparados com municípios semelhantes em termos geográficos e de tamanho, mas que receberam apenas urnas antigas. Assim, teremos dois grupos de municípios: i) os municípios que receberam ambos os tipos de urnas e ii) um grupo de controle, formado por municípios semelhantes, mas que receberam somente urnas antigas.

Para estes dois grupos, vamos comparar o resultado das eleições de 2022 com as eleições de 2018, quando Bolsonaro disputou o segundo turno com Fernando Haddad (PT). Se houvesse algum vício que afetasse somente as urnas antigas, seria de se esperar que os municípios do grupo de controle apresentassem diferenças sistematicamente maiores entre a votação de 2018 e a votação de 2022 do que os municípios que receberam urnas mistas. Isso porque as urnas antigas, se fossem fraudadas, “puxariam” a votação para Lula em 2022, e os municípios que receberam exclusivamente essas urnas deveriam apresentar diferença maior em relação a 2018.

Lembrando que, em 2018, obviamente não existiam urnas 2020, de modo que todas as urnas eram igualmente “não-auditadas”. Partimos, então, dessa base comum de urnas “não-auditadas” em 2018, e medimos a variação para 2022 nesses dois tipos de municípios (municípios só com urnas antigas e municípios com urnas mistas).

Assim, levantamos cada município com urnas mistas, e que não pertencem oficialmente a uma zona metropolitana, e chegamos a um total de 119 municípios dessa natureza, ignorando-se os municípios com menos de 50 mil eleitores, que, nesta categoria, correspondem a apenas 4,3% dos votos válidos e não seriam capazes de mudar o resultado de uma eleição. Encontramos três tipos de municípios:

Tipo 1: 69 das 119 cidades da lista ficam no estado de São Paulo e, neste caso, não foi possível encontrar boas cidades para comparação, porque o processo de troca de urnas antigas por urnas novas aconteceu também em quase todas as cidades maiores do interior.  Só sobraram duas cidades de tamanho razoável, ambas bem próximas da capital: Caieiras e São Roque. Como em muitos dos municípios de São Paulo, houve nestas duas cidades um aumento de votos para o PT entre 2018 e 2022, que foi da ordem de 10,8 pp. Só que mesmo nas urnas novas da capital (em tese, “auditadas”), o aumento da votação para o PT chegou a 13,4 pp.

Tipo 2: 7 municípios em que não se encontrou um município comparável: Caxias, Timon e Imperatriz (município em que Bolsonaro venceu tanto em 2018 quanto em 2022), municípios do Maranhão que registraram um discreto aumento da votação em Lula sobre a votação de Haddad em 2018 da ordem de 0,5 pp, enquanto as urnas novas de São Luís registraram um aumento de 2,6 pp sobre 2018. Depois temos dois municípios de Rondônia (Ariquemes e Ji-Paraná), que registraram um aumento de 1,2 pp de votação em Lula sobre Haddad em 2018, contra 4,8 pp em Porto Velho, em urnas novas. Finalmente, os municípios de Araguaína e Gurupi, em Tocantins, que registraram uma queda média de 2,6 pp da votação em Lula, contra um aumento de 9,8 pp em Palmas, a capital, nas urnas novas.

Tipo 3: Finalmente, 43 municípios em que foi encontrado ao menos um outro município próximo no mesmo estado com população mais ou menos comparável, que usou apenas modelos de urnas anteriores a 2020. Este é o grupo que nos interessa para testar a tese. O resultado: nesse grupo de municípios, a diferença entre a votação de 2022 em relação à votação de 2018 é, em média, menor em 0,69 pontos percentuais para municípios do grupo de controle (que só receberam urnas antigas) do que para o grupo de municípios que receberam ambas as urnas. Ou seja, um resultado contrário ao que se poderia esperar se as urnas antigas tivessem sido fraudadas.  Claro, a diferença é muito pequena para se chegar a qualquer conclusão sobre urnas viciadas, mas não deixa de ser interessante observar que Lula, na verdade, apresentou performance numericamente pior nas urnas antigas, quando controlamos devidamente as variáveis ocultas.

🞴 🞴 🞴

Para terminar este tópico, vamos agora fazer uma segunda análise, comparando-se municípios que receberam apenas urnas novas com municípios que receberam apenas urnas antigas, que foi basicamente a estratificação usada por Cerimedo.

Aqui vamos comparar a votação em 2022 com a votação em 2018, como fizemos acima. Optamos por estratificar as cidades que não mesclam urnas velhas e urnas novas, separando-se a análise das regiões metropolitanas das regiões não metropolitanas, e então cruzando-se com o porte dos municípios para cada estado. A partir dessa análise, focaremos basicamente nos cruzamentos que mostrarem um benefício aparente para Lula.

O que se observou é que, nos municípios fora das regiões metropolitanas, a única área em que Lula leva aparente vantagem nas urnas antigas é nos municípios com 100 a 200 mil eleitores, e apenas no estado do Paraná.

Nas urnas antigas, o município que desequilibrou a favor de Lula foi Guarapuava, a 255km a oeste de Curitiba, que deu 45,8% para Lula, o que, para o Paraná, foi muito. Só que em 2018, dentre os municípios desta faixa, Haddad obteve 42,67% de votos em 2018. Portanto, houve um acréscimo de apenas 3,1 pp sobre 2018.

As outras duas cidades com urnas antigas foram Foz do Iguaçu e Toledo, que tiveram um acréscimo sobre 2018 de respectivamente 4,1 pp e 3,6 pp. 

As urnas novas, pretensamente não adulteradas, são representadas, nessa faixa de número de eleitores, apenas pela cidade de Paranaguá, perto de Curitiba. Nesta cidade o acréscimo da votação em Lula em relação a Haddad em 2018 chegou a 9,6 pp! Em suma, os municípios com urnas antigas já projetavam um desempenho melhor de Lula, se olharmos para Haddad (PT) nas eleições de 2018, e não por causa do modelo das urnas.

Já nos municípios entre 50 e 100 mil eleitores, Bolsonaro ficou na frente, na média, por 3,3 pp. O único estado em que Lula levou vantagem nas urnas antigas foi o estado do Maranhão. Analisando com mais detalhe, aparece Açailândia, com urnas novas e 46% de votos para Lula, um decréscimo de 2,5 pp sobre a votação para Haddad em 2018, que é menor que a queda de cada uma das duas cidades com urnas antigas, onde pretensamente Lula teria levado vantagem (Balsas e Barra do Corda). Nestas cidades, observou-se, respectivamente 3,3 pp e 4,6 pp de queda em relação a 2018, sendo que, em Barra do Corda (quase 500 km ao sul de São Luís), Lula teve 66,4% de votos esse ano, e Haddad teve 71,0% em 2018. Ou seja, isso explica porque, olhando apenas 2022, essas duas cidades obtiveram um desempenho melhor do PT, descartando-se algum esquema de fraude.

Nos municípios com menos de 50 mil eleitores, Bolsonaro ficou na frente por 0,1 pp nas urnas novas. São muitos municípios: 557 com urnas novas e 4.120 com urnas antigas, tornando muito demorada e trabalhosa qualquer análise mais pormenorizada. O que se pode dizer é que essa média é a composição dos votos de 22 estados.

Nos municípios das regiões metropolitanas, só conseguimos comparar municípios da mesma faixa populacional nas faixas de 50 a 100 mil eleitores e até 50 mil eleitores.

Na faixa de 50 a 100 mil, em que Bolsonaro tem uma vantagem de 15,6 pp a mais nas urnas antigas do que nas urnas novas, essa vantagem se dá por um único município do Rio Grande do Sul, Guaíba, na região metropolitana de Porto Alegre, onde Lula obtém quase metade dos votos nas urnas novas, e bem mais votos do que nas cidades com urnas antigas localizadas no mesmo estado dentro da mesma faixa populacional (Cambo Bom e Sapiranga), locais em que a suposta fraude deveria alavancar Lula, devido ao modelo antigo das urnas.

Na faixa até 50 mil, Bolsonaro tem uma vantagem de 15,1 pp nas urnas velhas, e aí são muitos municípios, então nem vale à pena mergulhar, já que o resultado agregado o favorece ao invés de prejudicá-lo.

Conclusão

O fato é que, mesmo tendo encontrado diversos percentuais a favor de Bolsonaro nas urnas antigas, isso não prova nem evidencia que houve fraude no sentido contrário. No entanto, fica claro que as alegações de fraude pelo modelo da urna foram muito mal formuladas e partindo-se apenas de uma análise parcial, em que só se considerava o tamanho da cidade e, por vezes, o estado ou região. E o exposto acima torna claro que não há como concluir sobre algum vício em qualquer direção.

As planilhas com os resultados podem ser disponibilizadas para os interessados.

3 – Gráficos que evidenciam fraude

Vários gráficos apareceram por aí “provando” a fraude pelo formato do gráfico. Um dos gráficos é esse aqui, que apareceu no Instagram de um tal data.captain:

Note a estranha assimetria entre as 2 curvas: parece bizarro, mas tem explicação

O gráfico não está errado, nós o refizemos e é isso mesmo. Ocorre que esta é apenas a versão gráfica do “Bolsonaro recebeu zero votos em muito mais urnas do que Lula”. É exatamente isto que mostra esse gráfico, mas não somente para zero votos, mas para 1, 2 etc. votos. Ou seja, Bolsonaro tem muito mais urnas com poucos votos do que Lula. É este fenômeno que causa o “formato estranho” do gráfico de Bolsonaro acima.

O que isto quer dizer? A rigor, absolutamente nada. Uma curva normal é esperada quando tratamos de eventos aleatórios. A distribuição de votos em uma eleição pode ser tudo, menos aleatória. A geografia tem um grande papel na distribuição dos votos. Como já desenvolvemos amplamente na parte 1 desse artigo, esse tipo de anomalia decorre do fato de que Lula foi muito bem em muitas urnas pequenas, geralmente situadas em vilas bem remotas ou aldeias indígenas ou quilombolas, gerando essa estranha inflexão na curva de Bolsonaro. No gráfico de Lula, essas urnas em que Lula foi quase ou totalmente unânime aparecem no centro do gráfico, confundindo-se com as urnas em que ele teve, por exemplo, 50% dos votos.

Por exemplo, na zona eleitoral 80, seção 254 do município de Anapu-PA, onde Bolsonaro recebeu zero votos, Lula recebeu 157 votos. Os mesmos 157 votos foram recebidos por Lula no município de Tabatinga, zona eleitoral 36, seção 96, onde Bolsonaro recebeu 155 votos. A diferença é o tamanho da urna: em Anapu, a seção 254 da 80ª. zona eleitoral recebeu 157 votos, enquanto em São Caetano do Sul-SP, a seção 149 da zona eleitoral 269 recebeu 312 votos. A média de votos válidos nas urnas em que Bolsonaro recebeu até 10 votos é de 135 votos válidos, contra uma média geral de 252 votos válidos por urna. Ou seja, Bolsonaro recebeu poucos votos em urnas cujo tamanho médio é pouco mais da metade da média geral.

Demonstramos este fenômeno neste outro gráfico, onde plotamos o percentual de votos para Lula e Bolsonaro por tamanho da urna.

O sorriso na curva azul e a expressão de tristeza na curva laranja

Note como o gráfico de Lula é elevado nas pontas, com uma depressão no meio, o inverso ocorrendo para Bolsonaro.  O que acontece justamente é que urnas muito pequenas e urnas grandes são comuns em ambientes rurais e comunidades mais remotas e menos populosas. Às vezes, uma urna eletrônica atende por toda a demanda de uma vila. A região caótica à direita decorre justamente da raridade desse tipo de urna, acima do padrão usado normalmente, o que leva a esse gráfico selvagemente serrilhado.

Quem conhece um pouco de estatística sabe que gráficos devem ser tomados com muita cautela. Correlações espúrias, observações insuficientes e manipulações grosseiras de escala podem fazer dos gráficos uma ferramenta de fraude intelectual. Por isso, a interpretação de gráficos deve ser cuidadosa, sempre procurando entender de onde vieram aqueles dados e como o gráfico foi feito. Caso contrário, os gráficos podem assumir o papel de “sinais cabalísticos”, como códigos secretos na Bíblia ou as metáforas de Nostradamus, que parecem indicar o fenômeno que queremos ver.

4 – A questão do horário do voto

Houve desconfiança em relação ao volume de votação após as 17h, o que indicaria fraude. A extrapolação do horário de votação apenas indica desorganização e ignorância em cada local por parte de eleitores, mesários etc. São as filas de retardatários que ficam depois do horário de encerramento da votação até conseguirem votar de fato.

Apenas isto.

5 – A coincidência da virada

Muitos alegaram que voltou a ocorrer a virada de Lula sobre Bolsonaro, como no primeiro turno, o que denotaria um suposto controle sobre a apuração, que rodaria parelho com a fraude para tirar a vitória de Bolsonaro.

Primeiro, não houve tanta coincidência assim. A virada, no segundo turno, foi prematura. Às 18:44 Lula já estava na frente com 2/3 das urnas apuras e assim ficou. No primeiro turno, a virada só aconteceu por volta das 20 horas.

O que determina esse atraso é a dificuldade de obter acesso à Internet nos rincões. Como a urna é desvinculada da Internet, é preciso um tipo especial de pen drive para receber os boletins e transportá-los para um lugar que tenha Internet.

Isso acontece particularmente no Norte e no Nordeste. E o padrão, em linhas gerais, tende a se repetir de eleição em eleição, visto que a infraestrutura de Internet, em geral, é a mesma em todas as eleições.

Claro que este fenômeno sofre algum tipo de variabilidade, em função do transporte de dezenas de milhares de pen drives, que, obviamente, não segue um padrão rígido.

Considerações finais

A frase que sempre ecoa nestas horas é o famoso dito de Carl Sagan:

Alegações extraordinárias exigem evidências extraordinárias.

Existem corrupção, compra de votos e negociatas? Claro!

Agora, imaginar um gigantesco complô para fraudar as eleições, sendo que o partido de Bolsonaro elegeu uma vasta bancada de deputados, senadores e diversos governadores, que também poderiam ter sido varridos pela fraude e não o foram, parece estar mais para ficção científica.

Como esperamos ter demonstrado neste artigo, a existência de urnas com zero votos (a fraude mais tosca que existe!) ou urnas antigas fraudadas, mas não as novas ou um gráfico esquisito, ou o horário do voto depois do encerramento ou viradas sincronizadas, estão longe de servir como evidências consistentes de fraude.

É justo defender algum processo de maior transparência nas urnas para o cidadão comum, avesso a questões tecnológicas. Pode-se, inclusive, questionar o processo eleitoral como um todo, incluindo a atuação do TSE na moderação do debate. Mas, no que concerne às urnas em si, acreditamos que não há base material para se suspeitar dos resultados da eleição de 2022.

Paulo Buchsbaum

Fui geofísico da Petrobras, depois fiz mestrado em Tecnologia na PUC-RJ, fui professor universitário da PUC e UFF, hoje sou consultor de negócios e já escrevi 3 livros: "Frases Geniais", "Do Bestial ao Genial" e um livro de administração: "Negócios S/A". Tenho o lance de exatas, mas me interesso e leio sobre quase tudo e tenho paixão por escrever, atirando em muitas direções.

Artigos relacionados

19 Comentários

  1. A respeito da afirmação do texto “A despeito de que a fraude seja difícil de acontecer na prática,” temos o inverso também como válido: “a despeito de que a transparência fica aquém do desejável, fica difícil comprovar a fraude na prática”. Isto posto temos que detectá-la por indícios que, sem a completa entrega do código para escrutínio PUBLICO e IRRESTRITO, sempre será objeto de dúvidas, nunca de afirmações categóricas.
    Entre estes INDÌCIOS destaco a seguir a DIFERENÇA de logs de urnas gerados entre modelos de urnas diferentes, o que OCNTRADIZ o requerimento de que o sistema é único para todas elas.
    Na urna da minha seção, n. 2012941, modelo 2020, temos o log se iniciando desta forma:
    17/09/2022 08:05:31 INFO 2012941 LOGD Início das operações do logd B980B8FF20DA76DC
    17/09/2022 08:05:31 INFO 2012941 LOGD Urna ligada em 17/09/2022 às 08:05:01 3D6338590D01E33F
    17/09/2022 08:05:31 INFO 2012941 SCUE Iniciando aplicação – Oficial – 1º turno AABF240E32522DB7
    17/09/2022 08:05:31 INFO 2012941 SCUE Versão da aplicação: 8.26.0.0 – Onça-pintada B6FADFBEB85950E2

    Já numa urna aqui da cidade vizinha, n. 1242281, modelo 2010, temos o mesmo inicio de log
    23/09/2022 09:15:19 INFO 67305985 LOGD Início das operações do logd 08AF2EE99F930035
    23/09/2022 09:15:19 INFO 67305985 LOGD Urna ligada em 23/09/2022 às 09:14:05 95A8D8DD56D26F6A
    23/09/2022 09:15:19 INFO 67305985 SCUE Iniciando aplicação – Oficial – 1º turno F8AE856CEB0DEA32
    23/09/2022 09:15:19 INFO 67305985 SCUE Versão da aplicação: 8.26.0.0 – Onça-pintada EDF630E421F6B72F

    Vê-se:
    1) MESMA VERSÂO da aplicacação em ambos: 8.26.0.0
    2) Desalinhamento das colunas entre ambos
    3) Na quarta coluna do primeiro log vê-se o numero da urna, já no segundo log um número “inexplicado” (não consegui o associar a nada, pois nem está no range do n. de urnas válidos, como seria de se experar.

    Perguntas: mesmo aplicação não deveria gerar logs igualmente formatados e com dados compatíveis em urnas diferentes?

    Como eu disse antes, não podemos constatar fraude diretamente a partir de um indício como este, mas a partir do momento em que detectamos softwares diferentes sendo oficialmente declarados como iguais todos os pressupostos de segurança podem ser igualmente questionados. O que você tomou por “difícil na prática’ cai por água abaixo.
    E caso vc não tenha reparado, a FALHA É MAIS GRAVE do que parece, pois não existe NENHUMA forma de associar o log à urna específica. Qualquer log pode ser atribuído a estas urnas já que não existe correspondência que deveria ser bionívoca!

    1. Não vou aqui patrocinar um longo thread porque já fizemos isso no Facebook. Então você possivelmente terá a última palavra aqui.

      Não é este o foco do artigo. O objetivo foi detalhar as teorias que tiveram alguma popularidade junto às hostes bolsonaristas.

      Depois, provavelmente o software eleitoral é o mesmo, ainda que use rotinas do sistema operacional subjacente. Mesmo que tivesse fraude, seria muito mais fácil e com menos danos colaterais manter a fraude dentro de um ambiente de unicidade do sistema eleitoral.

      Depois, vale acrescentar: ainda que tudo o que você falou é válido, e o TSE deveria uma explicação à sociedade disso (ela nunca o faz detalhadamente), isto não implica em fraude das urnas.

      Existem as seguintes possibilidades.
      a) Sistemas operacionais dão mensagens diferentes para rotinas que são chamadas indiretamente pelo sistema eleitoral.
      b) É possível também que diferentes máquinas e versões do Linux usem diferentes compiladores, montadores,e geradores de código, o que dá margem a bugs e/ou diferenças na saída.
      c) É muito comum programas de alto nível usaram IFs (comandos de condição) para diferentes máquinas e sistemas operacionais alvo, o que da, novamente, margem a bugs e/ou diferenças na saída.

      PS: Evite usar maiúsculas para escrever na Internet, o que é sinônimo de gritar.

        1. Vc viu o comentário no final deste texto que me enviou?

          Tip: All caps are best used only for short strings of words rather than full sentences. You could choose instead to use italics or bold to set off text for emphasis.

          “Short string of words” é exatamente o que eu faço, justamente pela impossibilidade de usar as alternativas propostas (itálico, etc) nas mídias em questão.

  2. Seu cálculo probabilístico está errado; dá 2 urnas com 0 votos no país, e teve 141.
    Mas sabe quem vai mostrar? Ninguém.
    Há censura, há prisões ilegais, há multas, há toda uma distorção do processo eleitoral que ninguém vai disputar, pq não quer ir preso.
    Vai pagar p ver se empresários conversando no whatsapp privado deles tiveram conta bancária congelada, mandato de busca e apreensão?
    Vai pagar para ver depois q Cintra, depois de críticas a Bolsonaro, disse q suas reclamações deveriam ser investigadas, e recebeu mandato de busca e apreensão, PF batendo na porta?
    Criminalizaram a análise de dados. Só há vozes de um lado, o possível.
    Procura usando VPN, pq no nosso país existe censura, os executivos da Smartmatic q já foram presos por vender código p a trapaça.
    Quem faz isso tem boas intenções? Quem faz isso quando o processo é liso? A perda da liberdade de expressão serve à democracia, ou serve ao crime?

    1. É complexo explicar, mas irei tentar: posso mandar por planilha toda a análise estatística que nós fizemos.

      Não usamos um tamanho fixo de urna de 99 votos. Usamos o tamanho real da urna no nosso cálculo.

      Um resumo:

      Planilha StatEleit.xlsm – aba ‘CidsUrnasZer’

      Há ali uma longa tabela: a 1a. coluna (coluna A) é o tamanha da urna variando de 1 a 99 votos válidos, a linha 1 representa a faixa de votos para o Lula no município todo a partir de 50%, dividido em faixas de 5% (50 a 55%, 55 a 60%, etc.), a linha 2 representa uma estimativa grosseira de % provável de votos em Lula nos rincões do município a partir da média, que sempre é maior porque aumenta a pobreza e baixa o nível educacional nas partes mais remotas de um município no interior. (50 a 55% vai para 60% de votos para o Lula, 55% a 60% vai para 65% de votos para o Lula etc.)

      A tabela contida entre as linhas de 4 a 102 e as colunas de B a J, representa o resultado de um programa que contou as urnas dentro de cada faixa de votos válidos totais da urna e faixa % de votos de Lula no município onde está a urna.

      Já a tabela contida entre as linhas de 4 a 102 e as colunas de L a T, representa a probabilidade do Bolsonaro ter tido 0 votos naquela combinação de % de votos estimada para Lula nos rincões e no. de votos válidos na urna.

      A fórmula é
      Probabilidade 0 votos Bolsonaro = % Lula estimado ^ ( No. votos válidos da urna) * Número de urnas nessas condições, e ela usa a propriedade que se pode somar probabilidades independentes.

      Depois soma-se a região B4:J102 para obter o total de urnas nestas condições e depois soma-se a região L4:T102 (novamente, probabilidades independentes) para obter a probabilidade total, o que dá também a expectância de urnas nestas condições (0 votos para Bolsonaro) , o que dá 16,3 urnas.

  3. Primeiramente parabéns aos editores do artigo! Responsável e embasado. Sem qualquer tipo de abordagem política, mas sim avaliação criteriosa e estatística com considerações ponderadas. Obrigado pelo trabalho!

  4. Tem alguns furos na argumentação utilizada neste artigo, mas vou destacar apenas 2 fatos para ilustrar. Foram utilizadas bibliotecas de terceiros nos softwares das urnas e não é possível garantir que todas as urnas utilizaram o mesmo software. O relatório do exército é bem claro sobre isso.

    1. Veja a resposta que eu dei acima para o Fabio Ramon.

      Biblioteca de terceiros, sim, e em grande partes delas há menos auditoria (eu concordo), porque são milhões de linhas. Ex: utilitários para ligar com o teclado da urna. Pode haver alterações específicas lá não detectadas? Sim, mas isso ainda não explicaria a diferença de logs.

      Só que isso não altera a unicidade do software eleitoral: na hora de montar o sistema eleitoral, o sistema em si é único, pode haver diferenças nos penduricalhos e na library, dependendo da máquina alvo.

      Como falamos claramente no artigo, a hipótese de fraude não está descartada, só não é o foco do artigo.

    1. Este trabalho nem menciona o erro na quarta coluna do log. Parece que as pessoas que querem derrubar alegações falsas só se preocupam com as evidentemente falsas e deixam de fora as que realmente são intrigantes. Nem faz sentido analisar um log por diferenças que podem perfeitamente ser atribuída a um desvio esperado do comportamento padrão e deixar de analisar um erro que fere a especificação deste log, o que, sob qualquer aspecto, é um comportamento fora de qualquer desvio aceitável.

  5. Paulo, você fez um belo trabalho para provar que as evidências apresentadas pelas teorias de fraude não se sustentam. Entretanto, você deixou registrado no artigo e várias vezes nas suas respostas aos comentários, que não descarta a possibilidade de fraude.
    Como notei sua louvável imparcialidade, poderia então nos brindar com uma análise tentando provar o contrário?

    1. Do ponto de vista técnico sempre será possível. Onde existe programa, existe a possibilidade da fraude.

      Como não conheço a estrutura interna do TSE, que tem mais de 400 técnicos de Informática, fica difícil estimar quantas pessoas seriam preciso comprar para fazer a fraude acontecer.

      Vamos supor que existam 10 pessoas, em horário normal, alternativo e substitutos nas férias, sejam responsáveis pela conferência do hash das máquinas no TSE. Seria preciso comprar todas estas 10 pessoas, para que a segurança do hash seja violada. Seria preciso fraudar o log dos funcionários, para apagar vestígios etc.

      Agora, em relação à eleição em si, não é difícil refutar teorias esdrúxulas de fraude, mas é virtualmente impossível provar a ausência da fraude, até mesmo porque se ela for bem engendrada, ela não deixa vestígio a partir dos votos computados.

      A ausência de evidência não necessariamente implica em evidência de ausência.

      Provar que existe um corvo preto é fácil. É só mostrar um deles. Agora provar não NÃO existe um corvo amarelo é quase impossível. Seria preciso alcançar todos os corvos que estão no planeta.

      È meio por aí. Pode-se mostrar que existir uma fraude, ainda que seja possível, é implausível, assim como, a esta altura do campeonato, existir um corvo amarelo seria bastante improvável.

      Disto isso, defendemos algum processo, por amostragem, mais robusto para conferir transparência ao processo eleitoral. Pode por impressora, mas também pode ser por filmagem contínua da tela, divido por software voto a voto. Obviamente fazer segurança quase inexpugnável de 500 urnas contendo votos impressos, é muito mais factível e barato do que fazer a segurança de 472 mil urnas.

    2. Carlos,

      Toda a argumentação da implausibilidade de uma fraude dada pelo Paulo é unicamente baseada na impossibilidade de um “complô” envolvendo tantas pessoas. Veja meu comentário sobre o erro grosseiro de geração de arquivo de log, que aparentemente passou despercebido por todos os que testaram as urnas, dentro e fora do TSE.
      Para mim fica claro que a plausibilidade da fraude não ser percebida por estes testadores é anda mais forte ainda. Se não conseguiram identificar uma discrepância entre uma especificação e uma arquivo gerado (um entre apenas dois) quanto mais conseguiram identificar um código malicioso inserido por apenas um funcionário?
      Desta forma, uma imparcialidade justa ponderaria a plausibilidade de cada evento. Se um erro grosseiro é real e concreto a despeito de toda as salvaguarda que alegam existirem, a plausibilidade de uma fraude deliberada é perfeitamente aceitável, sem exigir grandes complôs ou esquemas. Inversamente a implausibilidade de que um teste realmente rigoroso tenha seguer existido é igualmente real.
      Em outras palavras: ninguém pode alegar a existência ou não de fraude, mas os fatos mostram, por si só, que a ocorrência dela seria por demais fácil. Mais fácil do que evita-la. Nesta balança temos algo pendendo para um lado sem sombras de dúvidas. E não pelo lado da segurança.

      1. Concordo plenamente com seus comentários Fábio. Realmente não é preciso fazer um complô, envolvendo vários funcionários para inserir uma linha de código no programa com a seguinte função: “se o horário de geração do relatório for feito entre 17hs e 24hs do dia 30/10/22, contabiliza os votos da seguinte forma… “. Nenhum teste ou auditoria pegaria esta situação se não fosse feita neste dia e horário. Além disso, descobrir esta rotina maliciosa, mesmo que debugando as 17 milhões de linhas de código, ainda seria praticamente impossível. O pessoal esquece que havia lá um diretor de TI, com plenos poderes, que era muito afinado com o Barroso.

        1. O ambiente do TSE é uma caixa preta para mim, mas qualquer ambiente de TI relativo a um software sensível, que seja minimamente profissional tem que fazer 2 coisas, em meio a um monte de outras.

          A) registrar em um arquivo (“logar”) toda operação realizada nos computadores envolvidos, incluindo versionamento completo dos fontes (sistema à parte, em geral), com nome do usuário, hora e computador que em que a operação foi feita. Vários ambientes que eu tive experiência, mesmo sem tanta necessidade, havia esse tipo de providência, o que dirá em um ambiente como TSE. Já vi até “pegarem” sabotadores com esse tipo de log.

          B) Há um monte de alternativas, mas é preciso periodicamente checar a integridade de todo o parque de computadores em uma rede, de forma a que essa verificação seja protegida de ataques. Em tese, se o sistema operacional contaminado executa sua própria verificação, o resultado não é confiável.

          Um exemplo prático na nossa casa seria tentar deletar um vírus sofisticado no Windows sem antes dar boot. O próprio vírus, por vezes, se protege, e o vírus permanece. Assim, por vezes, você precisa dar boot de um pen drive de recuperação, que carregue um sistema operacional independente, para não ficar contaminado.

          Ver aqui uma curta visão geral de desenvolvimento de software seguro:
          https://hyperproof.io/resource/secure-software-development-best-practices/#:~:text=Secure%20software%20development%20is%20a,testing%20reveals%20critical%20product%20flaws.

          Logs (Security log management and logging best practices) –
          https://www.techtarget.com/searchsecurity/tip/Security-log-management-and-logging-best-practices

          Certificando integridade em ambientes de rede – Ensuring Data Integrity in Storage: Techniques and Applications
          https://www.fsl.cs.sunysb.edu/docs/integrity-storagess05/integrity.html

          Essas 2 atividades (dentre outras) têm pessoas envolvidas, mais as pessoas de férias, pessoas de outros turnos etc.

          Se não houver nada disso, aí é mole. Bastaria 3 a 5 pessoas de dentro, espertas, que não sendo vigiadas, poderiam fazer tudo, a partir de patches que atuariam no executável principal e/ou em executáveis auxiliares. Já não há hash de arquivo ou computador, ou o hash existe, mas está contaminado pelo próprio ambiente, tudo fica muito elementar.

          Precisa de mais do que uma pessoa, porque a cada mudança de software, em diferentes horários, o patch tem que rodar novamente. Não pode ter alteração direta nos fontes principais do software eleitoral, porque isso terminaria sendo descoberto, já que muitas pessoas de dentro (não sei quantas) podem ver os fontes.

          Se o ambiente do TSE não cumpre nem estes requisitos básicos, aí babou.

          Agora pense o seguinte, em uma cidade como Brasília com alta percentagem de Bolsonaristas, qual a chance dentre mais de 400 técnicos de Informática concursado não ter ninguém que ponha a boca no mundo denunciando que está em um ambiente ruim, fragilizado e com mais furos do que uma peniras. Basta a pessoa ler a página 2 de qualquer livro ou artigo sobre ambiente de desenvolvimento de software “sensível”.

          Essa é a minha última resposta porque aqui não pode funcionar como chat e o Fabio Ramon tem o hábito no Facebook de gerar threads com discussões infinitas e que nunca vão a lugar nenhum.
          Isso tira o foco de trabalho e a paciência das pessoas envolvidas por uma longa e infrutífera interação.

          1. Reafirmo a plausibilidade de um código malicioso estar presente é muito grande e independe do ambiente ser ruim. Basta não ser ótimo. Um “bom” já seeria possível e não geraria alarmes,. Não existe a necessidade de um ambiente “ruim ou fragilizado” para que uma pequena brecha seja encontrada. Existe a necessidade de um ambiente bom e robusto para que não existam pequenas brechas. Como vimos pela falha dos logs fica evidente que o ambiente não é robusto e tampouco bom.

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Verifique também
Fechar
Botão Voltar ao topo
%d blogueiros gostam disto:
Send this to a friend