top of page

Fichamento do Livro: Como mentir com estatística



Existem três tipos de mentiras: as mentiras, as mentiras deslavadas e as estatísticasBenjamin Disraeli, ex-primeiro-ministro do Reino Unido

A amostra com tendenciosidade embutida: O ser humano é acima de tudo, limitado em seus sentidos, seu conhecimento e visão de mundo é limitada àquilo que naturalmente conhece (ou acredita conhecer). Dito isto, a parcialidade refere-se, em via de regra, às pessoas que julgam algo que aconteceu a partir daquilo que conhecem.


Agora imagine um indivíduo dotado de uma visão neutra. Difícil, não é?


Embora seja fácil visualizar como se produz a seleção de uma amostra, o critério de seleção impacta o estudo realizado, uma vez que é leva em conta a percepção da realidade do pesquisador.


O que é mais frequente nas esferas de cunho político, no qual acreditam que estas, de forma geral, costuram muitas informações a fim de anunciar uma hipótese estatisticamente validada que, consequentemente, chegam a uma conclusão positiva do intuito da pesquisa.


Huff, autor do livro, reforça a tendenciosidade nas amostras que, no final das contas, podem manipular intencionalmente até automaticamente as pesquisas, dos mais graves efeitos, para defender a hipótese do que é encontrado, por exemplo, está nas medidas escolhidas.


Não são bem as coisas que não sabemos que nos causam problemas. São as coisas que sabemos que não são assim.Artemus Ward, Escritor Americano.

Uma medida para chamar de sua


Todas as medidas advogam em cima de uma base de dados, elas representam um conjunto matematicamente resumido sendo que umas são mais gerais, outras mais específicas e incisivas a depender do critério.


Tomando como exemplo a “média” que não possui especificidade na descrição, sem filtro ela resume em um número, o total cumulado dividido pelo somatório de ocorrências, ao utilizá-la – sem o filtro adequado para descrever a ocorrência – o número tende a descrever um público maior do que realmente ele realmente é.


Quando dizem que algo é “a média”, não sabemos do que se trata, exceto que foi estatisticamente resumido, a menos que possa decifrar qual é o tipo de média em questão: aritmética, mediana ou modal.


Sobre dados e informações – como aquelas relativas a muitas peculiaridades humanas – todos os diferentes tipos de media são bem próximos entre si, principalmente, aqueles que se situam perto do que chamamos de “distribuição normal”.


Em consequência, o tipo de média será sempre tão bom quanto outro para descrever, por exemplo, a altura dos homens, a despeito de não ser tão eficaz assim para recomendar roupas para este público.


Ainda no exemplo acima, considerando que a altura é a medida necessária para fazer roupas. Certamente, teremos números que apresentam uma variação substancial, ou seja, pessoas muito baixas a, talvez, pessoas muito altas.


Ao reportar esta média para uma loja que realiza costuras ao realizar a confecção, estamos orientando toda uma linha de montagem com base nesta medida, logo percebemos que a métrica “média”, embora descreva a minha base, ela pode falhar uma vez que não conheço a variação da altura entre os meus entrevistados.


Alguém que oriente uma recomendação buscando a média, poderia ter grandes problemas futuros, ao ver que as roupas confeccionadas, não servem para ninguém.


As entradas estatísticas, apesar de graves, podem ser ainda mais problemáticas se levarmos em consideração que estamos orientando recomendações sem segmentação.


Tenho um ótimo assunto [estatístico] sobre o qual escrever, mas sinto profundamente incapaz de torná-lo inteligível sem sacrificar a precisão e o rigor.Sir Francis Galton, Matemático do Reino Unido.


Dividindo entre as dimensões


Considerando ainda nossas medidas tomadas acima, descobrimos que somos incapazes de descrever nosso público com uma única média, sendo necessário mais dados para tomar uma decisão em cima desse fato.


Em uma nova consulta por dados mais confiáveis (utilizando a mesma base) foi descoberto que três valores de altura que mais se repetem, esses se encaixam no padrão estabelecido para confecção de roupa dos grupos.


Agora conseguimos, a partir da média, classificar quais medidas são adequadas para os grupos.


Ao retornar com esses dados valiosos para os tomadores de decisão, a empresa questiona sobre a origem da base, os responsáveis pela relatoria afirmam que somente homens foram entrevistados, o que historicamente conhecido pelos gestores o principal público alvo das confecções pertence é feminino.


A amostra inadequada (estatisticamente inadequada) é, nesse caso, o principal elemento enganador, o que necessariamente nesse caso não é errado, contudo cabe ressaltar que o relatório não é útil para o maior público da confecção.


Ao segmentar o público com base nos seus interesses, diretamente, está ignorando um outro segmento que também é seu alvo consumidor.


Se você deixar qualquer grupo de indivíduos ao longo de 6 meses e, depois, trocar para outra marca de roupas, uma dessas coisas certamente acontecerá:

  • as pessoas receberam uma nova classificação de tamanho;

  • os números se manterão, mais ou menos, no mesmo patamar.

Se a última ou a primeira alternativa ocorrer, a marca arquivará os números, deixando-os bem escondidos, e tentará novamente.


Cedo ou tarde, devido à força do puro acaso, um determinado grupo experimentará uma substancial melhoria, justificando uma nova linha de costura ou, quem sabe, toda uma campanha publicitária.


Isso ocorre quer os consumidores quer simplesmente permaneçam usando as roupas às quais estão acostumados.


A importância de utilizar grupos pequenos é que, com grupos grandes, quaisquer diferenças produzidas pelo acaso tendem a ser pequenas e indignas das letras garrafais.


Afinal, uma melhora de 3% dificilmente venderá muito mais, não é mesmo? Assim, você deve compreender, de uma vez por todas, que o ato de informar erroneamente as pessoas por meio de materiais estatísticos pode ser chamado, segundo o autor, de “manipulação estatística” ou de (ainda que a palavra não seja particularmente boa) “estatistivocacia”.



Como advogar estatisticamente


Huff, ao longo do livro, através de exemplos melhores do que o descrito acima pelo autor das informações que, frequentemente, saem cheias de virtudes da mesa dos estatísticos podem, posteriormente, ser distorcidas, exageradas, excessivamente simplificadas, vulgarizadas e escolhidas de maneira distorcida por quaisquer pessoas que tenham um objetivo, afirmar estatisticamente um ponto e assim assumir propriedade de fala.


Gráficos midiáticos tendem a ser exagerados em busca de fins sensacionalistas e, raramente, minimizam informações. Sem embargo, sejam quem forem os culpados em cada caso, não é nada fácil considerá-los inocentes descuidados.


Os indivíduos que apresentam certos argumentos estatísticos em prol de uma relação trabalhista (pela marca, pelo produto, por um partido) dificilmente são encontrados oferecendo aos consumidores melhores oportunidades além do que é minimamente requerido pelos fatos.


Ainda há de reconhecer a fragilidade dessas conclusões e a necessidade das metodologias de pesquisa não são suficientes para fazer aquilo que todo cidadão consciente deveria aprender de berço, em sua formação, em seu ambiente de trabalho: questionar o que lhe é apresentado.


“Por que causa, motivo, razão ou circunstância?” - Prof Girafales


Como contestar estatisticamente


Infelizmente, nem toda relatoria estatística tem validade de contestação com a mesma segurança de um laboratório ou a precisão de uma análise química.


Entretanto, é possível nos aprofundarmos nesse tema a partir de 4 questões básicas. Quando encontrar as respostas, o autor do livro utiliza de raízes platônicas sobre o questionamento da verdade para evitar sintetizar o que, na prática, não é necessariamente real:

  • Quem está dizendo? Parcialidade é a primeira fonte que você deve procurar a fonte dos seus dados: cientistas que buscam publicar um excelente artigo; os gerentes ou trabalhadores com salários em jogo;

  • Como sabem? Se o método de pesquisa foi feito, fique atento às evidências das amostras tendenciosas, que foram selecionadas de modo impróprio;

  • O que falta? Dificilmente será possível saber quantos casos foram, efetivamente, considerados, geralmente esses dados são ignorados antes da análise e já por isso podem tender a qualidade de nossa amostra. A ausência dessa informação, sobretudo, quando as fontes são stakeholders (partes interessadas), é o bastante para levantar algumas suspeitas sobre os resultados dessas pesquisas;

  • Houve alguma mudança de assunto? Não é incomum que uma coisa seja divulgada como se fosse a outra. Quando analisar estatísticas, não se esqueça de verificar se houve, em algum lugar, uma troca entre os números brutos e a conclusão.

Mais de uma ação foi freada pela sensatez ao se perguntar o sentido dos números apresentados, ter o "desconfiômetro" reduz pela metade as estatísticas quando o vocabulário é baseado em suposições que ainda não foram totalmente comprovadas.


"Isso não somos nós que dizemos, são as estatísticas!" Prof. Girafales



Notas finais - Relatividade do absoluto


O livro, acima de tudo, é sobre práticas utilizadas para defender/argumentar um contexto, e um termômetro sobre como a nossa cultura é fortemente voltada aos fatos (não dados) e assim como qualquer fato (diferente do dado), é narrado sobre a perspectiva de um observador que tem suas próprias considerações, políticas, sociais e acadêmicas, para um leitor não treinado qualquer dado é suficiente para responder a maioria das perguntas que o cercam, mesmo que estes tenham a capacidade de confundir a partir de simplificações grosseiras e/ou exageradas.


Para quem trabalha com informação já aprendeu que dados são a verdade e como tal absolutos, não podem ser dobrados facilmente. Rígidos e ásperos, quem sabe criar tal relativismo consegue muito poder pois, através destes, podem narrar um fato de acordo com seu intento, e provocar o seu público, elegendo reis, inclinado multidões, destruindo empresas ou produtos. Muito além de termos e métodos estatísticos para narrativas, a chave está na interpretação, um bom começo é responder: o que aqueles dados respondem. Para nós, ávidos estudantes e pesquisadores, dados são o nosso sexto sentido, é a partir deles que conseguimos absorver conhecimento por isso é altamente recomendável buscar o sentido geral das estatísticas às quais estamos expostos, pois é a partir desses que adquirimos mais conhecimento.




AUTOR: Darrell Heff

EDITORA: Intrínseca

OBRA: Não-ficção






imagem do autor



bottom of page