Se correlação não implica causalidade, então o que implica?

Todos nós já ouvimos falar que “correlação não implica causalidade”. Mas se é assim o que realmente implica causalidade?

O padrão de referência para estabelecer causa e efeito é um experimento controlado duplo-cego (ou o equivalente ao teste AB). Mas então quer dizer que se estamos trabalhando com um sistema em que não conseguimos fazer experimentos, a esperança de qualquer progresso científico está perdida?Conseguiremos algum dia entender sistemas que temos pouco ou nenhum controle sobre? Isso seria uma conjuntura muito sombria, mas felizmente tem havido progresso para respondermos essa pergunta positivamente.

Então para que a causalidade serve?

Toda vez que você decide tomar uma atitude, em qualquer contexto, está fazendo suposições sobre como o mundo funciona.Você está supondo os efeitos causais de possíveis ações. Na maioria do tempo, só consideramos ações muito simples: eu deveria comer, porque o efeito causal de “comer” em “fome” é negativo; ou eu deveria promover mais aparições dessa propaganda, porque o efeito causal das “aparições” em pageviews é positivo.

E o que dizer sobre intervenções mais complexas? E quanto aos efeitos derivados? Talvez mostrar mais propagandas aumente o número de pageviews, mas também afasta o público de algo mais compartilhável, reduzindo o tráfego do seu site como um todo. Existe um jeito de tornar todos esses efeitos derivados óbvios? Existe um jeito de tornar as suposições causais explícitas, para que seus méritos possam ser discutidos, ou nosso modelo de mundo possa ser melhorado?

Quanto mais leio e falo com as pessoas sobre o assunto da causalidade, mais percebo o estado precário do conhecimento comum do assunto. Discutindo com nosso grupo, decidimos trabalhar o Causality de Judea Pearl no nosso Clube de Matemática. Surgiram muitas questões e discussões ótimas nessas sessões, então decidi finalmente formular algumas delas aqui. Farei o meu melhor para dar o crédito adequado, mas já peço desculpas para qualquer participante que deixei de fora.

"- Eu costumava achar que correlação implicava causalidade. Então eu tive aulas de estatísticas. Agora eu não acho."
"- Parece que as aulas ajudaram."
"- É, talvez."

Para o primeiro post, eu gostaria de explicar o que realmente é causalidade, e falar um pouco sobre o que “evidência” significa. Isso sai um pouco do ensino padrão do assunto, mas acredito que é uma maneira útil de ver as coisas. Você vai ver como isso pode nos proporcionar um modelo de mundo para discutirmos e usarmos como base mais para frente, dando um passo em direção à mensuração dos efeitos decorrentes das intervenções.

O que é causalidade?

O termo “causalidade” tem uma definição intuitiva, mas esquivou-se de ser bem definida por décadas. Considere que você se desloca diariamente para ir trabalhar. Você tem um conhecimento intuitivo que o trânsito vai fazer você se atrasar. Você também sabe que se seu despertador não tocar, você vai se atrasar. Podemos desenhar, como a figura 1 abaixo.

Essa imagem é um ótimo começo, mas esses são só dois dos motivos mais comuns para se atrasar para o trabalho. Outros incluem: seu carro não dar partida, esquecer de fazer o lanche das crianças, se distrair com as notícias etc. Como nossa imagem pode incorporar todas essas pequenas situações que não incluímos? Poderemos algum dia ter um modelo razoável do mundo se não é humanamente possível medir todas as causas e efeitos existentes?

A resposta, no final das contas, é relativamente simples. Nosso modelo só precisa incluir, em nossa viagem para o trabalho, os maiores e mais comuns efeitos.

Se omitirmos um grande número de efeitos pequenos e independentes, podemos tratá-los como “ruídos”. Paramos de falar sobre as coisas como sendo completamente determinadas pelas causas cogitadas. Ao invés disso, falamos da causa como amplificadora das chances de seus efeitos. Você vai de intuições como “o alarme não tocar me faz atrasar” para intuições como “o alarme não tocar aumenta minhas chances de atrasar”.

Acho que você vai concordar comigo que a segunda constatação reflete melhor nosso entendimento da realidade. Ela resolve o bando de perguntas “e se” originadas das improváveis exceções que não tínhamos considerado. “E se acontecer de eu acordar no horário certo mesmo quando meu alarme não despertou?” ou “E se eu estava tão cansado que perdi a hora mesmo com o meu alarme despertando?”. São todas situações incorporadas como ruído.

É claro que somos livres para adicionar qualquer uma delas no nosso desenho. É só que queremos ter a opção de não adicionar. Há uma exceção que vamos falar brevemente daqui a um momento. Primeiro, precisamos de mais uma ideia.

Fig. 2: Uma imagem ligeiramente mais completa do mundo

Podemos construir uma imagem muito mais compreensível ao encadear causas e efeitos. Quais são as causas do trânsito? Quais são as causas do despertador não tocar?

Se há um desastre, isso pode acarretar na queda de energia, impedindo seu despertador de tocar. Também pode causar trânsito. Nesse caso, nossa nova imagem deve ser muito parecida com a figura 2. E ela diz algo importante.

Note que se um desastre acontecer, é tanto mais provável que o seu alarme falhe quanto que haja trânsito. Isso significa que, num conjunto de dados em que você mensurou os dias em que há trânsito, e se o seu despertador toca nesses dias, você pode achar uma correlação entre os dois.

Sabemos que não há um efeito causal entre o seu alarme tocar ou não e a existência de trânsito ou vice-versa (assumindo que você dirija como uma pessoa sã quando está atrasado). Essa é a essência de “correlação não implica causalidade”. Mas quando existe uma causa comum entre as duas variáveis, então elas serão correlacionadas

Isso faz parte do raciocínio da frase menos conhecida “não existe correlação sem causalidade”. Se nem A nem B causa o outro, e os dois são correlatos, deve haver uma causa comum para os dois. Talvez não seja uma causa direta igual para os dois, mas está lá, em algum lugar no âmbito maior da imagem. Isso implica algo incrivelmente poderoso. Você precisa controlar as causas comuns se você está tentando estimar o efeito casual de A em B (leia mais sobre a variável de confusão). Se houvesse uma definição rigorosa para “causa comum geral”, então haveria também uma maneira de escolher o que controlar. Acontece que existe essa definição, enraizada nessas imagens simpáticas (gráficos causais).

Quer dizer que, se você não inclui as causas comuns escondidas no seu modelo, você irá estimar efeitos causais incorretamente. O que levanta a questão: podemos ter a esperança de incluir todas as causas comuns ocultas? Quais são as outras alternativas, se essa abordagem falhar?

Será que existe causalidade entre ataques de tubarão e venda de sorvetes? Não, mas existe correlação! Quanto o calor aumenta, mais gente entra no mar e mais gente toma sorvete.

Como a ciência funciona

Estamos fazendo perguntas no âmbito do método científico, então vou procurar não entrar muito na filosofia da ciência e em vez disso fazer observações baseadas em fórmulas básicas. Suponha que achamos que o mundo funcione de acordo com a primeira figura (fig. 1). E queremos testar essa suposição: a ausência de uma relação causa-efeito entre o trânsito e o despertador nessa imagem significa que não há uma relação de causalidade entre os dois?

De modo algum (incluindo causas comuns despercebidas!). Desastres são raros. É concebível que, durante o tempo limitado em que observamos o trânsito e o despertador, nunca vejamos um.

Com o tempo, mais e mais desastres podem acontecer, e a fig. 1 torna-se inconsistente. Começamos a acumular dados sobre o efeito de desastres no trânsito e em despertadores. Talvez a gente viva no centro-oeste dos Estados Unidos, onde tornados são relativamente comuns, ou na Califórnia, onde há terremotos, e a coleta de dados aconteça mais rápido. Com o tempo, vamos de uma medição da correlação de tráfico e despertador estatisticamente insignificante, e alcançamos uma estatisticamente significante. Voilá! Temos evidências que o nosso modelo é incorreto. A fig. 1 não mostra nenhuma relação causa-efeito entre trânsito e despertador, mas estamos vendo que eles são correlatos, e sabemos que não há “correlação sem causalidade”. Os desastres são a causa ausente do nosso modelo.

Como deve ser a figura correta? Podemos usar nosso conhecimento de como o mundo funciona para dizer que não há uma conexão causal entre o despertador e o trânsito, portanto deve haver uma causa comum entre os dois ainda despercebida. Já que estamos observando somente o despertador, o trânsito e o atraso, só podemos atualizar o nosso modelo quando tivermos a consciência do que está errado, já que ele negligencia uma causa comum “oculta”. E como fazemos isso? Há uma maneira de escrever, com uma flecha de duas pontas como na fig. 3. A flecha de duas pontas é uma maneira de dizer “existe uma causa comum despercebida entre o despertador e o trânsito”.

Agora sabemos que precisamos procurar as causas para o despertador não tocar e o trânsito aumentar. Com sorte, iremos chegar eventualmente na fig. 2

Note que exigiu-se uma grande quantidade de dados para achar uma situação em que comecemos a notar o vínculo ausente. Você pode ter essa intuição de que talvez, mesmo que alguns vínculos e algumas variáveis estejam faltando, temos algo “parecido o suficiente” com o quadro geral. Quais são as chances da fig. 2 estar errada hoje? O quão ruim é o meu cálculo das chances de eu ter me atrasado se o meu despertador tivesse despertado, em geral?

Acontece que a resposta é: porque desastres são raros, você não está tão distante. Isso é verdade mesmo quando há 100% de chance de se atrasar caso um desastre aconteça. Com o tempo, podemos levar em conta mesmo essa pequena quantidade de erros.

Existe um precedente para esse tipo de avanço na física. Nós geralmente não vemos um conjunto de leis como o quadro completo, mas elas são “boas o suficiente” para a situação que estamos considerando.

Sabemos que na teoria da gravidade de Newton faltam peças importantes, e que a Teoria da Relatividade Geral de Einstein é mais completa. Mesmo assim, a gravidade newtoniana foi suficiente durante muito tempo. Ela foi suficiente para nos levar à Lua! Não é suficiente, no entanto, para operar um sistema GPS.

O motivo para não a termos usado antes era porque haviam relativamente poucas situações em que precisávamos simular sistemas de alta energia agindo sobre grandes distâncias e tempos. Isso é análogo ao nosso exemplo em que as chances de desastre são baixas. Houveram algumas situações que se destacaram como anomalias, como a precessão de Mercúrio, que indicava que o sistema como o entendiamos iria desmoronar. Com o tempo, você acha mais anomalias, e melhora seu “esquema” do mundo. Na verdade, é uma boa analogia pra vida.

Nós respondemos parte das questões. Vimos que precisamos ter um sistema de dados cada vez maior para detectar efeitos raros, e assim melhorar nosso entendimento do mundo com o tempo. O que fica é se conseguiremos notar todas as anomalias, e se isso importa.

Vimos que um esquema incompleto pode ser útil. Logo mais iremos falar sobre a possibilidade de notar todas as anomalias que não estão no nosso esquema. Será que isso é possível com a quantidade infinita de dados?

Uma vez que temos o esquema, é possível calcular as chances de estarmos errados com uma previsão específica?

Isso talvez seja o assunto de um post futuro. Por enquanto, vamos falar um pouquinho mais sobre como usar esses tipos de modelos.

O que aconteceria se…?

A pergunta “O que aconteceria se as coisas fossem diferentes?” é, essencialmente, uma pergunta causal. Você está perguntando qual seria o efeito se o mundo funcionasse de maneira diferente do que foi observado, talvez baseado em alguma intervenção política.

A pergunta “O que aconteceria se eu intercedesse no sistema com alguma intervenção política?” é, basicamente, a mesma coisa que “Qual é o efeito causal dessa intervenção política no sistema?”. Se você só observa o modo como o mundo opera, você provavelmente vai errar a resposta. Por exemplo: se você intervém para ter certeza que o seu despertador nunca falhe (trocando por um despertador digital, por exemplo), então você subestima as chances de se atrasar para o trabalho. Você vai atribuir, incorretamente, o atraso relacionado ao trânsito (que acontece no mesmo horário que o seu alarme falha) ao seu despertador, e então superestimar o efeito do despertador ao falhar.

Esse tipo de pergunta está no centro de muitas decisões políticas e comerciais. O que aconteceria se nosso sistema de recomendação não existisse? O que aconteceria se fizéssemos algumas mudanças na nossa cadeia de suprimentos? Qual seria o efeito de uma intervenção política específica na situação dos sem-teto?

Todas essas perguntas são muito difíceis de responder experimentalmente, e não podem ser respondidas somente com estatísticas (ou seja, um grande número de dados). Poderia ser relativamente mais fácil respondê-las se tivéssemos um bom modelo causal de como o sistema funciona, junto com nossas estatísticas, complementado ainda com alguns experimentos que o modelo nos permite fazer. Mas falaremos sobre como isso é feito num outro dia.

***

Nota da tradução: esse texto foi originalmente publicado em inglês no Medium do autor e republicado no PapodeHomem pela contribuição que pode dar diante das recentes confusões que temos presenciado.

Se você quiser acompanhar a série de artigos que tratarão de assuntos relacionados, sugerimos fortemente seguir acompanhando o Medium do autor.

publicado em 17 de Julho de 2016, 00:05