Relações de causa e efeito estão mais presentes no nosso dia a dia do que imaginamos

Afinal, é possível

inferir causalidade?

Correlação não implica causalidade. Essa é uma frase muito comum, mas ainda assim nosso cérebro tende a assumir uma relação de causa e efeito entre dois eventos que estão associados. Neste artigo trataremos das diferenças entre correlação e causalidade e mostraremos uma maneira segura de inferir causalidade, caso ela exista.

Imagine que estamos analisando uma pesquisa empresarial que contém informações sobre as práticas de RH adotadas e a produtividade de 3.000 empresas brasileiras. Ao comparar empresas do mesmo setor, chegamos à seguinte conclusão: Nessa situação hipotética, empresas que adotam duas medidas – práticas de treinamentos e remuneração atrelada à performance dos funcionários  – são 20% mais produtivas quando comparadas às suas concorrentes.

Somente a partir desta análise, é possível afirmar que a adoção dessas práticas de RH tornou essas empresas mais eficientes? Primeiro vamos entender a diferença entre correlação e causalidade.

CORRELAÇÃO

No campo da estatística, correlação significa uma associação qualquer entre dois eventos, seja ela causal ou não. Por exemplo, sabemos que à medida que subimos de cargo, nosso salário também tende a aumentar. Observando o gráfico abaixo, podemos dizer que existe uma correlação entre as duas variáveis, pois elas se movimentam juntas.

Que o salário aumenta de acordo com o nível de cargo é um exemplo bastante óbvio de correlação positiva, então vamos para um outro não tão intuitivo. Uma outra associação é observada entre o consumo de sorvete e o número de afogamentos. Neste segundo gráfico, assim como no exemplo anterior, observamos que as duas variáveis também se acompanham. Nos meses em que temos um aumento do consumo de sorvete, também vemos um aumento do número de afogamentos.

Podemos dizer que o consumo de sorvete está aumentando o número de afogamentos ou que o número de afogamentos está aumentando o consumo de sorvetes? Certamente não, logo, não há uma relação de causa entre estes eventos. Agora vamos incluir uma terceira variável, a temperatura média no mês. O comportamento da variável temperatura, segue praticamente o mesmo padrão das outras duas e é justamente a variável que explica a correlação entre elas.

O que faz com que estes eventos estejam correlacionados é que, em dias mais quentes as pessoas tendem a consumir mais sorvetes e também a frequentarem mais as praias e piscinas, aumentando a probabilidade de acontecer um afogamento.

Basicamente, a medida de correlação indica o quanto duas variáveis se acompanham ao longo da amostra. Mas ainda que dois eventos possuam uma correlação alta, isso não indica que um é consequência do outro. 

Para saber mais, clique aqui e aprenda a calcular um índice de correlação.

CAUSALIDADE E INFERÊNCIA CAUSAL

Agora que entendemos o conceito de correlação, podemos passar para o conceito de causalidade. O dicionário nos diz que causa é o que faz com que algo exista ou aconteça; uma origem, um motivo ou uma razão. Por exemplo, girar a chave do carro é a razão para que o motor ligue.  Assim, causalidade é a relação entre causa (origem ou motivo) e seu efeito (consequência).  

Embora esse último exemplo pareça simples, a causalidade é um fenômeno complexo de ser definido, pois muitas vezes não há uma única causa e sim vários fatores que juntos vão produzir um efeito. No exemplo, além de girar a chave, precisamos que o carro esteja com combustível, que a parte elétrica esteja em bom estado, entre outros fatores que juntos farão o carro funcionar. 

Tendo em vista esta complexidade do fenômeno, precisamos de ferramentas para conseguir analisá-lo. Então do conceito de causalidade, avançamos para a noção de inferência causal:  a determinação de que existe uma relação causal entre dois eventos.

As inferências causais são feitas analisando as mudanças que surgem nos efeitos quando há mudanças na causa. No nosso exemplo automotivo, o que aconteceria com o carro se a injeção eletrônica estivesse danificada? Provavelmente ele deixaria de funcionar. Então, uma modificação na causa  (injeção eletrônica danificada)  gera uma mudança na consequência (o carro deixa de funcionar). Para uma relação causal é preciso que mudanças na causa gerem mudanças na consequência. 

No contexto da ciência de dados aplicada a negócios, as relações e perguntas a serem respondidas costumam ser mais complexas do que o exemplo automotivo: empresas que adotam participação nos lucros aumentam o engajamento dos colaboradores? O treinamento em um software aumenta a produtividade da equipe?

Para responder se as relações que encontramos entre duas variáveis realmente se tratam de causa e efeito, é útil ter uma metodologia estruturada que nos permita identificar as condições necessárias para inferir causalidade. 

Estabelecer causalidade não é uma tarefa trivial. Foi essa necessidade que levou o estatístico e epidemiologista Austin Bradford Hill, em 1965, a propor 9 critérios para definir como causal uma associação entre duas variáveis, que ficaram conhecidos como Critérios de Hill. Apesar de ficarem conhecidos como critérios, hoje a literatura acadêmica os considera apenas como bons indícios de uma relação causal. O único critério que permanece de fato como necessário é o da temporalidade. Mesmo tendo sua origem na epidemiologia, podemos utilizá-los para investigar qualquer relação causal entre duas variáveis. Para o contexto do presente artigo, podemos destacar três relevantes:

  1. Força da associação – quanto maior é a correlação entre duas variáveis maior é a probabilidade de que ela seja causal;

  2. Consistência – a relação é consistente mesmo quando aplicamos diferentes métodos ou quando usamos amostras diferentes;

  3. Temporalidade – a variável causa deve ter ocorrido antes da variável consequência.

A força da associação e a consistência são bons indicadores de uma relação causal enquanto a temporalidade é necessária. Quando estamos investigando uma relação que acreditamos que seja de causa e consequência, se a consequência ocorre antes ou ao mesmo tempo da causa, a causalidade já pode ser automaticamente descartada.

 

RESPONDENDO A PERGUNTA

Para exemplificar melhor os Critérios de Hill, vamos voltar à nossa pergunta inicial. A partir da análise da pesquisa, podemos dizer que o treinamento de funcionários e a remuneração atrelada ao desempenho são causas de uma melhor eficiência nas empresas? Vamos analisar a partir dos critérios.

Quanto à força da associação, a análise indica que empresas que adotam essas práticas são mais produtivas, ou seja, um bom indício de que essas práticas têm um efeito positivo na performance, dessa forma podemos continuar investigando.

Quanto ao critério da consistência, precisamos olhar para outras análises e entender se os resultados possuem comportamentos similares em outras amostras ou com diferentes métodos. O estudo de Patrick Wright e Timothy Gardner: – “Theoretical and Empirical Challenges in Studying: The HR Practice – Firm Performance Relationship” –  fala sobre os desafios de estabelecer uma relação causal neste mesmo contexto. Os autores mostram que não há um consenso na literatura, enquanto alguns estudos encontraram que as medidas adotadas pelo RH têm um impacto positivo na performance, outros estudos divergem em relação à direção dessa relação. Esses estudos descobriram que, na verdade, empresas com melhores performances tendem a adotar essas práticas.

Por último, para analisar o critério da temporalidade precisamos olhar para a forma através da qual os dados foram coletados. Esses dados foram coletados a partir de uma pesquisa em que tivemos informações da performance e das práticas adotadas pelas empresas em um único momento. A partir dessa única informação já é possível perceber que não conseguimos estabelecer um critério de temporalidade. Não conseguimos identificar se a melhora na performance da empresa aconteceu depois das práticas serem adotadas e assim, cumprir este critério que é necessário para estabelecer a causalidade. Para o critério da temporalidade precisamos, necessariamente, de informações ao longo do tempo.

Dessa forma, não temos consistência nem informações suficientes de temporalidade para garantir que essas práticas sejam causadoras de aumento de performance das empresas. Perceba que não estamos afirmando que elas não têm impacto algum, mas sim demonstrando a necessidade de outras análises que nos dêem resultados mais precisos.

ENTÃO QUAL SERIA A MELHOR FORMA DE MEDIR IMPACTO?

Case de Experimento

Em 2017, um artigo publicado na Management Research Review, investigou se uma técnica de melhoria de gestão (HPO framework) tinha impacto na performance organizacional da empresa. A partir de um experimento no qual esta técnica foi aplicada em uma área da empresa e uma outra área foi usada como grupo de controle, o estudo conseguiu estabelecer uma relação causal. O HPO framework teve um impacto positivo no desempenho organizacional da empresa. Link para ler o estudo completo.

Em um mundo ideal, a melhor forma de saber se práticas de RH causam aumento na performance dos colaboradores seria ter dois universos simultâneos em que a única diferença entre eles seriam as práticas de RH adotadas. Como isso não é possível, buscamos uma forma que se baseia nessa máxima para estabelecer causalidade: experimentos.

Na prática, experimentos consistem na criação de dois grupos de análise, um grupo de controle e um grupo de tratamento, escolhidos aleatoriamente, que possuam as mesmas características e a única diferença – idealmente – é que um grupo passará pela intervenção que queremos analisar (grupo de tratamento) e o outro não (grupo de controle).  Dessa forma é possível comparar os resultados dos dois grupos e a diferença entre eles será justamente o impacto da intervenção. Experimentos bem estruturados possibilitam comparar isoladamente o efeito da intervenção, sem que essa seja afetada por outros fatores.

Trazendo essa metodologia para nosso contexto de negócio, imagine que o RH da sua empresa quer aplicar um novo treinamento para aumentar as vendas do time comercial. Podemos pensar na seguinte estratégia: 

  • Dividir o time comercial em dois grupos, escolhidos aleatoriamente, e medir a performance de vendas de cada um desses grupos antes de aplicar o novo treinamento.
  • É importante que estes grupos sejam escolhidos aleatoriamente, para que não haja nenhuma possibilidade de cairmos em um viés de seleção. Se o grupo escolhido para receber o treinamento possuir uma performance muito diferente do  grupo de controle, os resultados poderão ser enviesados. 

  • Aplicar o treinamento, mas somente para um dos grupos, que será o grupo de tratamento.

  •  Depois de aplicado o treinamento, medimos novamente a performance desses dois grupos e comparamos os resultados a partir de um teste de médias para entender se há uma diferença significativa entre os dois grupos.

A lógica deste experimento é a seguinte: se observarmos um aumento da performance maior no grupo que recebeu o treinamento do que no grupo que não recebeu, é um indicativo de que o treinamento foi efetivo e deveria ser aplicado para o resto do time. Caso contrário, se não observarmos nenhuma diferença significativa ou até mesmo se o grupo que recebeu o treinamento obtiver um resultado pior do que o outro grupo, isto indica que o treinamento não foi efetivo e, consequentemente, não deveria continuar sendo aplicado.

Então imagine que temos o seguinte resultado:

Antes do treinamento, o grupo de tratamento obteve uma performance de vendas de 0.57 enquanto o grupo de controle, que não participou do treinamento, atingiu  0.55. Após o treinamento, estes valores passaram para 0.75 e 0.58, respectivamente. Isso mostra que o grupo de tratamento aumentou em 31,5% sua performance, enquanto o outro grupo apenas 5,5%. Observamos que houve uma melhora expressiva, neste grupo, comparado ao controle, mostrando que o treinamento foi efetivo.

Além de conseguir medir a efetividade, este tipo de análise também evita que uma quantidade maior de recursos e tempo sejam gastos com medidas não efetivas. Para que o experimento seja válido, é importante ter uma medida de resultado antes e depois para garantir o critério da temporalidade. 

Por muitas vezes tratamos automaticamente correlações fortes como causalidade, principalmente quando a associação entre duas variáveis faz sentido para a nossa mente ao contar uma boa história. Mas, como vimos, isso nem sempre é verdade. A forma que temos de mitigar nossas conclusões antecipadas é primeiro nos questionarmos rapidamente se a nossa hipótese passa pelo critério de temporalidade de Hill. Se não, já podemos garantir que não temos uma relação causal. Se além da temporalidade, também encontrarmos uma forte associação e consistência, temos boas evidências de causalidade, mas ainda assim um experimento se faz necessário. 

 

AMANDA GENTIL

Quer ajuda para fazer este tipo de análise e até mesmo experimentos na sua empresa? Entre em contato com nosso time de consultoria.

AV ÁGUA VERDE  1413, CURITIBA   |   RUA ALAGOAS, 1460 , BELO HORIZONTE