#148 A história da Target e seu "score" de gravidez
O que provavelmente é mito ou verdade no case mais famoso de análise de dados
#TBT é a edição #122, onde explico o que é o viés da confirmação da análise de dados.
No livro O Poder do Hábito, o jornalista Charles Duhigg apresenta o case da Target, onde a empresa conseguiu acertar que uma consumidora estava grávida. Na matéria “How Companies Learn Your Secrets” de 2012, ele conta a história (adaptação livre):
A Target coleta diversos dados de cada cliente: nome, ID, e-mail, endereço e o que comprou. Com esses dados, o estatístico da empresa Andrew Pole fez uma análise histórica de todas clientes que se registraram bebês em seus cadastros com a Target.
Com esses dados, o time de Pole descobriu que determinados produtos são comprados em diferentes estágios da gravidez, como loção (início do quarto mês de gestação), vitaminas (nas primeiras vinte semanas) ou algodão e sabão (mais próximo do nascimento). Com isso, estabeleceu um “score” de probabilidade de gravidez e dividido pelas fases de acordo com os produtos adquiridos. Assim, podia ofertar os produtos mais adequados para cada gestante.
Um dia, um pai recebeu um catálogo da Target cheio de produtos para gestantes e direcionado para sua filha. Furioso com o engano, foi reclamar com o gerente da loja que foi checar o que havia acontecido. Após alguns dias, o gerente retornou o contato com o pai para se desculpar e foi surpreendido pelo próprio cliente que a sua filha realmente estava grávida e ele não sabia.
A história possui fatos e suposições que discutem a veracidade do caso. Já li artigos que trazem dados que comprovam alguns pontos e outros que duvidam de algumas informações.
Um fato comprovado é o crescimento expressivo na receita da Target durante o período do estatístico Andrew Pole na companhia: saltou de 44 bilhões de dólares em 2002 para 67 bilhões de dólares em 2010. Não dá para atribuir 100% ao seu trabalho, mas o presidente na época afirmou que a estratégia era “foco nos itens e categorias que são mais atraentes para públicos específicos, como mães e bebês”.
Por outro lado, a história do pai e a filha grávida é bem provável que não seja verdadeira pois carece de fontes (veio de um vendedor da Target que não foi identificado). Além disso, ela não pode servir de parâmetro para comprovarmos que o “score de gravidez” da Target funciona. A história apenas diz que funcionou naquele caso, mas não lista quantos casos o score não funcionou, ou seja, é um exemplo de viés da confirmação.
Na minha visão, eu acredito que a Target realmente tivesse um sistema eficiente de recomendação algorítmica baseada nos dados de compras dos consumidores. E provavelmente não usavam só para gestantes, mas para qualquer segmento que tivesse um potencial de receita contínuo. Porém, a história do pai eu entendo que sirva mais para exemplificar (e engrandecer) esse sistema da Target do que ser um caso real. Atualmente, o case mais interessante envolvendo algoritmo de recomendação é a Amazon, onde comprovadamente há um aumento de receita graças a isso.
De qualquer forma, essa história da Target nos ajuda a convencer tomadores de decisão (gestores) a investir em inteligência artificial, pois foi graças ao algoritmo que a Target ofereceu os produtos mais adequados para a filha grávida. E atualmente temos diversas soluções gratuitas ou de baixo custo para implementarmos um sistema de recomendação.
NOVIDADE DA SEMANA
Netflix perde quase 1 milhão de assinantes no segundo trimestre de 2022
Não está fácil a vida da Netflix. Depois de reportar uma perda de 200 mil assinantes no primeiro trimestre de 2022, a queda foi ainda maior entre Abril e Junho: foram cerca de 970 mil assinantes perdidos, a maior queda da história da empresa.
No total, desde o início do ano, foram quase 1,2 milhões de assinantes a menos na base da Netflix (220 milhões de assinantes). Apesar da perda, a empresa espera ganhar recuperar 1 milhão de assinantes para o terceiro trimestre.
Vi no TechCrunch (em inglês)