Dados e aprendizagem automática na tomada de decisão

Pedro Amorim

  (1)INESC TEC

  (2)Faculdade de Engenharia da Universidade do Porto

José Fernando Oliveira

  (1)INESC TEC

  (2)Faculdade de Engenharia da Universidade do Porto

Todos os modelos são, por definição, incompletos e aproximados. Modelizar é extrair de uma realidade, que é sempre caótica e complexa, as características essenciais para o processo de tomada de decisão em causa, organizando, simplificando e criando sentido e propósito. Tal só é possível à custa de uma elevada dose de abstração e simplificação.

 

 

No Verão de 2019, em Seattle, assistimos a uma palestra do Jeff Wilke, CEO global do negócio da Amazon de Consumer Business. O primeiro slide dessa apresentação estava repartido em dois. Do lado esquerdo constava o subtítulo “Decision Support” e mostrava um analista a analisar o resultado de um modelo matemático e, do lado direito, o subtítulo “Hands-Off Wheel” e exibia um analista a programar um modelo que tomava decisões de forma autónoma. Com o seguinte clique o Jeff Wilke colocou uma cruz do lado esquerdo e, simultaneamente, comentou que na Amazon a forma de tomar decisões deverá ser como a descrita do lado direito do slide – investindo o tempo necessário para que o modelo retrate da melhor forma possível a decisão a ser tomada, mas sem interferir no resultado final.

A tomada de decisão com apoio de modelos analíticos é, normalmente, descrita numa escala de três categorias principais (Figura 1). A primeira categoria – analítica descritiva – diz respeito a modelos que apoiem o entendimento de acontecimento passados. Por exemplo, ao analisar a campanha promocional de um retalhista, estes modelos podem identificar qual a eficácia e eficiência dessa atividade. Na segunda categoria – analítica preditiva – o objetivo passa a ser o de antecipar o impacto de determinada ação de negócio. Usando o mesmo exemplo, com estes modelos, o retalhista poderia prever as vendas de uma determinada campanha promocional. Por fim, na categoria de analítica prescritiva, os modelos matemáticos têm a responsabilidade de sugerir ações que são depois analisadas e refinadas pelos tomadores de decisão. Voltando ao caso do retalhista, estes modelos sugeririam a melhor parametrização da campanha promocional tendo em vista um determinado objetivo e restrições de negócio.

Esta última categoria de modelos analíticos – analítica prescritiva - traz, atualmente, muitos desafios ao nível da adoção por parte das organizações. Estes desafios têm na raiz o facto de os tomadores de decisão destas organizações não crerem ser possível codificar e melhorar o processo atual de tomada de decisão que utilizam. Esta posição de base faz com que os requisitos para a modelação não sejam totalmente mapeados e que a descrição matemática do problema fique demasiado aquém da realidade. Mesmo ultrapassando estes desafios iniciais, a mudança do processo de tomada de decisão é sempre desafiante e tem um cariz transformacional. Esta realidade torna necessário acompanhar o rigor técnico do desenvolvimento dos modelos de um sentido prático de mudança de mentalidades e hábitos.

Voltando à apresentação de Jeff Wilke, fica claro que a Amazon estendeu a escala dos modelos analíticos e trouxe para o topo a analítica autónoma. Esta categoria tem, na fundação, uma postura distinta em relação ao desenvolvimento e aplicação dos modelos de tomada de decisão. Sendo uma empresa nativamente digital, os colaboradores da Amazon nunca tomaram decisões de outra forma e isso facilita a ultrapassagem dos desafios elencados para a analítica prescritiva. Com a utilização intensiva desta categoria de modelos analíticos, a Amazon coloca um esforço substancial na etapa de desenvolvimento, usando sucessivas iterações. Assim, utilizando, novamente, o caso da definição das campanhas promocionais, a Amazon tentará determinar, recorrendo a múltiplas experiências, os perfis de elasticidade de preço dos diferentes segmentos de cliente e modelar exaustivamente as dinâmicas de negócio. Em utilização, estes modelos, como não têm intervenção humana a jusante, produzirão desvios sistemáticos que poderão ser continuamente analisados e refinados.

Todos os modelos são, por definição, incompletos e aproximados. Modelizar é extrair de uma realidade, sempre caótica e complexa, as características essenciais para o processo de tomada de decisão em causa, organizando, simplificando e criando sentido e propósito. Tal só é possível à custa de uma elevada dose de abstração e simplificação. De uma forma simples, e citando George Box(1), todos os modelos estão errados, alguns são úteis. George Box deriva desta assunção duas importantes conclusões. A primeira é que, dado que todos os modelos estão errados, não é possível obter o modelo “correto” por excessiva elaboração. A segunda, que decorre da primeira, é que se temos de conviver com o erro, temos que estar particularmente atentos para os aspetos onde esse erro é importante e relevante.

O que distingue os modelos da analítica prescritiva dos modelos da analítica autónoma é o foco da intervenção humana e, consequentemente, as fontes de subjetividade e erro. Assim, os modelos de analítica prescritiva carregam em si mesmos a subjetividade do analista que decidiu o que na realidade era relevante ou não para a qualidade das decisões a obter, incorporando com maior ou menor detalhe tais características no modelo. Se o modelo gera automaticamente propostas de decisões, fá-lo com base nas regras e objetivos modelados matematicamente pelo analista. A validação destes modelos é feita pela alimentação controlada de dados, que permita a verificação e validação dos resultados. Há, assim, uma enorme responsabilidade ética por parte do analista na construção do modelo de analítica prescritiva. Os modelos de analítica automática procuram ser imunes à subjetividade do analista, construindo eles próprios as regras de decisão com base em enormes volumes de dados históricos, que permitem estabelecer correlações entre ações e consequências. Mas o “calcanhar de Aquiles” da analítica automática é exatamente que correlações não são relações causa-efeito. Como, por outro lado, estes modelos também simplificam os dados utilizados, selecionando as características com mais impacto nas correlações, também estão errados e podem produzir desvios sistemáticos significativos, como já afirmámos anteriormente. Assim, estes modelos requerem uma intervenção humana em busca destes desvios, que estará também eivada de subjetividade.

Se o erro é inerente à utilização de modelos analíticos, automáticos ou não, também a subjetividade humana estará sempre presente, e, consequentemente, as considerações éticas. A discussão em torno da metodologia analítica mais permeável à (falta de) ética humana tem defensores dos dois lados da barricada, mas apenas será séria se mantivermos em mente que as decisões terão sempre de ser tomadas por mulheres e homens concretos, que informados pela ciência e tecnologia, não podem alienar a responsabilidade final da decisão. Ao fazê-lo, estaremos a desumanizar a nossa sociedade.