INESC TEC, Faculdade de Engenharia da Universidade do Porto & LTPlabs
INESC TEC & Faculdade de Engenharia da Universidade do Porto
A popularidade da inteligência artificial (IA) tem registado um rápido crescimento, devido a diversos avanços científicos e tecnológicos, bem como à sua potencial aplicação em várias áreas. Um dos mais recentes avanços está relacionado com a IA generativa, e com os modelos de linguagem de grande escala (e.g., ChatGPT2) , que incluem grandes quantidades de conhecimento – utilizado, por exemplo, para gerar textos e imagens, de acordo com instruções humanas. Estes modelos podem ter diferentes aplicações: desde o acesso facilitado a informação até à produção de conteúdo. No entanto, o ChatGPT não resolve todos os atuais problemas do mundo - à semelhança de todas as tecnologias que o antecederam. Tendo em conta a nossa experiência pessoal junto de gestores de diferentes setores de atividade, todo o “encanto” resultante do surgimento do ChatGPT acaba por traduzir-se num parco aproveitamento da IA como veículo de mudança e de transformação das organizações.
Neste artigo, analisamos os cinco principais pilares que os gestores devem conhecer, de forma a transformarem todo o potencial da IA em benefícios concretos. Estes pilares estão ligados à necessidade de corresponder, adequadamente, as ferramentas existentes às tarefas a serem abordadas – processo particularmente relevante para as tarefas prescritivas (Pilar #1); a importância de combinar diferentes abordagens de IA para abordar desafios complexos no seio das organizações (Pilar #2); a relevância de explorar métodos de IA que sejam explicáveis, de forma a promover a confiabilidade e a colaboração (Pilar #3); as possibilidades que diferentes modos de interação humano-máquina oferecem (Pilar #4); a atividade fundamental de garantir o conhecimento básico de IA em toda a organização (Pilar #5).
A presença da IA tem vindo a aumentar nas empresas, apoiando os processos de tomada de decisão a diferentes níveis - nomeadamente, no que diz respeito a tarefas descritivas e preditivas. Os métodos descritivos, tais como o clustering, permitem, por exemplo, segmentar clientes ou detetar padrões de consumo. Já os métodos preditivos (p. ex., utilizados em aprendizagem supervisionada), e tal como o nome sugere, podem fornecer previsões de vendas ou de perda de clientes. No entanto, estes métodos não devem ser aplicados diretamente a problemas prescritivos – casos em que a decisão a ser tomada é a principal questão abordada; por exemplo, decidir sobre qual é a melhor rota para um determinado veículo ou que gama de produtos manter em determinada loja. O que diversas vezes testemunhamos na prática é a aplicação incorreta de ferramentas descritivas e preditivas, sobretudo quando o problema requer uma abordagem diferente. Tal como referiu Abraham Maslow “para quem só tem um martelo, todo o problema é um prego”.
Os problemas prescritivos requerem métodos de IA específicos, tais como o reinforcement learning. Métodos estes que fizeram manchete há quase uma década: por exemplo, quando o AlphaGo2 conseguiu derrotar o campeão mundial de Go. Estes são os mesmos métodos utilizados na condução autónoma e na navegação robótica, e que ainda estão em fase de maturação, devido à sua complexidade e a todas as questões envolvidas. No entanto, há um enorme potencial por explorar relativamente a estes métodos, em termos de aplicações prescritivas: por exemplo, alocação de encomendas em plataformas de comércio online3 , agendamento dinâmico de tarefas de produção, e roteamento dinâmico4 em tarefas logísticas internas e externas.
Com o aparecimento recorrente de novos métodos de IA (p. ex., há vários anos, testemunhámos o progresso na área de machine learning, e atualmente podemos recorrer a ferramentas de IA generativa), é fácil (e algo comodista!) assumir que se trata de tecnologias que se substituem umas às outras. Seria o equivalente a desenvolver um novo modelo de automóvel e substituir todos os modelos que o antecederam. Apesar de tentadora, esta analogia está incorreta. Obviamente, sabemos que a evolução metodológica torna certos algoritmos obsoletos; no entanto, e em certos casos, as novas ferramentas podem ser utilizadas em conjunto para resolver problemas cada vez mais complexos. Consequentemente, e ao invés de utilizarmos a analogia referida acima (automóveis), podemos pensar em peças LEGO, que se encaixam umas nas outras para obter soluções mais criativas e interessantes.
Tomemos o exemplo dos modelos de linguagem de grande escala – reconhecidos pelas suas competências em termos de linguagem natural –, e a forma como podem aliar-se a algoritmos preditivos (machine learning) e prescritivos (otimização) mais tradicionais, de forma a resolver desafios atuais através desta metodologia5. Existem diversos casos em que a IA generativa pode abordar desafios em termos de análise avançada, ao longo das fases de desenvolvimento e de implementação. Os modelos de linguagem de grande escala podem ser particularmente úteis para apoiar os utilizadores na integração de fontes de dados não-estruturados em análises, traduzindo problemas de negócios em modelos analíticos, e conhecendo/explicando os resultados dos modelos. Esta sinergia entre os modelos de linguagem e a análise avançada está também associada ao próximo pilar.
Embora tenham um bom desempenho em certas tarefas, os modelos de IA tendem a demonstrar alguns problemas em termos de confiabilidade, dada a sua complexidade e consequente falta de interpretabilidade. Esta é uma questão importante, que dificulta a adoção desses mesmos modelos, em áreas como a saúde, as finanças e as operações. A IA explicável (XAI) é uma área em franco crescimento, com vários trabalhos de investigação em diferentes ramos. Alguns propõem a utilização de métodos de explicabilidade em modelos IA “caixa-negra” (por exemplo, uma árvore de decisão que imite uma rede neuronal). Uma possível alternativa é envolvermo-nos no processo de descoberta, contribuindo para que a IA e as pessoas trabalhem em conjunto, de acordo com um processo empírico conduzido pelo humano. Tal é possível com recurso a modelos simbólicos e algoritmos de aprendizagem “naturalmente explicáveis”6.
Os modelos simbólicos podem ser aprendidos através de algoritmos de Programação Genética. A ideia passa por aprender um modelo compacto, cujo desempenho não esteja associado à sua complexidade e ao afinamento de diferentes constantes, mas sim à aprendizagem da estrutura do modelo - combinando, de forma livre, as variáveis do problema com operadores definidos pelo utilizador (por exemplo, aritméticos, lógicos, etc.). O modelo final acaba por ser compacto e inspecionável, sem necessidade de um método de explicabilidade; ou seja, “naturalmente explicável”. Em alguns casos, tal modelo pode ter um desempenho ainda melhor, em termos de generalização. Em outros casos, o desempenho pode não atingir o mesmo nível de uma “caixa-negra”. Nestas situações, poderá ser importante manter a “caixa-negra” e acrescentar um método de explicabilidade para obter mais informações sobre a sua operacionalização interna.
O envolvimento das pessoas no processo de descoberta de modelos de decisão implica uma profunda interação humano-máquina. No entanto, tal nível de interação nem sempre é possível, por exemplo, em contextos onde as decisões necessitam de ser tomadas rapidamente. Mais: os seres humanos podem interagir de diferentes maneiras, mesmo em contextos de tomada de decisão. Os sistemas de apoio à decisão são precisamente isso: sistemas baseados em métodos avançados, que sugerem potenciais decisões - que podem, ou não, ser adotadas por quem as toma. Em alguns casos, é importante que cada decisão seja avaliada pela pessoa responsável, por exemplo, ao sugerir determinados procedimentos médicos. Em outros casos, como a deteção de fraudes em transações via cartão de crédito, não é economicamente viável que agentes humanos avaliem todos os milhares de transações diárias.
Apesar de todas estas restrições, e para que as empresas possam tirar o máximo proveito da IA, é fundamental entender que não existe um tipo de solução ideal para definir a tal interação humano-máquina. Pelo contrário, a investigação já conseguiu identificar o seguinte: as empresas mais versáteis em termos de configuração de interações humano-máquina acabam por colher mais benefícios7. Em certos casos, a IA está responsável pelos processos de decisão e de implementação; em determinadas situações, a IA acabar por tomar uma decisão que é implementada pelas pessoas; no entanto, existem outras alternativas: casos em que a IA recomenda e as pessoas tomam uma decisão; contextos em que a IA gera resultados que as pessoas aplicam em processos de tomada de decisão; ou até mesmo situações em que o ser humano apresenta soluções posteriormente avaliadas pela IA. Descobrir o modelo indicado só poderá ser (provavelmente) uma decisão tomada por pessoas!
Para poder guiar uma empresa ao longo dos quatro pilares descritos acima, e tirar o máximo proveito da IA, é fundamental que a organização conheça os princípios básicos das tecnologias de IA. Dia após dia, conhecemos a realidade dos gestores de diferentes setores, e quão longe estão de compreender noções básicas de IA. Este é, naturalmente, um grande obstáculo em termos de: boas decisões sobre a utilização deste tipo de tecnologias; melhoria dos modelos de negócios; melhores oportunidades para renovar esses mesmos modelos. Tal como ouvimos alguém dizer (e bem): “introduzir IA em empresas desatualizadas leva a empresas desatualizadas e dispendiosas”.Para reverter esta situação, as empresas devem investir em ações de formação a todos os níveis da organização. Curiosamente, e de acordo com a Gartner8, este ano, 40% de todas as organizações irão disponibilizar ações de formação sobre ciência de dados, de forma a acelerar as qualificações de profissionais. Este é um salto de 35 pontos percentuais em relação ao que testemunhámos em 2021. Este processo deve ser contínuo, aos níveis corporativo e individual, pois o ritmo a que estas tecnologias evoluem não mostra sinais de abrandamento.