Traçando um curso de negócios para aprendizagem por reforço
LarLar > blog > Traçando um curso de negócios para aprendizagem por reforço

Traçando um curso de negócios para aprendizagem por reforço

Jun 26, 2023

Os líderes que buscam novas maneiras pelas quais a inteligência artificial (IA) pode fornecer uma vantagem competitiva podem ter achado a partida da America's Cup de 2021 tão emocionante pelo uso inovador da aprendizagem por reforço por uma equipe quanto por seus designs radicais de barco e corridas acirradas.

Para permanecerem competitivas, as equipes de vela na competição da America's Cup, como todas as empresas, devem ultrapassar os limites do que é possível. Também enfrentam restrições semelhantes, incluindo uma curva de desenvolvimento acentuada e uma pequena janela de oportunidade, o que significa que as equipas podem realizar apenas uma ou duas grandes experiências para melhorar o seu desempenho na competição mais importante do desporto.

Para a edição de 2021 da America's Cup, o atual campeão Emirates Team New Zealand aventurou-se que o aprendizado por reforço, uma técnica avançada de IA, poderia otimizar seu processo de design. A técnica funcionou, permitindo à equipe testar exponencialmente mais projetos de barcos e obter uma vantagem de desempenho que a ajudou a garantir sua quarta vitória na Copa.

Ao contrário de outros tipos de aprendizagem automática, a aprendizagem por reforço utiliza algoritmos (que muitas vezes treinam agentes de IA ou bots) que normalmente não dependem apenas de conjuntos de dados históricos, rotulados ou não, para aprender a fazer uma previsão ou executar uma tarefa. Eles aprendem como os humanos costumam fazer, por tentativa e erro. Nos últimos anos, a tecnologia amadureceu de forma a torná-la altamente escalável e capaz de otimizar a tomada de decisões em ambientes complexos e dinâmicos.

Além de acelerar e melhorar o design, a aprendizagem por reforço está sendo cada vez mais incorporada em uma ampla gama de aplicações complexas: recomendação de produtos em sistemas onde os comportamentos e preferências dos clientes mudam rapidamente; previsão de séries temporais em condições altamente dinâmicas; resolver problemas logísticos complexos que combinam embalagem, roteamento e programação; e até mesmo acelerar os ensaios clínicos e a análise do impacto das políticas económicas e de saúde nos consumidores e pacientes.

Vimos quão rapidamente o ambiente tecnológico pode mudar. Há apenas alguns anos, outra técnica de IA, o aprendizado profundo, saltou para o cenário empresarial. Hoje, 30% das empresas de alta tecnologia e telecomunicações e 16% das empresas de outros setores pesquisados ​​incorporaram capacidades de aprendizagem profunda.

Aqui estão algumas das aplicações mais comentadas da técnica nos últimos anos:

Os executivos que hoje entendem o potencial da aprendizagem por reforço estarão, como a Emirates Team New Zealand, em melhor posição para encontrar a vantagem em seus setores (veja a barra lateral “Exemplos notáveis ​​de aplicações de aprendizagem por reforço”). Compreender a experiência da equipa pode ajudar os líderes a avaliar onde e quando utilizar a tecnologia, porque muitas organizações percorrerão um caminho semelhante: implementar primeiro tecnologias mais tradicionais para resolver um problema e depois aplicar a aprendizagem por reforço para ascender a um nível de desempenho anteriormente inatingível. Assim, começamos por relatar a jornada da Emirates Team New Zealand, após o que oferecemos ideias sobre onde e como as empresas devem considerar a aplicação da aprendizagem por reforço.

Os designers da Emirates Team New Zealand não eram novos em tecnologias avançadas. Em 2010, a equipe construiu seu simulador digital de última geração para testar projetos de barcos sem construí-los fisicamente. Essa foi a chave para a vitória do time na Copa América de 2017, mas o simulador tinha limitações. Vários marinheiros eram necessários para operá-lo de maneira ideal, o que era um desafio logístico significativo, dados os treinos, viagens e competições programadas dos marinheiros. Como resultado, os projetistas normalmente repetiam novos projetos na ausência de dados de desempenho do simulador e depois testavam suas melhores ideias em lotes, quando conseguiam reservar grandes períodos de tempo com os marinheiros. Além disso, o desempenho dos marinheiros pode variar entre os testes, como acontece frequentemente com o desempenho humano, tornando difícil para os projetistas saber se uma melhoria marginal na resposta do barco foi devida a um ajuste no projeto ou a variações nos testes humanos.