1 Introdução

Tradicionalmente, a teoria da firma focava em prever preços e quantidades no agregado, sem explorar profundamente os processos internos que direcionam as decisões empresariais. E para isto, compreender o comportamento organizacional exige-se uma abordagem que vá além das previsões macroeconômicas para estudar esses tais processos dentro das organizações (Cyert e March, 2015). Esse novo paradigma estimulou pesquisas, como a realizada por Dong et al. (2021), que investigam como a tomada de decisão é moldada dentro das organizações, influenciada tanto por fatores internos quanto externos, de forma a integrar perspectivas evolucionárias, cognitivas e econômicas.

A teoria comportamental, de acordo com essa visão, demonstra como as experiências acumuladas por uma empresa, sejam elas positivas ou negativas, desempenham um papel decisivo na formação de seu comportamento e no impacto sobre seu desempenho futuro, como apontado por Gavetti et al. (2012). Sob uma perspectiva mais ampla, a economia industrial analisa como essas decisões empresariais de entrar ou sair de mercados são moldadas por essa dinâmica interna e, simultaneamente, como elas afetam a estrutura da indústria. As escolhas que permeiam esses movimentos estratégicos influenciam a competitividade entre empresas e intensificam a rivalidade no mercado (Klein e Lien, 2009).

Quando se trata da dinâmica entre compradores e vendedores, a incerteza exerce papel semelhante quando afeta diretamente os processos de negociação. Tanto compradores quanto vendedores enfrentam desafios ao lidar com a complexidade e os riscos associados, o que, por sua vez, repercute em suas estratégias e tomadas de decisão (Ahearne et al., 2022).

As incertezas de mercado e as interações estratégicas são vitais para o crescimento das empresas e para o surgimento de novos processos de aprendizagem. A competitividade, nesse contexto, tem um profundo impacto, responsável por moldar tanto a eficácia das operações quanto a capacidade de adaptação das organizações. Como ressaltado por Bouncken et al. (2020), as tensões competitivas podem variar, desde a percepção da intensidade da concorrência até a sobreposição das estruturas de mercado.

A experimentação econômica é indispensável quando as soluções de mercado e suas interdependências não podem ser facilmente deduzidas pelos princípios teóricos, como aponta Rosenberg (1994), ao mostrar que o aprendizado acontece de forma prática, diretamente na interação com o mercado, e se destaca por sua forte ligação com a realidade econômica. A trajetória evolutiva delineada nesse contexto surge das primeiras tentativas na modelagem de agentes nos mercados financeiros, uma iniciativa pioneira realizada no campo das finanças comportamentais (Chakraborti et al., 2011). Nessa abordagem, a compreensão do comportamento de escolha humana revela-se como um elemento fundamental em diversas disciplinas, principalmente em Economia, Psicologia, Inteligência Artificial e Ánalise de Decisão com Múltiplos Critérios (Korhonen et al., 2021).

A inclusão de aspectos comportamentais em modelos de simulação ganhou destaque com o avanço da Modelagem Baseada em Agentes (Agent-Based Modeling – ABM), um método computacional voltado para entender sistemas complexos por meio da simulação das ações e interações de agentes autônomos. Diferentemente das abordagens tradicionais de otimização na teoria dos oligopólios, os modelos baseados em agentes focam no aprendizado limitado dos agentes ao explicar como eles processam informações e tomam decisões (Kimbrough e Murphy, 2013). Os agentes presentes nesses modelos são representações simplificadas de indivíduos do mundo real, podendo atuar como consumidores, empresários ou até mesmo como partes de grupos maiores, como corporações ou autoridades monetárias (Isaac, 2008).

No processo estratégico de aprendizagem e tomada de decisões em Teoria dos Jogos, o modelo de Atração Ponderada Experiente (Experience-Weighted Attraction – EWA) surge na literatura incorporando elementos cognitivos como decadência da memória, pensamento confractual e a depreciação de experiências passadas. Na sua aplicação, principalmente em economia, Chen e Du (2017) considera que a capacidade do EWA de capturar a natureza dinâmica do aprendizado, incorporando tanto o reforço de resultados reais quanto efeitos simulados de estratégias não escolhidas, o torna uma ferramenta valiosa na análise do comportamento econômico.

O ABM enfatiza enfatiza principalmente a heterogeneidade dos indivíduos, admitindo que diferentes agentes podem exibir comportamentos distintos, o que contradiz a premissa do “homo economicus”, que pressupõe um agente econômico completamente racional. Esse enfoque está diretamente ligado ao conceito de racionalidade limitada, proposto por Simon (1991), que argumenta que as decisões humanas são inevitavelmente influenciadas por limitações cognitivas e restrições de informação.

A Teoria dos Jogos, por sua vez, leva em consideração as situações estratégicas em que os jogadores tomam decisões em conjunto com outros indivíduos. O resultado para cada jogador é expresso quantitativamente em forma de payoff, seja em moeda ou utilidade. Este conceito desempenha um papel fundamental na explicação da estrutura analítica utilizada para compreender e modelar interações estratégicas, em que as escolhas de um participante individual têm um impacto direto no resultado coletivo (Fiani, 2006).

Este estudo tem como objetivo analisar o processo de aprendizado no contexto da Teoria dos Jogos, com foco nos jogos Buyer-Seller Game (BSG) e Market Entry Game (MEG), que envolvem situações de incerteza de mercado. A simulação dos aspectos comportamentais dos jogadores é fundamental nesses cenários, especialmente por meio de algoritmos de aprendizagem. Entre os modelos mais utilizados para representar o comportamento dos agentes, destacam-se os algoritmos de Atração Ponderada pela Experiência (Experience-Weighted Attraction – EWA), que incluem dois enfoques principais: o Modelo de Aprendizado por Reforço (Reinforcement Learning – RL) e o Modelo de Aprendizado Baseado em Crenças (Belief-based Learning – BL). O estudo também busca comparar o desempenho desses modelos, com o objetivo de compreender suas implicações sobre os equilíbrios teóricos, tanto em estratégias puras quanto em mistas, dentro dos jogos matriciais.

Dessa forma, propõe-se a implementação do modelo desenvolvido por Camerer e Ho (1998) para analisar o comportamento dos agentes na tomada de decisões estratégicas e os equilíbrios nas matrizes BSG e MEG, buscando solucionar o seguinte problema de pesquisa: Como se desdobram as dinâmicas de cooperação ou concorrência empresarial em um cenário de incertezas, e de que forma ocorre o aprendizado desses agentes ao utilizar modelos de aprendizagem aplicados à Teoria dos Jogos?

1.1 Justificativa

A implementação da Modelagem Baseada em Agentes foi fundamentada pelo seu caráter computacional, que amplia as possibilidades empíricas da economia ao flexibilizar os pressupostos rígidos dos modelos matemáticos tradicionais, geralmente limitados de forma analítica (Axtell e Farmer, 2022). Uma das principais limitações dos modelos descritivos convencionais, como apontado por Ceschi e Rubaltelli e Sartori (2014)], está na dificuldade de capturar mudanças de comportamento ao longo do tempo. Nos modelos econômicos clássicos, como a teoria dos jogos em sua forma normal, a capacidade de aprendizagem e adaptação dos jogadores não são bem representadas, visto que esses modelos são essencialmente estáticos e focam apenas em análises instantâneas sem considerar a dinâmica temporal.

Ao incorporar o conceito de racionalidade limitada, os modelos baseados em agentes refletem decisões com base em informações incompletas ou em heurísticas simplificadas, desafiando a premissa neoclássica de que indivíduos têm acesso e capacidade de processar todas as informações para maximizar sua utilidade. Esta noção de racionalidade limitada admite que os agentes não podem avaliar todas as opções ou antecipar todas as possíveis consequências de suas escolhas, o que, por sua vez, oferece uma representação mais realista das limitações cognitivas humanas e da complexidade dos sistemas econômicos. Kahneman e Tversky aprofundaram esse entendimento ao desenvolver uma taxonomia de erros de racionalidade, como representatividade, disponibilidade e ancoragem, que explicam as distorções cognitivas observadas nas decisões econômicas (Petracca, 2021).

Os algoritmos de aprendizagem ajudam a simular comportamentos realistas, o que garante a superação das restrições impostas pela suposição de racionalidade perfeita. Em vez de aderirem a regras imutáveis, os agentes ajustam suas estratégias com base em experiências passadas e informações disponíveis para maximizar sua utilidade ao longo do tempo. Esses algoritmos consideram ainda distorções cognitivas, como a tendência de valorizar excessivamente eventos recentes ou a aversão a perdas, tornando a modelagem comportamental mais alinhada com o que é observado empiricamente. Entre os modelos mais relevantes na literatura sobre algoritmos de aprendizagem adaptativa, destacam-se o Experience-Weighted Attraction e seus casos especiais, o Reinforcement Learning e o Belief-based Learning, conhecidos por seu excelente ajuste a dados experimentais, tanto em nível agregado quanto individual, em jogos matriciais (Köster e Schenk-Mathes e Specht, 2019).

Este trabalho também investiga conceitos da teoria dos jogos, uma área vital nos estudos econômicos e matemáticos, que desempenha um papel essencial na evolução da análise da economia moderna. Foram analisados os jogos BSG e MEG, escolhidos por sua importância na compreensão de interações estratégicas e dinâmicas de mercado. A Figura Figura 1.1 exemplifica as capacidades computacionais na teoria dos jogos, incluindo jogos matriciais e modelos de aprendizado estratégico.

A ABM é aplicada através de jogos matriciais que expõem equilíbrios e conflitos nas decisões estratégicas. Este método empírico baseia-se na implementação dos modelos EWA, RL e BL, os quais estabelecem a edificação do comportamento estratégico, da racionalidade e, sobretudo, do aprendizado. Funcionando em conjunto com a teoria dos jogos, esses modelos ampliam a capacidade de análise comportamental dos jogadores, através de uma visão mais detalhada e realista.

Figura 1.1: Composição dos modelos de aprendizagem.

Fonte: elaboração própria.

O método ABM pode oferecer uma compreensão mais extensa das propriedades de interação emergentes em circunstâncias complexas. Destaca-se, nesse contexto, a integração de modelos de interação de indivíduos e organizações heterogêneas na produção industrial, imóveis, gastos governamentais e investimentos empresariais — ou seja, áreas onde a intuição humana pode falhar (Farmer e Foley, 2009).

1.2 Objetivo geral

O presente estudo tem como objetivo analisar o processo de aprendizagem em contextos de incerteza, explorando modelos de simulação para comparar o desempenho e o comportamento dos agentes em relação aos equilíbrios teóricos identificados nos jogos Buyer–Seller Game e Market Entry Game.

1.3 Objetivos específicos

Implementar um modelo baseado em agentes utilizando simulação computacional, incorporando os algoritmos de aprendizagem: Experience-Weighted Attraction, Reinforcement Learning e Belief-based Learning;
Examinar a interação entre os agentes para identificar padrões comportamentais relacionados à tomada de decisões em cada modelo de aprendizagem;
Comparar o desempenho, seja ele cooperativo ou concorrencial, de cada algoritmo de aprendizagem, com o intuito de identificar qual deles alcança os melhores resultados.

1.4 Estrutura do trabalho

Este estudo está organizado em capítulos, conforme descrito a seguir:

Capítulo 1 — Introdução: Apresenta o contexto, a justificativa e os objetivos do estudo, explorando a relevância das dinâmicas de aprendizado em cenários de incerteza de mercado e a aplicação do modelo EWA em jogos matriciais.
Capítulo 2 — Referencial Teórico: Aborda os fundamentos da análise empírica em Teoria dos Jogos e do modelo EWA, incluindo seus casos especiais, além de apresentar trabalhos da literatura que aplicam o EWA em diferentes contextos estratégicos e econômicos.
Capítulo 3 — Procedimentos Metodológicos: Detalha a abordagem quantitativa adotada, incluindo a explicação das equações que originam os algoritmos de aprendizado EWA, RL e BL, e o embasamento teórico para sua aplicação.
Capítulo 4 — Aplicação do Modelo de Simulação: Apresenta a análise dos jogos matriciais BSG e MEG, incluindo a configuração das matrizes de estratégias e payoffs, a exploração dos equilíbrios alcançados em estratégias puras e mistas, a implementação computacional dos algoritmos de aprendizado EWA, RL e BL em R e o processamento dos dados gerados.
Capítulo 5 — Resultados: Exibe, de forma ilustrativa e descritiva, os principais resultados das simulações, com destaque para os padrões comportamentais observados e as dinâmicas de aprendizado identificadas.
Capítulo 6 — Considerações Finais: Resume os principais achados do estudo, avalia o aprendizado estratégico capturado pelos modelos e aponta implicações e possibilidades para trabalhos futuros.