Principal » o negócio » Como a estratégia da teoria dos jogos melhora a tomada de decisão

Como a estratégia da teoria dos jogos melhora a tomada de decisão

o negócio : Como a estratégia da teoria dos jogos melhora a tomada de decisão

A teoria dos jogos, o estudo da tomada de decisões estratégicas, reúne disciplinas diferentes, como matemática, psicologia e filosofia. A teoria dos jogos foi inventada por John von Neumann e Oskar Morgenstern em 1944 e percorreu um longo caminho desde então. A importância da teoria dos jogos para a análise e tomada de decisões modernas pode ser avaliada pelo fato de que, desde 1970, até 12 economistas e cientistas renomados receberam o Prêmio Nobel de Ciências Econômicas por suas contribuições à teoria dos jogos.

A teoria dos jogos é aplicada em vários campos, incluindo negócios, finanças, economia, ciência política e psicologia. Compreender as estratégias da teoria dos jogos - tanto as populares quanto algumas das estratégias relativamente menos conhecidas - é importante para aprimorar as habilidades de raciocínio e tomada de decisão em um mundo complexo.

Dilema do Prisioneiro

Uma das estratégias mais populares e básicas da teoria dos jogos é o dilema do prisioneiro. Esse conceito explora a estratégia de tomada de decisão adotada por dois indivíduos que, agindo em seu próprio interesse, acabam com piores resultados do que se tivessem cooperado entre si em primeiro lugar.

No dilema do prisioneiro, dois suspeitos presos por um crime são mantidos em salas separadas e não podem se comunicar. O promotor informa o suspeito 1 e o suspeito 2 individualmente que, se confessar e testemunhar contra o outro, poderá libertar-se, mas se não cooperar e o outro suspeito, será sentenciado a três anos de prisão. Se ambos confessarem, receberão uma sentença de dois anos e, se nenhum deles confessar, serão sentenciados a um ano de prisão.

Embora a cooperação seja a melhor estratégia para os dois suspeitos, quando confrontados com esse dilema, a pesquisa mostra que a maioria das pessoas racionais prefere confessar e testemunhar contra a outra pessoa do que ficar calada e aproveitar a chance que a outra parte confessa.

(Para leitura relacionada, consulte: O dilema do prisioneiro nos negócios e na economia .)

Estratégias da Teoria dos Jogos

O dilema do prisioneiro estabelece as bases para estratégias avançadas da teoria dos jogos, das quais as populares incluem:

Moedas de um centavo correspondentes

Este é um jogo de soma zero que envolve dois jogadores (chamados de Jogador A e Jogador B) colocando simultaneamente um centavo na mesa, com a recompensa dependendo se os centavos correspondem. Se os dois centavos forem cara ou coroa, o Jogador A vence e mantém o centavo do Jogador B. Se não corresponderem, o Jogador B vence e mantém o centavo do Jogador A.

Impasse

Esse é um cenário de dilema social, como o dilema do prisioneiro, no qual dois jogadores podem cooperar ou desertar (ou seja, não cooperar). Em um impasse, se o Jogador A e o Jogador B cooperam, cada um recebe um pagamento de 1, e se ambos desertam, cada um recebe um pagamento de 2. Mas se o Jogador A coopera e o Jogador B falha, então A recebe um pagamento de 0 e B recebe um pagamento de 3. No diagrama de pagamento abaixo, o primeiro número nas células (a) a (d) representa o pagamento do Jogador A e o segundo número é o do Jogador B:

Matriz de pagamento de impasseJogador BJogador B
ColaborarDefeito
Jogador AColaborara) 1, 1b) 0, 3
Defeitoc) 3, 0d) 2, 2

O impasse difere do dilema do prisioneiro, pois a ação de maior benefício mútuo (ou seja, ambos os defeitos) também é a estratégia dominante. Uma estratégia dominante para um jogador é definida como aquela que produz o maior retorno de qualquer estratégia disponível, independentemente das estratégias empregadas pelos outros jogadores.

Um exemplo comumente citado de impasse é o de duas potências nucleares tentando chegar a um acordo para eliminar seus arsenais de bombas nucleares. Nesse caso, a cooperação implica aderir ao acordo, enquanto deserção significa renegar secretamente o contrato e reter o arsenal nuclear. O melhor resultado para qualquer uma das nações, infelizmente, é renegar o acordo e manter a opção nuclear, enquanto a outra nação elimina seu arsenal, pois isso dará ao primeiro uma tremenda vantagem oculta sobre o segundo se houver guerra entre os dois. A segunda melhor opção é que ambos desertem ou não cooperem, pois isso mantém seu status de potência nuclear.

Competição Cournot

Esse modelo também é conceitualmente semelhante ao dilema do prisioneiro e recebeu o nome do matemático francês Augustin Cournot, que o introduziu em 1838. A aplicação mais comum do modelo de Cournot é a descrição de um duopólio ou de dois principais produtores de um mercado.

Por exemplo, suponha que as empresas A e B produzam um produto idêntico e possam produzir quantidades altas ou baixas. Se ambos cooperarem e concordarem em produzir em níveis baixos, a oferta limitada se traduzirá em um preço alto para o produto no mercado e em lucros substanciais para ambas as empresas. Por outro lado, se eles desertarem e produzirem em níveis elevados, o mercado será inundado e resultará em um preço baixo para o produto e, consequentemente, em lucros mais baixos para ambos. Mas se um coopera (isto é, produz em níveis baixos) e os outros defeitos (isto é, produz clandestinamente em níveis altos), o primeiro apenas fica quieto enquanto o último obtém um lucro maior do que se ambos cooperassem.

A matriz de pagamento das empresas A e B é mostrada (os números representam lucro em milhões de dólares). Assim, se A coopera e produz em níveis baixos, enquanto B falha e produz em níveis altos, o resultado é mostrado na célula (b) - quebra de ponto para a empresa A e US $ 7 milhões em lucros para a empresa B.

Matriz de Pagamento de CournotEmpresa BEmpresa B
ColaborarDefeito
Empresa AColaborara) 4, 4b) 0, 7
Defeitoc) 7, 0d) 2, 2

Coordenação

Em coordenação, os jogadores ganham recompensas mais altas quando selecionam o mesmo curso de ação.

Como exemplo, considere dois gigantes da tecnologia que estão decidindo entre a introdução de uma nova tecnologia radical em chips de memória que poderia render centenas de milhões em lucros, ou uma versão revisada de uma tecnologia antiga que ganharia muito menos. Se apenas uma empresa decidir avançar com a nova tecnologia, a taxa de adoção pelos consumidores seria significativamente menor e, como resultado, ganharia menos do que se ambas as empresas decidissem pelo mesmo curso de ação. A matriz de pagamento é mostrada abaixo (os números representam lucro em milhões de dólares).

Assim, se ambas as empresas decidirem introduzir a nova tecnologia, ganhariam US $ 600 milhões cada, enquanto a introdução de uma versão revisada da tecnologia antiga renderia US $ 300 milhões cada, como mostrado na célula (d). Mas se a empresa A decidir sozinha introduzir a nova tecnologia, ela ganhará apenas US $ 150 milhões, embora a empresa B ganhe US $ 0 (presumivelmente porque os consumidores podem não estar dispostos a pagar por sua tecnologia agora obsoleta). Nesse caso, faz sentido que as duas empresas trabalhem juntas e não por conta própria.

Matriz de Playoff de CoordenaçãoEmpresa BEmpresa B
Nova tecnologiaTecnologia antiga
Empresa ANova tecnologiaa) 600, 600b) 0, 150
Tecnologia antigac) 150, 0d) 300, 300

Jogo Centopéia

Este é um jogo abrangente, no qual dois jogadores alternadamente têm a chance de ganhar a maior parte de um estoque de dinheiro que aumenta lentamente. O jogo da centopéia é seqüencial, já que os jogadores fazem seus movimentos um após o outro, e não simultaneamente; cada jogador também conhece as estratégias escolhidas pelos jogadores que jogaram antes deles. O jogo termina assim que um jogador recebe o estoque, com esse jogador recebendo a porção maior e o outro jogador recebendo a porção menor.

Como exemplo, suponha que o Jogador A vá primeiro e tenha que decidir se ele deve "pegar" ou "passar" o estoque, que atualmente é de $ 2. Se ele receber, A e B receberão US $ 1 cada, mas se A for aprovado, a decisão de receber ou passar agora deve ser tomada pelo Jogador B. Se B receber, ela receberá US $ 3 (ou seja, o estoque anterior de US $ 2 + US $ 1) e A recebe US $ 0. Mas se B passa, A agora decide se aceita ou não, e assim por diante. Se ambos os jogadores sempre optarem por passar, cada um receberá um pagamento de $ 100 no final do jogo.

O objetivo do jogo é que, se A e B cooperam e continuam passando até o final do jogo, eles recebem o pagamento máximo de US $ 100 cada. Mas se eles desconfiam do outro jogador e esperam que ele "pegue" na primeira oportunidade, o equilíbrio de Nash prevê que os jogadores terão a menor reclamação possível (US $ 1 neste caso). Estudos experimentais mostraram, no entanto, esse comportamento "racional" (como previsto pela teoria dos jogos) raramente é exibido na vida real. Isso não é intuitivamente surpreendente, dado o pequeno tamanho do pagamento inicial em relação ao final. Comportamento semelhante por sujeitos experimentais também foi exibido no dilema do viajante.

Dilema do Viajante

Esse jogo de soma diferente de zero, no qual ambos os jogadores tentam maximizar seu próprio pagamento sem considerar o outro, foi criado pelo economista Kaushik Basu em 1994. Por exemplo, no dilema do viajante, uma companhia aérea concorda em pagar uma indenização a dois viajantes por danos para itens idênticos. No entanto, os dois viajantes são obrigados a estimar separadamente o valor do item, com um mínimo de US $ 2 e um máximo de US $ 100. Se ambos escreverem o mesmo valor, a companhia aérea reembolsará cada um deles esse valor. Mas se os valores diferirem, a companhia aérea pagará o valor mais baixo, com um bônus de US $ 2 para o viajante que anotou esse valor mais baixo e uma penalidade de US $ 2 para o viajante que anotou o valor mais alto.

O nível de equilíbrio de Nash, baseado na indução reversa, é de US $ 2 neste cenário. Mas, como no jogo da centopéia, os experimentos de laboratório demonstram consistentemente que a maioria dos participantes, ingênua ou não, escolhe um número muito superior a US $ 2.

O dilema de Traveler pode ser aplicado para analisar uma variedade de situações da vida real. O processo de indução retroativa, por exemplo, pode ajudar a explicar como duas empresas envolvidas em uma concorrência acirrada podem aumentar constantemente os preços dos produtos em uma tentativa de ganhar participação de mercado, o que pode resultar em perdas cada vez maiores no processo.

Batalha dos sexos

Essa é outra forma do jogo de coordenação descrito anteriormente, mas com algumas assimetrias de pagamento. Essencialmente, envolve um casal tentando coordenar sua saída à noite. Embora tenham concordado em se encontrar no jogo de bola (a preferência do homem) ou em uma peça (a preferência da mulher), eles esqueceram o que decidiram e, para agravar, o problema, não podem se comunicar. Para onde eles deveriam ir? A matriz de pagamento é mostrada abaixo com os numerais nas células que representam o grau relativo de diversão do evento para a mulher e o homem, respectivamente. Por exemplo, a célula (a) representa a recompensa (em termos de níveis de diversão) para a mulher e o homem na peça (ela gosta muito mais do que ele). A célula (d) é a recompensa se ambas chegarem ao jogo (ele gosta mais do que ela). A célula (c) representa a insatisfação se as duas forem não apenas para o local errado, mas também para o evento de que menos gostam - a mulher no jogo de bola e o homem no jogo.

Matriz de recompensa da batalha dos sexosCaraCara
ToqueJogo de bola
MulherToquea) 6, 3b) 2, 2
Jogo de bolac) 0, 0d) 3, 6

Jogo do Ditador

Este é um jogo simples, no qual o Jogador A deve decidir como dividir um prêmio em dinheiro com o Jogador B, que não tem participação na decisão do Jogador A. Embora essa não seja uma estratégia da teoria dos jogos em si, ela fornece algumas idéias interessantes sobre o comportamento das pessoas. As experiências revelam que cerca de 50% guardam todo o dinheiro para si, 5% o dividem igualmente e os outros 45% dão ao outro participante uma parcela menor. O jogo do ditador está intimamente relacionado ao jogo do ultimato, no qual o jogador A recebe uma quantia fixa de dinheiro, parte da qual deve ser dada ao jogador B, que pode aceitar ou rejeitar a quantia fornecida. O problema é que, se o segundo jogador rejeitar a quantia oferecida, A e B não receberão nada. Os jogos do ditador e do ultimato contêm lições importantes para questões como doações de caridade e filantropia.

Guerra da paz

Essa é uma variação do dilema do prisioneiro no qual as decisões de "cooperação ou defeito" são substituídas por "paz ou guerra". Uma analogia pode ser duas empresas envolvidas em uma guerra de preços. Se ambos se absterem de reduzir os preços, gozam de relativa prosperidade (célula a), mas uma guerra de preços reduziria drasticamente os ganhos (célula d). No entanto, se A se engajar no corte de preços (guerra), mas B não, A terá um retorno maior de 4, pois poderá capturar participação de mercado substancial e esse volume maior compensaria os preços mais baixos do produto.

Matriz de recompensa da guerra de pazEmpresa BEmpresa B
PazGuerra
Empresa APaza) 3, 3b) 0, 4
Guerrac) 4, 0d) 1, 1

Dilema do voluntário

No dilema de um voluntário, alguém deve realizar uma tarefa ou trabalho para o bem comum. O pior resultado possível é alcançado se ninguém se voluntariar. Por exemplo, considere uma empresa em que a fraude contábil é galopante, mas a alta gerência não a conhece. Alguns funcionários juniores do departamento de contabilidade estão cientes da fraude, mas hesitam em informar a alta gerência, pois isso resultaria na demissão dos funcionários envolvidos na fraude e, provavelmente, na acusação.

Ser rotulado como denunciante também pode ter algumas repercussões na linha. Mas se ninguém se voluntariar, a fraude em larga escala pode resultar na eventual falência da empresa e na perda de empregos de todos.

A linha inferior

A teoria dos jogos pode ser usada de maneira muito eficaz como uma ferramenta para a tomada de decisões, seja em um ambiente econômico, comercial ou pessoal.

(Para leitura relacionada, consulte: Teoria dos jogos: além do básico .)

Compare contas de investimento Nome do provedor Descrição Divulgação do anunciante × As ofertas que aparecem nesta tabela são de parcerias das quais a Investopedia recebe remuneração.
Recomendado
Deixe O Seu Comentário