Principal » negociação algorítmica » Dilema do Prisioneiro

Dilema do Prisioneiro

negociação algorítmica : Dilema do Prisioneiro
Qual é o dilema do prisioneiro?

O dilema do prisioneiro é um paradoxo na análise de decisão, na qual dois indivíduos agindo por seus próprios interesses não produzem o resultado ideal. O dilema típico do prisioneiro é estabelecido de tal maneira que ambas as partes optam por se proteger às custas do outro participante. Como resultado, ambos os participantes se encontram em um estado pior do que se tivessem cooperado entre si no processo de tomada de decisão. O dilema do prisioneiro é um dos conceitos mais conhecidos na teoria moderna dos jogos.

Principais Takeaways

  • O dilema de um prisioneiro é uma situação em que os tomadores de decisão individuais sempre têm um incentivo para escolher de uma maneira que crie um resultado abaixo do ideal para os indivíduos como um grupo.
  • Os dilemas dos prisioneiros ocorrem em muitos aspectos da economia.
  • As pessoas desenvolveram muitos métodos para superar os dilemas dos presos para escolher melhores resultados coletivos, apesar dos incentivos individuais aparentemente desfavoráveis.
1:46

Dilema do Prisioneiro

Compreendendo o dilema do prisioneiro

O dilema do prisioneiro apresenta uma situação em que duas partes, separadas e incapazes de se comunicar, devem escolher entre cooperar ou não com a outra. A maior recompensa para cada parte ocorre quando ambas as partes decidem cooperar.

O dilema do prisioneiro clássico é assim: dois membros de uma gangue de ladrões de banco, Dave e Henry, foram presos e estão sendo interrogados em salas separadas. As autoridades não têm outras testemunhas e só podem provar o caso contra elas se convencerem pelo menos um dos ladrões a trair seu cúmplice e testemunhar o crime. Cada assaltante de banco tem a opção de cooperar com seu cúmplice e permanecer calado ou desertar da quadrilha e testemunhar pela acusação. Se os dois cooperarem e permanecerem calados, as autoridades só poderão condená-los com uma carga menor de vadiagem, o que significará um ano de prisão cada (1 ano para Dave + 1 ano para Henry = 2 anos de prisão total) Tempo). Se um testemunhar e o outro não, então quem testemunhar ficará livre e o outro receberá três anos (0 anos para quem desertar + 3 para o condenado = 3 anos no total). No entanto, se ambos testemunharem um contra o outro, cada um receberá dois anos de prisão por ser parcialmente responsável pelo assalto (2 anos para Dave + 2 anos para Henry = 4 anos de prisão total).

Nesse caso, cada ladrão sempre tem um incentivo para desertar, independentemente da escolha que o outro faz. Do ponto de vista de Dave, se Henry permanecer calado, Dave poderá cooperar com Henry e passar um ano na prisão, ou desertar e sair livre. Obviamente, seria melhor trair Henry e o resto da gangue nesse caso. Por outro lado, se Henry desertar e testemunhar contra Dave, a escolha de Dave passa a permanecer em silêncio e passar três anos ou conversar e passar dois anos na prisão. Mais uma vez, obviamente, ele preferiria fazer os dois anos ao longo de três.

Em ambos os casos, se Henry coopera com Dave ou falha na promotoria, Dave estará melhor se ele próprio desertar e testemunhar. Agora, como Henry enfrenta exatamente o mesmo conjunto de opções, ele também sempre será melhor em desertar. O paradoxo do dilema do prisioneiro é o seguinte: os dois ladrões podem minimizar o tempo total de prisão que os dois só farão se cooperarem (2 anos no total), mas os incentivos que eles enfrentam separadamente sempre os levarão a desertar e acabar com o tempo máximo máximo de prisão entre os dois (4 anos no total).

Exemplos do dilema do prisioneiro

A economia está repleta de exemplos de dilemas dos prisioneiros e pode ter resultados benéficos ou prejudiciais à economia e à sociedade como um todo. O ponto comum são as situações em que os incentivos enfrentados por cada tomador de decisão individual induzem a cada um deles a se comportar de uma maneira que os torna coletivamente piores, enquanto evitam individualmente escolhas que os tornariam todos coletivamente melhores, se tudo pudesse alguns de alguma forma escolhem cooperativamente.

Um exemplo é a tragédia dos bens comuns. Pode ser da vantagem coletiva de todos conservar e reinvestir na propagação de um recurso natural de piscina comum, a fim de poder continuar consumindo-o, mas cada indivíduo sempre tem um incentivo para consumir o máximo possível o mais rápido possível, o que então esgota o recurso. Encontrar uma maneira de cooperar claramente tornaria todos melhores aqui.

Por outro lado, o comportamento dos cartéis também pode ser considerado o dilema de um prisioneiro. Todos os membros de um cartel podem se enriquecer coletivamente, restringindo a produção para manter o preço que cada um recebe alto o suficiente para capturar aluguéis econômicos dos consumidores, mas cada membro do cartel individualmente tem um incentivo para trair o cartel e aumentar a produção para também capturar aluguéis afastados. os outros membros do cartel. Em termos do bem-estar da sociedade em geral em que o cartel opera, este é um exemplo de como o dilema de um prisioneiro que quebra o cartel às vezes pode às vezes melhorar a sociedade como um todo.

Fuja do dilema do prisioneiro

Com o tempo, as pessoas elaboraram uma variedade de soluções para os dilemas dos presos, a fim de superar incentivos individuais em favor do bem comum.

Primeiro, no mundo real, a maioria das interações econômicas e outras interações humanas são repetidas mais de uma vez. O dilema de um verdadeiro prisioneiro é tipicamente reproduzido apenas uma vez ou é classificado como o dilema de um prisioneiro iterado. No dilema de um prisioneiro iterado, os jogadores podem escolher estratégias que recompensem a cooperação ou punam a deserção ao longo do tempo. Ao interagir repetidamente com os mesmos indivíduos, podemos até deliberadamente passar do dilema de um prisioneiro único para um dilema de prisioneiro repetido.

Segundo, as pessoas desenvolveram estratégias institucionais formais para alterar os incentivos que os tomadores de decisão individuais enfrentam. A ação coletiva para reforçar o comportamento cooperativo por meio de reputação, regras, leis, tomada de decisões democráticas ou outras decisões coletivas e punição social explícita por deserções transforma muitos dilemas de prisioneiros em direção a resultados cooperativos coletivamente mais benéficos.

Por fim, algumas pessoas e grupos de pessoas desenvolveram vieses psicológicos e comportamentais ao longo do tempo, como maior confiança um no outro, orientação futura a longo prazo em interações repetidas e inclinações à reciprocidade positiva do comportamento cooperativo ou reciprocidade negativa dos comportamentos defeituosos. Essas tendências podem evoluir através de um tipo de seleção natural dentro de uma sociedade ao longo do tempo ou de uma seleção de grupos em diferentes sociedades concorrentes. De fato, eles levam grupos de indivíduos a escolher "irracionalmente" os resultados que são realmente os mais benéficos para todos eles juntos.

Em conjunto, esses três fatores (os dilemas repetidos dos prisioneiros, instituições formais que quebram os dilemas dos prisioneiros e preconceitos comportamentais que minam a escolha individual "racional" dos dilemas dos presos) ajudam a resolver os muitos dilemas dos prisioneiros que todos nós enfrentaríamos.

Compare contas de investimento Nome do provedor Descrição Divulgação do anunciante × As ofertas que aparecem nesta tabela são de parcerias das quais a Investopedia recebe remuneração.

Termos relacionados

Dilema Iterado do Prisioneiro Definição O dilema iterado do prisioneiro é reproduzido repetidamente pelos mesmos participantes e ajuda os jogadores a aprender sobre as tendências comportamentais de sua contraparte. mais Como funciona a teoria dos jogos A teoria dos jogos é uma estrutura para modelar cenários nos quais existem conflitos de interesse entre os jogadores. mais Definição de Teta para Tat A teta para tat é uma estratégia da teoria dos jogos em que um jogador escolhe a ação que o jogador adversário escolheu na rodada anterior. mais Equilíbrio de Nash O Equilíbrio de Nash é um conceito dentro da teoria dos jogos, em que o resultado ideal de um jogo é onde não há incentivo para se desviar de sua estratégia inicial. mais Definição de leilão em dólar Um leilão em dólar é um jogo seqüencial sem soma zero, em que o maior lance recebe um dólar e o perdedor também deve pagar o valor que ofereceu. mais Definição de oligopólio O oligopólio é uma estrutura de mercado com um pequeno número de empresas, nenhuma das quais pode impedir que as outras tenham influência significativa. mais Links de parceiros
Recomendado
Deixe O Seu Comentário