O dilema do prisioneiro

Aprenda sobre o prisioneiro

Saiba mais sobre a teoria do jogo do dilema do prisioneiro Uma visão geral do dilema do prisioneiro. Open University (um parceiro editorial da Britannica) Veja todos os vídeos para este artigo

Para ilustrar os tipos de dificuldades que surgem em jogos de soma variável não cooperativos de duas pessoas, considere o célebre dilema do prisioneiro (PD), originalmente formulado pelo matemático americano Albert W. Tucker. Dois prisioneiros, PARA e B , suspeitos de cometerem um roubo juntos, são isolados e instados a confessar. Cada um está preocupado apenas em obter a menor sentença de prisão possível para si mesmo; cada um deve decidir se confessará sem saber a decisão de seu parceiro. Ambos os presos, entretanto, conhecem as consequências de suas decisões: (1) se ambos confessarem, ambos irão para a prisão por cinco anos; (2) se nenhum dos dois confessar, ambos irão para a prisão por um ano (por porte de arma escondida); e (3) se um confessa enquanto o outro não, o confessor fica em liberdade (por apresentar as provas do estado) e o silencioso vai para a prisão por 20 anos. A forma normal deste jogo é mostrada emTabela 4.



prisioneiros

dilema dos prisioneiros Tabela 4O dilema dos prisioneiros é um problema bem conhecido na teoria dos jogos. Ele demonstra como a comunicação entre os participantes pode alterar drasticamente sua melhor estratégia. Encyclopædia Britannica, Inc.



Superficialmente, a análise do DP é muito simples. Apesar PARA não posso ter certeza do que B fará, ele sabe que faz melhor confessar quando B confessa (ele pega cinco anos em vez de 20) e também quando B permanece em silêncio (ele não cumpre pena em vez de um ano); analogamente, B chegará à mesma conclusão. Portanto, a solução parece ser que cada prisioneiro faz o melhor para confessar e ir para a prisão por cinco anos. Paradoxalmente, porém, os dois ladrões se sairiam melhor se ambos adotassem a estratégia aparentemente irracional de permanecer em silêncio; cada um cumpriria apenas um ano de prisão. O ironia de PD é que quando cada uma das duas (ou mais) partes age de forma egoísta e não coopera com a outra (ou seja, quando ele confessa), elas se saem pior do que quando agem de forma altruísta e cooperam juntas (ou seja, quando permanecem em silêncio )

PD não é apenas um intrigante hipotético problema; situações da vida real com características semelhantes têm sido frequentemente observadas. Por exemplo, dois lojistas envolvidos em uma guerra de preços podem muito bem ser apanhados em um PD. Cada lojista sabe que, se tiver preços mais baixos do que seu rival, atrairá os clientes de seu rival e, assim, aumentará seus próprios lucros. Cada um, portanto, decide baixar seus preços, com o resultado de que nenhum deles obtém clientes e ambos obtêm lucros menores. Da mesma forma, as nações competindo em uma corrida armamentista e os agricultores aumentando a produção agrícola também podem ser vistos como demonstrações de PD. Quando duas nações continuam comprando mais armas na tentativa de alcançar a superioridade militar, nenhuma ganha vantagem e ambas estão mais pobres do que quando começaram. Um único agricultor pode aumentar seus lucros aumentando a produção, mas quando todos os agricultores aumentam sua produção, ocorre uma saturação do mercado, com lucros menores para todos.



Pode parecer que o paradoxo inerente no PD poderia ser resolvido se o jogo fosse jogado repetidamente. Os jogadores aprenderiam que se saem melhor quando agem de forma altruísta e cooperam. Na verdade, se um jogador deixasse de cooperar em um jogo, o outro jogador poderia retaliar não cooperando no próximo jogo, e ambos perderiam até que começassem a ver a luz e cooperassem novamente. Quando o jogo é repetido um número fixo de vezes, entretanto, esse argumento falha. Para ver isso, suponha que dois lojistas montem seus estandes em uma feira municipal de 10 dias. Além disso, suponha que cada um mantenha os preços integrais, sabendo que, se não o fizer, seu concorrente retaliará no dia seguinte. No último dia, porém, cada lojista percebe que seu concorrente não pode mais retaliar e, portanto, há poucos motivos para não baixar seus preços. Mas se cada lojista sabe que seu rival vai baixar seus preços no último dia, ele não tem incentivo para manter os preços cheios no nono dia. Continuando esse raciocínio, conclui-se que os lojistas racionais terão uma guerra de preços todos os dias. É apenas quando o jogo é jogado repetidamente, e nenhum dos jogadores sabe quando a sequência terminará, que a estratégia cooperativa pode ter sucesso.

Em 1980, o cientista político americano Robert Axelrod envolveu vários teóricos dos jogos em um torneio round-robin. Em cada partida, as estratégias de dois teóricos, incorporadas em programas de computador, competiam entre si em uma sequência de PDs sem fim definido. Uma boa estratégia foi definida como aquela em que um jogador sempre coopera com um oponente cooperativo. Além disso, se o oponente de um jogador não cooperasse durante um turno, a maioria das estratégias prescrevia a não cooperação no turno seguinte, mas um jogador com uma estratégia de perdão reverteu rapidamente para a cooperação assim que seu oponente começou a cooperar novamente. Nesse experimento, descobriu-se que todas as estratégias legais superaram todas as estratégias que não eram boas. Além disso, das estratégias legais, as que perdoam tiveram melhor desempenho.

Teoria dos movimentos

Outra abordagem para induzir a cooperação em PD e outros jogos de soma variável é a teoria dos movimentos (TOM). Proposto pelo cientista político americano Steven J. Brams, o TOM permite aos jogadores, a partir de qualquer resultado em uma recompensa matriz , para se mover e contra-mover dentro da matriz, capturando assim a natureza estratégica em mudança dos jogos à medida que evoluem ao longo do tempo. Em particular, o TOM assume que os jogadores pensam à frente sobre as consequências de todos os movimentos e contra-ataques dos participantes ao formular planos. Desse modo, o TOM incorpora cálculos de forma extensiva dentro da forma normal, obtendo vantagens de ambas as formas: o pensamento não míope da forma extensiva disciplinado pela economia da forma normal.



Para ilustrar a perspectiva não míope do TOM, considere o que acontece no PD em função de onde o jogo começa:

  1. Quando o jogo começa de forma não cooperativa, os jogadores ficam presos, não importa o quão longe olhem, porque assim que um jogador sai, o outro jogador, desfrutando de seu melhor resultado, não segue em frente. Resultado: os jogadores permanecem no resultado não cooperativo.
  2. Quando o jogo começa cooperativamente, nenhum jogador irá desertar, porque se ele o fizer, o outro jogador também irá desertar, e os dois ficarão em pior situação. Pensando no futuro, portanto, nenhum jogador desertará. Resultado: os jogadores permanecem no resultado cooperativo.
  3. Quando o jogo começa em um dos resultados ganha-perde (melhor para um jogador, pior para o outro), o jogador que está fazendo o melhor saberá que, se não estiver magnânimo e, consequentemente, não passa para o resultado cooperativo, seu oponente passa para o resultado não cooperativo, infligindo ao melhor jogador o seu pior resultado seguinte. Portanto, é do interesse do melhor jogador, assim como do seu oponente, que ele aja magnanimamente, antecipando que, se não o fizer, o resultado não cooperativo (próximo pior para ambos), ao invés do resultado cooperativo (próximo melhor para ambos), serão escolhidos. Resultado: o melhor jogador irá para o resultado cooperativo, onde o jogo permanecerá.

Esses movimentos racionais não estão além do alcance da maioria dos jogadores. Na verdade, eles são freqüentemente feitos por aqueles que olham além das consequências imediatas de suas próprias escolhas. Esses jogadores com visão de longo prazo podem escapar do dilema em PD - bem como de resultados ruins em outros jogos de soma variável - desde que o jogo não comece sem cooperação. Conseqüentemente, o TOM não prevê a cooperação incondicional no PD, mas, em vez disso, a torna uma função do ponto de partida do jogo.

Aplicações biológicas

Veja como a teoria dos jogos se aplica ao pavão

Veja como a teoria dos jogos se aplica à evolução da cauda do pavão. Aprenda como a teoria dos jogos se aplica à evolução da cauda do pavão. Open University (um parceiro editorial da Britannica) Veja todos os vídeos para este artigo



Uma aplicação fascinante e inesperada da teoria dos jogos em geral, e do PD em particular, ocorre na biologia. Quando dois machos se confrontam, seja competindo por uma companheira ou por algum território disputado, eles podem se comportar como falcões - lutando até que um seja mutilado, morto ou fuja - ou como pombas - fazendo uma postura, mas saindo antes que qualquer dano grave seja feito. (Na verdade, as pombas cooperam enquanto os falcões não.) Nenhum dos tipos de comportamento, ao que parece, é ideal para a sobrevivência: uma espécie contendo apenas falcões teria uma alta taxa de baixas; uma espécie contendo apenas pombos seria vulnerável a uma invasão por falcões ou uma mutação que produz falcões, porque a taxa de crescimento populacional dos falcões competitivos seria muito maior inicialmente do que a das pombas.

Assim, uma espécie com machos constituídos exclusivamente por gaviões ou pombos é vulnerável. O biólogo inglês John Maynard Smith mostrou que um terceiro tipo de comportamento masculino, que ele chamou de burguês, seria mais estável do que o dos falcões puros ou das pombas puras. Um burguês pode agir como um falcão ou uma pomba, dependendo de alguns sinais externos; por exemplo, pode lutar tenazmente quando encontra um rival em seu próprio território, mas ceder quando encontra o mesmo rival em outro lugar. Com efeito, os animais burgueses submetem seu conflito à arbitragem externa para evitar uma luta prolongada e mutuamente destrutiva.



Como mostrado emTabela 5, Smith construiu uma matriz de compensação na qual vários resultados possíveis (por exemplo, morte, mutilação, acasalamento bem-sucedido) e os custos e benefícios associados a eles (por exemplo, custo de tempo perdido), foram ponderados em termos do número esperado de genes propagado . Smith mostrou que uma invasão burguesa seria bem-sucedida contra uma população completamente de falcões, observando que quando um falcão enfrenta um falcão, ele perde 5, enquanto um burguês perde apenas 2,5. (Como se presume que a população é predominantemente de falcões, o sucesso da invasão pode ser previsto comparando o número médio de descendentes que um falcão produzirá quando confrontar outro falcão com o número médio de descendentes que um burguês produzirá ao confrontar um falcão. ) Patentemente, uma invasão burguesa contra uma população completamente pomba também teria sucesso, ganhando a descendência burguesa 6. Por outro lado, uma população completamente burguesa não pode ser invadida nem por falcões nem por pombas, porque o burguês ganha 5 contra burguês, o que é mais do que falcões ou pombos ganham quando se confrontam com os burgueses. Observe nesta aplicação que a questão não é que estratégia um jogador racional escolherá - não se supõe que os animais façam escolhas conscientes, embora seus tipos possam mudar por meio de mutação -, mas quais combinações de tipos são estáveis ​​e, portanto, têm probabilidade de evoluir.

competição biológica

competição biológica Tabela 5Bourgeois, ou comportamento misto de ataque / recuo, é a estratégia mais estável para uma população. Essa estratégia resiste à invasão de falcões (que sempre atacam) ou pombos (que sempre recuam). Por outro lado, uma população só de gaviões ou pombos pode ser invadida com sucesso por indivíduos burgueses porque sua recompensa esperada é maior (em termos de descendência) do que qualquer estratégia pura. Encyclopædia Britannica, Inc.

Smith deu vários exemplos que mostram como a estratégia burguesa é usada na prática. Por exemplo, borboletas machos de madeira pintada procuram pontos iluminados pelo sol no solo da floresta, onde as fêmeas costumam ser encontradas. Há uma escassez de tais locais, entretanto, e em um confronto entre um estranho e um habitante, o estranho cede após um breve duelo em que os combatentes se cercam. As habilidades de duelo dos adversários têm pouco efeito no resultado. Quando uma borboleta é colocada à força no território de outra para que cada uma considere a outra como o agressor, as duas borboletas duelam com indignação justa por muito mais tempo.

Idéias Frescas

Categoria

Outro

13-8

Cultura E Religião

Alquimista Cidade

Livros Gov-Civ-Guarda.pt

Gov-Civ-Guarda.pt Ao Vivo

Patrocinado Pela Fundação Charles Koch

Coronavírus

Ciência Surpreendente

Futuro Da Aprendizagem

Engrenagem

Mapas Estranhos

Patrocinadas

Patrocinado Pelo Institute For Humane Studies

Patrocinado Pela Intel The Nantucket Project

Patrocinado Pela Fundação John Templeton

Patrocinado Pela Kenzie Academy

Tecnologia E Inovação

Política E Atualidades

Mente E Cérebro

Notícias / Social

Patrocinado Pela Northwell Health

Parcerias

Sexo E Relacionamentos

Crescimento Pessoal

Podcasts Do Think Again

Patrocinado Por Sofia Gray

Vídeos

Patrocinado Por Sim. Cada Criança.

Geografia E Viagens

Filosofia E Religião

Entretenimento E Cultura Pop

Política, Lei E Governo

Ciência

Estilos De Vida E Questões Sociais

Tecnologia

Saúde E Medicina

Literatura

Artes Visuais

Lista

Desmistificado

História Do Mundo

Esportes E Recreação

Holofote

Companheiro

#wtfact

Pensadores Convidados

Saúde

O Presente

O Passado

Ciência Dura

O Futuro

Começa Com Um Estrondo

Alta Cultura

Neuropsicologia

13,8

Grande Pensamento+

Vida

Pensamento

Liderança

Habilidades Inteligentes

Arquivo Pessimistas

Recomendado