Casino spel teori
Nya casino webbplatser för att spela med riktiga pengar
Medan beslut teori handlar om mängder och sannolikheter, spel teori har att brottas med tvekamp prioriteringar och ojämn, möjligen orättvist resultat. Det är en komplex, kul område, som omfattar rörigt psykologi, messy motiv och även messy tänkande med ekonomi och nedskärningar i hjärtat av den mänskliga naturen. Låt oss återvända till middag. Denna gång du äter solo, välja mellan go-lokala bar och en gourmetrestaurang sushi-ställe.
Lita på din magkänsla
Spelteori för dagliga beslut
Introduktion
I de odödliga orden av kenny rogers: du måste veta när du ska hålla вђem, vet när du viker вђem, veta när man ska gå bort, vet när du ska köra.
Itвђ™s så sant i spel som det är livet: från vad du bär till den person du gifter dig, ditt liv är resultatet av dina val. Hur kan du vara säker på att youвђ™re gör rätt?
Itвђ™s svindlande att tänka på alla de faktorer som går till att även små beslut.
Ta en av lifeвђ™s minst dramatiska scenarier: middag med vänner. Anser att det stora antalet variabler som deltar i en sådan rutin dilemma:
Hur mycket är alla villiga att spendera? Vilka restauranger som är rankade bäst? Och hur kan du vara säker på att majoriteten arenвђ™t anspråk på att vara вђњgood med något,вђќ medan hemlighet avsky din slutliga valet?
Usch. Även i en situation som denna triviala, osäkerhet frodas och blir det fel kan ha en negativ inverkan på din plånbok, det sociala livet eller i magen. Ja, weвђ™re över analysera вђ", men om itвђ™s liv och död eller pizza jämfört med pasta, varje beslut har risker och belöningar, sannolikheter och satsningar.
Den goda nyheten är att thereвђ™s massor av arbete ute som bryter beslutsfattande ned till grundläggande begrepp och mastering bara ett fåtal av dem kommer att lämna dig bättre utrustade i både casino och din vardag.
Beslut teori natur kontra Siffror
Det finns två sätt att förstå val: att gå med magen, eller med hjälp av din hjärna.
Medan många spelare hävdar annars att gå med i din tarm är en snabb väg till kaos вђ" en impulsiv beslutsprocessen som tenderar mot antingen slumpmässiga eller uppenbart fel. Med hjälp av din noggin verkar det mer självklara valet, och gör så begår du till rationell analys i stället för att flyga av stolen av dina byxor.
Låt oss återvända till middag. Denna gång du äter solo, välja mellan go-lokala bar och en gourmetrestaurang sushi-ställe.
De strategier här som inte involverar din gut (pun intended) dra från вђњdecision theoryвђќ, en studie med fokus på sannolikheter. Beslut teorin rekommenderar att du använder grundläggande multiplicationвђ"värdet av den föreslagna förmånen (en läcker måltid) multiplicerat med sannolikheten för att uppnå sade nytta.
På en skala från 1 till 10, skulle du betygssätta barвђ™s nachos som ett 5. Sushi är bland dina favoriträtter, så du poäng 10.
Men letвђ™s säga att sushi-restaurangen har varit fenomenal på ett tillfälle och hemskt på två andra besök. Din sannolikheten för en 10-gradig erfarenhet är bara 33%. Den lokala baren, har aldrig låta dig ner, är det 100% sannolikhet att tjäna upp en alldeles utmärkt middag.
Ska du skjuta för större belöning av sushi, trots risken?
Beslut teoretiker kallar detta ett problem av вђњexpected utilityвђќ, där вђutilityвђ™ är bara används när man menar helt enkelt вђdesirable outcomeвђ™. Din förväntade nyttan för middag på den lokala baren är 5 (värdet av måltiden), multiplicerat med 100%. Som kommer att 5. Din förväntade nyttan för sushi plats är 10 multiplicerat med 33%, eller 3.3. Eftersom 5 är större än 3,3, beslutsteori normalt skulle styra dig bort från den underbara men opålitliga val och mot anständigt, risk-free-alternativ - optimal balans av risk kontra belöning.
Spelteori
När fler än en person är inblandad i ett val, spelteori tar över. Spelet teori föreslår att nästan alla interaktionen mellan beslutsfattare kan mappas ut som ett spel eller organiserad tankeexperiment. Vart beslut att överlappa varandra, spelteori gäller.
Medan beslut teori handlar om mängder och sannolikheter, spel teori har att brottas med tvekamp prioriteringar och ojämn, möjligen orättvist resultat. Det är en komplex, kul område, som omfattar rörigt psykologi, messy motiv och även messy tänkande med ekonomi och nedskärningar i hjärtat av den mänskliga naturen.
En historia av valmöjligheter från pascal ' s satsning på prisoners dilemma
Rötterna av beslut och spel teori går tillbaka till 1669, när matematikern och filosofen blaise pascal fram detta argument för att tro på gud:
När det gäller din syn på gud, har du två val: att tro på gud, eller donвђ™t. Religion åt sidan, whatвђ™s rationellt beslut?
Antar att du är död. Om gud finns och youвђ™re en troende, kommer din utdelning är oändlig. Du går till himlen för evigt. Grattis!
Om gud inte existerar och youвђ™re en troende, din förlust är begränsade och relativt små. För att leva ett rent liv, du tyckte dig mindre än du kan ha - men beklagar är för de levande och livet efter detta, och inte heller nu gäller.
Föreställ dig nu att du är en disbeliever. Din bästa payoff är inte mycket av en payoff på alla: festa hårt, sedan dör och inte kommer till himlen, eftersom varken den eller dess påstådda skapare är verkliga.
Men om du tror, och gud existerar, din förlust är oändlig. Du är på väg till helvetet.
Egenintresse ensam dikterar du välja strategi med bästa möjliga utdelning, gillar det eller inte, bör du vara en troende.
Pascalвђ™s satsning bryts ner i en värld av flera världsbilder, men som ren matematik (och spelteori), det är i stort sett relevanta. Vi kan använda samma logik för att rädda planeten. Till exempel: om du tror eller inte tror på klimatkrisen?
Övertygelse, och den ansträngning som följer med den, antingen kommer att resultera i att rädda den mänskliga rasen eller förlora tid och pengar till ett uppblåst problem. Misstro kan spara dig en begränsad mängd kontanter och ansträngning om klimatförändringarna visar sig vara no big deal вђ" eller leda till humanityвђ™s tidiga bortgång.
Spelet är på gång von neumann och födelsen av spelteori
För att förstå varför människor är så dålig på att samarbeta, vi måste gräva i historien av spelet teori - börja med den man som i huvudsak uppfann det.
Matematikern john von neumann hjälpt till att etablera en tid präglad av kärnvapen som en del av manhattan-projektet. Men innan han skulle hjälpa den militära blåsa upp saker och ting, han har skrivit flera verk på spelteori och ekonomiska beteenden.
Von neumann status som fadern av spelteori är baserad på hans kallblodiga, matematisk analys av konkurrenskraftiga scenarier.
Tillsammans med att beskriva samspelet mellan beslutsfattare som вђњgames,вђќ von neumann visade att i två-person вђzero-sumвђ™ - spel eller tävlingar där en spelares vinna är andra spelare förlust, förmögenhet faktiskt inte gynnar den modiga. Den bästa strategin är att minimera dina förluster i händelse av en maximal förlust situationen вђ" hans вђњminimax theoremвђќ.
I spel, som innebär en kartläggning av de värsta möjliga outcomeвђ"en motståndare poker spelare som har den bästa möjliga korten för en viss handвђ"och välja den åtgärd som ger dig minst sårbara bör det fula resultatet materialisera.
Mer än att välja baserat på statiska sannolikheter som odds dealern visar ett ess för att slutföra din hand вђ" strategier för konkurrenskraftiga spel kräver att sätta dig själv i din opponentвђ™s skor.
Vad som händer om ace dyker upp och de driva alla sina marker? Med tillräckligt med tid för varje möjligt utfall i denna situation skulle kunna vara utstakad, inklusive vägning av risker och belöningar för att vika eller vistas i.
Genom att associera spel med den stora världen av ekonomi, von neumann visade att de flesta mänskliga interaktioner skulle kunna utformas, öppna dörren för smarta tänkare att tillämpa spelteori på allt från aktiemarknaden till kärnvapenkrig. Den omfattande konsekvenser gör det inte konstigt att, under de år, tolv nobelpristagare har varit spel teoretiker.
Byggd för att förråda den fångarnas dilemma
I en kapprustning, konkurrerande nationer ägna dyrbara resurser för att bunkra upp med vapen som de aldrig använder theyвђ™re svara för att de åtgärder som sina fiender, att välja en bara dåligt resultat (enorma utgifter på oanvända vapen) för att undvika en sämre (nederlag i händerna på en bättre utrustade fiende).
Detta går utöver pascalвђ™s satsning, eftersom en väpnad konflikt kommer med flera ändliga följder som sträcker sig från mindre strider hela vägen upp till nukleär förintelse. För att förstå detta samspel, vi behöver spelet theoryвђ™s mest berömda motion: prisonerвђ™s dilemma.
Föreställ dig två brottslingar fångas för samma brott och ges ett val: att förråda din partner (avhopp), eller stänga munnen (samarbete).
Om ett fel och det andra samarbetar, de avhoppare är släppt och co-operator blir tio år i fängelse. Om både brottslingar fel, de båda får ett straff på tre år. Slutligen, om både brottslingar vägra att råttan den andra ut, de båda får ett år.
Hereвђ™s sak: om ingen kommunikation är tillåten mellan fångar, det blir rationellt och till och med oundvikligt att båda spelarna kommer att förråda varandra. Hereвђ™s hur det bryter ner:
Om en fånge samarbetar med, han står inför möjligheten av spelets bästa fall resultatet (ett år, om både samarbeta) och sämsta utfall (tio år, om hans partner är fel). Att misslyckas fortfarande med att av spelets största vinst: frihet. Kommer från en plats av egenintresse, detta är en dyster väg.
Om en fånge fel, han undviker de värsta möjliga utfall (eftersom hans högsta meningen är tre, snarare än tio år) och har ett skott på bästa payoff (sweet, sweet freedom). Om du letar reda på för nummer ett, detta är det självklara valet.
Det gör avhopp i fångarnas dilemma en dominerande strategi: oavsett vad andra spelare väljer, avhopp strategi lovar en bättre utdelning. Genom att ratting på din partner, du är också minimerar dina förluster i värsta fall resultatet.
Nu byta nervös brottslingar för beväpning-lyckliga nationer. Plötsligt fångarnas dilemma förklarar tendens till motsatta krafter för att hålla stockpiling istället för att plana ut tidigt. Eftersom båda spelarna i spelet tvingas att välja den dominerande strategin, förutsatt att båda parter är rationella, båda är på väg att hoppa av. De kommer att agera på ett rationellt egenintresse och undvika samarbete på alla kostnader. Resultatet är ett spel som är omedelbart låsas in i en eskalerande dödläge.
Det ironiska i fångarnas dilemma är att det gemensamma resultatet är faktiskt värre än det skulle vara om båda parter valt att samarbeta. Motsatta avhoppare får vardera tre års fängelse, medan co-operatörer skulle vara ute i ett år вђ" och det samma gäller för en kapprustning: resurser förbrukas och krig är avvärjt вђ" men båda nationerna skulle vara bättre att ha kommit överens om att aldrig slösa investeringar.
Spelteori inte bara visar oss det bästa valet i en viss situation, det visar även varför dåliga val är så svårt att undvika.
Spelteori i 10 enkla steg
1. SOM DU KANSKE HAR GISSAT, "GAME THEORY" ÄR DEN MATEMATISKA STUDIER AV SPEL
Men inte bara en typ av spel. Spelteori gäller endast spel av strategi mellan två eller flera konkurrerande aktörer. Oftast finns det en tydlig uppsättning regler som definierar möjliga drag att varje spelare kan göra i varje ögonblick i spelet och en följd betyg för varje spelare i slutet av varje spel av spelet.
2. FÖRVÄXLA INTE "GAME THEORY" MED "SPEL TEORI"
Även om de två inte överlappar varandra. Spel teori gäller spel med osäker utgång, med en eller flera spelare, med eller utan skicklighet inblandade. Man kan säga att spelteori handlar om spel av skicklighet och spel teori om spel av en slump (även om en single-player spel som kräver en viss skicklighet skulle inte vara ett ämne av spelteori). Video poker, vilket innebär att bara en enda spelare som försöker att göra vinnande kombinationer, har ett element av skicklighet, men fortfarande skulle det inte vara ett ämne för spelteori. Men live poker, som spelas mellan två eller flera personer, som är ett passande ämne för spelteori. I själva verket, poker-spel, speciellt i en förenklad version, har använts som paradigm i spelteori eftersom john von neumann grundades modern spelteori tillbaka på 1920-talet.
På samma sätt, spelteori gäller inte för spelet av blackjack, även om en skicklig korträknare av en kant över casinot. Men, om du anser att den katt-och-råttalek som korträknare har att utmärka sig på att att tillåtas att fortsätta spela och slog casino spel teori har en hel del att säga om det.
3. SPELTEORI DELAR UPP SPEL I TVÅ TYPER LÄNGS FLERA OLIKA KRITERIER
Det är kooperativa kontra icke-kooperativa spel, noll-summan (eller mer exakt, konstant summa) jämfört med icke-nollsummespel, samtidig jämfört med sekventiell spel, spel med perfekt information kontra spel med ofullständig information, och två spelare-spel kontra spel med tre eller fler spelare. Det finns också symmetrisk och asymmetrisk spel, oändlig spel, kombinatoriska spel, upprepade spel, diskreta eller kontinuerliga spel, befolkning spel, stokastiska spel, meta-spel, och så vidare.
Det är bra att veta att dessa villkor existerar, men jag kommer inte att kunna täcka alla dem här.
4. DEN EKONOMISKA FÖRUTSÄGA BETEENDE MODELL
Spelteorin utvecklades ursprungligen som en matematisk modell för att studera och förutsäga ekonomiska beteende. Men det breda utbudet av spel som spelet teori överväger gör det värdefullt som en modell eller ett verktyg för många områden, inklusive evolutionär biologi, filosofi, statsvetenskap, datavetenskap, krig, och, naturligtvis, multi-person spel om pengar som poker. Kom ihåg den klassiska 1983 filmen war-spel? (om du inte har sett det, det är ditt första hemuppgift.) det är spel teori som har tillämpats för att thermonuclear war.
"perfekt information" i spelet teori betyder inte att du vet framtiden. Det betyder bara att varje spelare har perfekt information om det förflutna
5. JAG VILL SPELA EN (ZERO SUM) SPEL
Ett spel är ett nollsummespel om den totala betyg i slutet av varje spel är noll. Med andra ord, hur mycket en person vinner kommer att förloras genom att den andra spelaren(er) i spelet. Spel om pengar som poker är oftast nollsummespel (inte inklusive huset raken, men inte heller inklusive underhållningsvärdet, vilket är anledningen till att vi spelar i första hand). Det finns vissa spel där spelare kan kombineras göra bättre eller sämre beroende på deras strategier. Spel som detta används ibland som modeller för hur samarbete kan utvecklas mellan annars konkurrerande aktörer.
6. KAN DU FÖRUTSPÅ FRAMTIDEN? DET ÄR PERFEKT
"perfekt information" i spelet teori betyder inte att du vet framtiden. Det betyder bara att varje spelare har perfekt information om de senaste (och närvarande, om det finns samtidigt flyttar av olika aktörer). Det finns ingen dold information som en spelare vet att en annan inte, av en spelare som är dolda kort i poker spelet. Och det finns inga dolda rör sig, som utgångspunkt i ett game av slagskepp.
Spel som schack, dam, och gå är spel som är perfekt information, och det finns en separat gren av matematiken som kallas kombinatorisk spelteori som fokuserar på dem. "vanliga" spel teori fokuserar mer på spel med ofullständig information. Det kan fortfarande vara slumpmässighet och osäkerhet i ett spel med perfekt information. Backgammon är ett bra exempel, och monopol också. (på tal om monopol och war games, i andra världskriget, allierade faktiskt smugglas kartor, kompasser och andra verktyg för att krigsfångar, inne monopol styrelser!)
7. DET HANDLAR OM INELEGANCE
Den huvudsakliga inriktningen av spelteori är på fullt rationell, intelligent spelare.
Spelteori är intresserad av att besvara frågan, "vad är det bästa sättet att spela mot motståndare som tänker som jag gör?" fokusera inte på hur att spela mot en viss motståndare med en viss strategi (även om det kan vara ett steg i en algoritm för att hitta en optimal strategi). Det är som ett geni att spela mot en tvilling.
"vad är det bästa sättet att spela mot motståndare som tänker som jag gör?" fokusera inte på hur att spela mot en viss motståndare med en viss strategi.
8. REN STRATEGI VS BLANDAD STRATEGI
I varje två-spelare nollsummespel, som heads-up poker, det är en strategi (eller en uppsättning av strategier) som inte kan bli slagna, även med de bästa motståndare. Det är det som brukar kallas den optimala strategin. Om du följer den optimala strategin, du kan även berätta för din motståndare hur du spelar (men inte "ge bort" berättar!) och du kan inte bli slagna på lång sikt. Optimala strategier innebär ofta att plocka slumpmässigt (men med exakta sannolikheter) mellan två eller flera olika spela val för vissa eller alla drag av spelet, eftersom en motståndare kan ibland dra nytta av en strategi som är alltför förutsägbara. (detta kallas för en "blandad strategi i spelet teori, i motsats till en "ren strategi" som alltid gör samma val av röra sig i identiska situationer.)
till exempel, i spelet sten-sax-påse (som också kallas roshambo), den optimala strategin är att göra varje spela en tredjedel av tiden. Om du spelade rock med något mer ofta än att dina motståndare kan ha en fördel genom att spela papper oftare än en tredjedel och/eller spela sax mindre ofta. Observera att den optimala strategin i roshambo kommer inte att ge dig en fördel, men det kommer att hindra din motståndare från att få en fördel. Lyckligtvis är det inte sant i poker. Den optimala strategin, om du kan räkna ut och följa det fullt ut, kommer att ge dig en fördel mot nästan vem som helst annars.
Du kanske har hört att poker forskare "löst" en verklig poker spel förra året (heads-up-limit texas hold ' em). De hade inte bokstavligen lösa spelet, men de ville komma nära nog, med hjälp av tusentals dagar dator tid, att de kände att de kunde säga att de "i huvudsak" och löste det. Du kan spela perfekt mot det för hela livet och har fortfarande en bra chans att förlora.
Citat: om du följer den optimala strategin, du kan även berätta för din motståndare hur du spelar (men inte "ge bort" berättar!) och du kan inte bli slagna på lång sikt
9. JÄMVIKT STRATEGIER
Lägg bara en spelare, så det är 3 spelare i ett spel (eller spelet är inte noll-summa) och det är inte garanterat att vara en "bästa" eller "optimalt" sätt att spela. Men, det kan vara "jämvikt strategier", som kallas nash-jämvikter, uppkallad efter john nash, den berömda matematiker som vann nobelpriset i ekonomi 1994 för hans banbrytande arbete. Nash var föremål för flera academy award-vinnande filmen A beautiful mind, baserad på boken med samma namn. Tråkigt nog förra året att han och hans fru omkom i en bilolycka i new jersey, som drivs hem från flygplatsen efter en pris-vinnande resa till norge.
10. GÅ UT OCH SPELA
I en nash-jämvikt, ingen spelare kan göra bättre genom att ensidigt ändra hans eller hennes strategi. Men, två eller fler spelare skulle kunna ändra sin strategi tillsammans och se en förbättring. Genom att tillämpa detta till ett poker spel: när det finns fler än 2 spelare i spelet, det är ingen strategi som alltid kommer att vinna (även om dina motståndare är inte målmedvetet med att sammarbeta mot dig). Det innebär att du måste anpassa din strategi till dina motståndare och hur de spelar på den tiden. För att komplicera saken, de kommer att vara ständigt försöker anpassa sig till dig och alla andra också. Och, ibland, även av en slump, de kanske spelar på ett sätt som du inte kan slå i det långa loppet. Så, hitta en poker spel som du är bekväm i och som de kan vinna på, eller söka en heads-up (två spelare) spel.
Slutligen, som leder oss fram till din sista uppdraget: att komma ut och spela. (tell 'em du bara göra dina läxor!)
Game theory optimal lösningar och poker online: några tankar
GTO står för "game theory optimal." i poker den här termen får kastas runt för att signalera ett par olika begrepp. Det hänvisar till tankar om motståndaren modellering, och tänker på poker situationer i form av intervall och sannolikheter, som motsats till att vara strikt resultatinriktade.
Ibland är dessa idéer får minskas till unga proffsen skrika över en poker rum (eller twittersphere) om huruvida en given play är "GTO" — eller "den motsatta av GTO," som jag såg nyligen i en diskussion tråd. Men vad betyder detta egentligen? Och det gäller inte ditt spel?
Söker en unexploitable strategi
En spelteori optimal lösning till ett spel som har exakta matematiska definitioner. Det är intressant att fundera på vad detta betyder att en pokerspelare, samt hur detta begrepp har blivit en dominerande ramverket för att titta på perfekt poker strategi. Eftersom det mesta av min tid i dessa dagar är förbrukade byggnad ais dator att spela starka poker, jag är ofta att tänka på hur datorer ser till GTO strategier för att spela poker unexploitable.
GTO — särskilt i samband med moderna poker — är i stor utsträckning om att bedriva en strategi som gör det omöjligt för dig att få skjuts runt. Tror uma thurman i kill bill. Eller bruce willis i någon bruce willis-film.
Utanför poker, GTO är oftast in med "fångarnas dilemma." i denna hypotetiska situation, de två av oss är arresterad för att gemensamt begå ett brott. Om ingen av oss pratar vi både få bort med ljus meningar. Dock, om en av oss snitches på andra, tjallare kommer att få bort med något straff alls, medan den person som talar inte får ett hårt straff. Om vi båda tjallare, vi båda få ett hårt straff, eftersom varje persons vittnesbörd kan användas mot andra.
Även om vi skulle vara bäst med det första scenariot (ingen talar), varje individ är bättre på att samarbeta med myndigheterna, oavsett vad den andra gör (om jag inte tjallare, bör du tjallare för att få bort gratis, och om jag gör tjallare, bör du definitivt tjallare som också). I en miljö där spelare belönas för att dra nytta av varandra, kan det inte vara värt att spela tillsammans, även om alla sidor skulle få det bättre genom att göra så.
Ett annat dilemma: en turnering bubble
Poker motsvarande skulle vara två spelare kämpar mot det ut på bubblan i en turnering. Med undantag för super-djupa stackar som kan chip upp på bubblan utan risk för att bli tjock, kvarvarande spelare dra nytta av någon konfrontation som leder till en eliminering. Alltså två spelare i hand är det bara skadar sig själva, genom att försöka att sätta dit varandra. Och ändå, är det inte möjligt för dem att arbeta tillsammans mot ett ömsesidigt fördelaktig lösning.
Att reagera på motståndarens försök att köra över dig är så naturligt att en tänkande poker spelare, inramning det i termer av GTO kan tyckas nästan överflödig. Naturligtvis din motståndare har en strategi. Du har en idé om vad denna strategi skulle vara med olika händer, och ditt jobb är att ta med detta i beräkningen när du utför din egen strategi.
Med andra ord, spela spelare. Detta är vad GTO handlar om.
Strävan att "lösa" hold ' em (och andra spel)
När du justerar din strategi till en motståndares strategi, han eller hon kommer att justera din, och så vidare. För heads-up-limit hold ' em, university of alberta laget tog den här processen till dess logiska slutsats, att publicera sina resultat tidigare i år i vetenskap magazine. Med hjälp av ett nätverk av datorer, de sätter två strategier lös, upprepade gånger för att anpassa sig till varandras spel. Så småningom, att de nått ett tillstånd där varken spelare kan få ännu en 1% fördel mot andra i en viss situation.
Detta låter komplicerat, och jag är en förenkling vad de gjorde för något. Men i grund och botten, de kom på en strategi som en motståndare kan inte utnyttja — eller åtminstone inte kan utnyttja än en 1% kant med någon annan möjlig strategi. Något förvirrande, university of alberta laget hävdar båda att de har "löst" heads up limit hold 'em, och också att de hittade bara en GTO jämvikt för heads-up-limit hold' em, och att det är sannolikt att andra jämvikter för spel kvar att bli upptäckt.
U. Of alberta team (via the verge)
Enligt papper, sina "nästan perfekt" heads-up-limit hold ' em bot höjer 90%+ av händerna på knappen, men inte fyra-bet när det blir tre-bet från BB nästan alls, inte ens med
. Detta verkar innebära att fyra-betting på den knapp som är fel, eller åtminstone inte lika lönsamt som det är att dölja handen med platt-ringa tre-bet. Första gången jag läste sina papper, det är verkligen vad jag trodde de menade.Men, alberta folk är snabba att påpeka att ringa en tre-satsning
på knappen 100% av tiden bara är optimal i GTO jämvikt som de hittade. Med tanke på resten av deras strategi, att det skulle vara värre att fyra-bet med pocket ess. Du har förmodligen kunde fyra-bet med ess, men sedan resten av strategi skulle behöva justera. Åtminstone, skulle du behöver för att fyra-bet andra händer, så att inte ge bort det som du hade ess. Om de fasta som en fyra-bet och sprang resten av processen tills den stabiliserats, skulle nå en annan GTO jämvikt? Det skulle vara ett intressant experiment.I praktiken, om du vet att din motståndare kommer att ringa ut med ett par händer mot ess, och inte reagera som om han vet mycket tajt fyra-betting utbud, då är du bara saknas en insats. I en ny episod av tänka poker podcast, andrew brokos och nate meyvis förklara detta väl. Spelteori används en stark definition av optimal spel, där du ska överväga varje spel som du någonsin skulle göra med varje hand som en del av jämvikt. Men i verkliga fall, 95% av det är att optimera för vad du skulle göra i denna plats, med tanke på det utbud av händer som du kan spela, och vad dina motståndares händer kan vara.
I en hand diskuteras på showen, en lyssnare i en limit hold ' em spel som innehas
ur position på en ess-hög flopp. Heads-up, det här är ännu ett plus-EV hand, men det är inte mycket värde i att satsa. Att du inte får ett ess att lägga sig, och genom att kontrollera, du kommer att få mer värde från en bluff, liksom från ett värde satsning med mellanpar.Låt oss tänka på den här situationen som en dator-AI kan. Säg att du spelar $100/$200 limit hold ' em. Potten är på $400, och du höjt före floppen med
. Din handens värde kan vara något som +$700 på denna punkt (inklusive odds för att vinna potten, och värdet av framtida satsningar). Nu ess floppar, och ditt värde sjunker till +$300 eller så. Ännu viktigare, värdet av in-telefoni kan släppa med mindre än värdet av att satsa ut. Att uppskatta värdet av din hand, förutsatt att båda spelarna spelar bra och om även i det långa loppet, är bara ett annat sätt att närma GTO.När alla vet vad alla andra gör
När du är i tre-hand (eller fler) spel, det finns ingen spelteori optimal lösning, strängt taget. Detta beror på att det är ingen stabil jämvikt (eller för många jämvikter att räkna med, beroende på vem du frågar). Spelarna kan alltid anpassa sig till varandra, eller dra fördel av en spelare försöker köra en GTO strategi och inte anpassa sig till dem, genom en process som bill chen och jerrod ankenman call "implicit samverkan" i sin bok 2006 pokerns matematik. Därmed är det ingen strategi unexploitable.
"pokerns matematik" (2006)
Låt oss gräva i detta för en sekund. När du spelar heads up, om du (eller en bot) följer en GTO strategi, en motståndare kan inte slå dig i det långa loppet, oavsett vad han eller hon gör. Detta betyder inte att du vinner mest mot denna motståndare, men du låser i ett långsiktigt slips, medan jag fortfarande kommer i åtnjutande av några av dina motståndares misstag.
Till exempel limit hold ' em GTO bot kommer att betala av på river med botten par tillräckligt ofta så att du inte kan bluffa det på ett effektivt sätt. Om du aldrig bluffar i denna plats, bot kommer fortfarande betalar du mindre i samma takt. En exploaterande spelare skulle sluta betala ut dig efter ett tag, och vinna ännu mer. Doug polk talade om twoplustwo pokercast om denna situation kommer upp under man-vs-maskin NLH-match förra våren. Det var en sådan lättnad att spelarna när de insåg att när datorn spelade bra ("4 av 10" i förhållande till hans vanliga motståndare, enligt polk), det var inte ett försök att utnyttja deras vadslagning mönster. Om när du floppar nötterna du satsar 1,5 x potten eller smulas sönder en cookie, AI inte vet eller bryr sig. Det är bara spelar GTO.
I en idealiserad 3+ spelare där alla anpassar sig till alla, GTO bör inte arbeta. Men i praktiken, om spelarna inte ändra sina strategier alltför mycket från hand till hand (och de inte), en hel del heads-up GTO principer.
En vän till mig gick till forskarskolan med en av de bästa online-spelare i världen, och fick en chans att se honom spela. Han var förvånad över att hans klasskamrat inte göra några ovanliga spel, eller egentligen "drag" på alla. Enligt pro:
- Alla vet vem jag är
- Alla vet hur jag spelar
- Det finns ingen anledning att komma ut på linjen
Om du tar chen och ankenman idéer om "implicit samverkan" till hjärtat, man kan också lägga till att om spelarna var gadda upp på honom i stället för att försöka slå varandra, pro skulle bara avsluta spelet. Detta är en icke-fråga i nosebleed-spelen, eftersom alla känner alla, och spela anonymt eller collusively är egentligen inte möjligt.
Poängen är att det bästa spelare i online poker förra året (en per-hand basis) spelar GTO. Han måste vara riktigt bra på att veta när att satsa 80% av tiden och att samtal 20%, och när man ska ringa 20% och att vika 80%. Och då han faktiskt gör det. Det finns en hel del som talar för bra utförande. (Jag tenderar att tycka att 20% knappen för att ringa upp lite för ofta.)
Det är också lätt att se varför han i samma intervju är pessimistisk om människors chanser, när robotar lär dig allt rätt insats frekvenser. Våra silicon vänner alltid kommer att ha den kant i utförandet, och de behöver inte rum, mat, eller dryck.
Slutsats: GTO är den baslinje
På kort sikt, människor konvergerar på GTO snabbare. När jag satt på läktaren i amazon room på rio all-suite hotel and casino för finalbordet av $1 miljon big one for one drop, det chockade mig hur lös-passiv spela blev efter att komma ner till tre-handed.
Tre deltagare i big one for one drop
Jag tog några flack på twitter för att jämföra liten bet, in-ner spel som sker mellan daniel negreanu, dan colman och christoph vogelsang för att en nattlig satellit på en lokal casino. Folk sköt tillbaka att dessa killar är de bästa i världen, och jag är uppenbarligen en idiot. Men visst hade utseende som ingen av de andra spelarna försöker att pressa den andra. Och varför skulle de? Med vinster på $15M, $8, $4M, det var en hel del mindre upp i vinnande marker än vad som var nackdelen med att chippa ner eller busting.
På andra sidan, om en kille sköt, han visste att de andra visste hur man slåss tillbaka. Så ingen skjuts. För ungefär två timmar, tre av de bästa short-handed NLHE spelarna i världen kontrolleras eller små, satsa varje hand tills vogelsang, kort stack, busted.
Behöver du för att spela GTO för att vinna? Eller snarare, hur nära du behöver för att få till GTO för att hålla dina egna mot en stark motståndare? Låt professor tuomos sandholm, chef för carnegie mellon ' s claudico no-limit hold ' em-lag, ett svar på den frågan.
I en nyligen publicerad artikel i cigarr aficianado intervjua forskare och entusiaster på årliga computer poker championship, sandholm blev tillfrågad om hans kollegor vid university of alberta lösa limit hold ' em.
"de säger att det är i stort sett löst. Jag tror att räknas", svarade sandholm. "min fråga är dock: var det i stort sett löst för tre år sedan?"
Nära optimala spela GTO är bara första steget. När din baslinje strategi kan inte vara lätt utnyttjas, du kan tillbringa resten av din tid med att studera motståndare tendenser och anpassa sig till deras svagheter. Det kommer att finnas gott om motståndare som inte tycker om att områden, som inte anpassar sig till vissa av information om spelet, eller som bara spelar sitt eget sätt. Att anpassa sig till dem är vad GTO, och poker, det är verkligen allt om.
För en bra, tillgänglig utforskning av hur man använder GTO i ditt spel, kolla ed miller's bok poker är 1%: en stor hemlighet som håller elite-spelare på topp . Under tiden för exempel på hur spelare använder handen intervall för att anpassa sig till sin motståndares strategier, se alla alec torelli"s "hand of the day" analyser här på pokernews, eller intervju med vegas $2/$5 NL pro sangni zhao.
Nikolai östersjöns kust är en professionell poker spelare och utvecklare som är bosatta i brooklyn, new york som bidrog till att skapa ABC-open-face chinese poker-app för iphone.
Vill bo ovanpå den senaste i poker världen? Om så är fallet, se till att få pokernews uppdateringarna på dina sociala medier. Följ oss på twitter och hitta oss på både facebook och google+!
Poker proffs och utvecklare nikolai östersjöns kust på tillämpningar av "game theory optimal" lösningar på poker.
Har du hört talas om "GTO" i poker, men hur gör spelteori optimala lösningar tillämpas på beslut i poker?
Kaos teori: kan det bli en strategi i blackjack & roulette?
Lagen om oberoende prövningar är grundläggande princip som gör att den casino spel industrin att samla massa mängder av rikedomar från intet ont anande kunder. Varje spel i casinot har uppfattningen av att vara helt slumpmässigt. Detta innebär att det är inget att förutse resultatet av en kommande händelse. Vad kasinon lita på är den övergripande fördelen att deras spel har som gynnar casino. Denna tillit förutsätter en statisk satsning av spelare såväl som alla de variabler som förblir konstant. Det är en gren av sannolikhet matematik som utmanar denna idé och det är kaosteorin matematik.
Det enklaste sättet att illustrera kaosteorin är genom en fraktal geometri bild. I sin enklaste form kaos teorin om att en till synes slumpmässig rad längs en geometrisk plan, när de betraktas i ett större sammanhang (eller zoomas ut och läser på en geometrisk plan), visar en urskiljbara mönster. Ett annat centralt begrepp är att små förändringar i ett slutet system leder till drastiska förändringar nedströms från denna händelse. Det klassiska exemplet är att en fjäril som flaxar med sina vingar i djungeln och orsakar en bilolycka i new york.
Den matematiska härledningen av dessa påståenden är ganska komplexa och väl bortom förståelsen av de flesta fritids-och pro-spelare. Denna artikel kommer att strikt fokusera på hur spelare kan dra nytta av även en grundläggande förståelse för hur det kan tillämpas.
BLACKJACK KAOSTEORIN
Varje spel har en uppsättning regler som dikterar den övergripande fördelen kasinot har. Blackjack regler kan variera om du kan dubbla efter en split av om givaren stannar eller träffar på en mjuk 17. För att bestämma vad huset kanten är miljarder dator simuleringar används för att hitta en konvergens av en förlust per dollar med hjälp av en optimal strategi och en platt insats för varje händelse. Blackjack används det första exemplet eftersom systemet är ett beroende man inte baseras på lagen i oberoende försök. Till exempel, när ett ess spelas så är det en mindre ess i leken tillgängliga för en blackjack. Men det är en bra leda till att utvärdera spel som är mer accepterat som följer av lagen oberoende prövningar.
Blackjack är ett dynamiskt spel och vilka kort som är spelade i innan med händerna direkt påverkar vad som händer, kommer att spelas i framtiden. Varje kort spelas antingen lägger till eller drar ifrån från första hus fördel. Ans när tillräckligt många av rätt kort delas ut fördelen gungor till spelarens fördel. Spelarna sedan upp sitt spel och kan vinna fördel över huset. Andra spel som erbjuds av kasinon är också mottagliga för denna typ av attack. Dynamiken är mycket mer subtil, men de finns där. Och som sagt tidigare ett kännetecknande drag för kaosteorin är att små förändringar orsaka drastiska down-stream resultat. Roulette är den vanligaste tillämpningen av denna.
Amerikansk roulette hjul har 38 platser, 1-36 samt en 0 och 00 spår. I en perfekt statistiska världen, bollen skulle landa i varje korg i genomsnitt 1 gång i 38. Detta skulle tyda på att de villkor som bollen var från början snurrade i att förbli densamma för varje spin. Detta är inte fallet. Hjulet oundvikligen upplevelser slitage. Luftfuktigheten i casino förändringar över tid. Temperaturen i hjulet kommer att förändras beroende på hur många personer som är i kasinot. Alla dessa skillnader kan tyckas oviktigt för fritids-spelare, men kaos teori lär oss små förändringar leder till drastiska förändringar i periodens resultat.
Nu är det klart vilka små förändringar som kan leda till en förskjutning blir frågan vad som är slutresultatet och hur kan vi fastställa slutresultatet och den viktigaste frågan-hur kan en kunnig spelare dra nytta av informationen för ekonomisk vinning.
Den första frågan är vad är resultatet? Det tydliga resultatet är att vissa nummer kommer upp oftare än andra, vilket skapar en rad fördomar. Så hur kommer det sig att en spelare som kan avgöra vad fördomar är. Det finns tyvärr inga kort sätt att avgöra detta. Det enda sättet är att samla in data, närmare bestämt en hel del data. För roulette, inte mindre än 50 000 spins på en viss roulette hjulet bör utvärderas. En roulette hjul snurrar cirka 20 gånger per timme. Det är mycket tidskrävande att få de ursprungliga uppgifterna. Detta väcker frågan vad som är den bästa metoden för insamling av data?
Eftersom inte alla hjul ska ha en partisk är det bäst att registrera data för flera hjul på en gång. De uppgifter som bör sättas in i ett kalkylblad och utvärderas för att se vad som frekvensen av varje nummer. En gång i 36 frekvens ger ett positivt spel och alla frekvenser är större än 1 gång 36 är en positiv förväntan spel. Varje gång du kan hitta minst 2 bias hjul i 10 är en stor sök. Det finns både bra och dåliga aspekter av denna metod.
För det första, den dåliga, den uppenbara nedgångar sida är att det tar väldigt lång tid att samla in data, flera månader faktiskt. När uppgifterna samlas in att det tar flera månader att utnyttja systemet och inse positiv förväntan. Det är fullt rimligt att en negativ svacka kan upplevas under de första veckorna, vilket leder till ett känslomässigt kaos. En annan sak att tänka på är att ett casino kan byta ut hjulet när som helst gör alla dina data insamling värdelös.
Nu är det bra, det ekonomiska värdet av detta synsätt är fantastiskt om du hittar ett hjul med frekvenser som förekommer något oftare än 1 gång i 25. Betting siffror på insidan, samt varierar och rött och svart, kan användas i detta synsätt. När du vet vad resultatet på lång sikt kommer att vara att du kan dra full nytta av denna information för en exceptionell vinst.
KAOSTEORIN I ONLINE-KASINON
I online-världen, data kan också samlas in för att avgöra om det finns någon bias i den slumpmässiga nummer generatorer. Det är nästan alltid en liten bias i alla RNG är dock bias kan endast fastställas efter att 100-tusentals evenemang. Chaos theory ansökan kan tillämpas på online baccarat genom detta tillvägagångssätt. Det kan dock inte användas på traditionella bord spel eftersom kasinon endast att använda baccarat kort en gång innan de används inte längre.
Kaos-teorin handlar om att ta tillvara liten undanskymd förändringar i ett system. Det är en omständlig process, men när de tillämpas korrekt är det en mycket lönsam strategi för kasino gaming.
Poker game theory
Spelteori, speciellt för skicklighet baserade kasino spel, är den avancerade studien av spel att spela strategier. Den centrala idén är att hitta bästa möjliga metoder för att besegra motståndare. Inte bara någon motståndare, men en motståndare som själva har studerat spelet teorier och strategier av sina egna. Tanken är att överlista en person som är kunnig, som spelare, av honom eller henne, själv.
Det primära fokus för mycket spel teorin är på poker, vare sig det är online eller verkliga världen. Anledningen till detta är att poker är den i särklass mest skicklighet baserade kasino spel, är att dess fokus är främst på att spela mot andra, verkliga motståndare. Multiplayer online poker är ett utmärkt exempel, med tanke på att din motståndare är gjorda av andra spelare som kan vara bekant med poker strategier. Låt oss ta en titt på 5 viktiga punkter av intresse i spelet teori kontra real world poker motståndare.
1.Det är ingen perfekt strategi
En av de mest viktiga saker att hålla i åtanke är att det finns inget sådant som en perfekt strategi. Alla casino spel, inklusive poker, spel är spel som är baserat på slumpen, och denna okända faktor innebär att alla strategier är av varierande natur. Alla strategier som siktar på att hantera den okända faktor som bäst som möjligt, men det är inte ett svar som passar alla situationer på ett perfekt sätt.
Så vad betyder detta? Det innebär att oavsett hur kunnig alla spelare är med spel teorier och strategier, de kommer alltid att finna sig i situationer där det inte finns någon bestämd rörelse som kommer att garantera positiva resultat. Med andra ord; det är omöjligt att bli en perfekt spelare för ett spel som poker. Man kan bara hoppas på att bli så bra som är möjligt, med den kunskap som finns, och så mycket praxis som kan hanteras.
2.Den dubbla angreppssätt
Game theory, som redan nämnts, fokuserar på att spela en variabel spel mot en motståndare, som antas vara lika duktiga. Detta är ibland kallas den dubbla angreppssätt, med tanke på att han är förtjust i att säga att ett geni kontra hans exakta twin skulle vara de mest intressanta poker spelet i historien. Men hur gör man för att besegra en lika skicklig motståndare i ett spel som poker?
Spelet teori i detta scenario är mycket som ett spel i schack, men med en styrelse som ordnas själv i slutet av varje tur. Det vill säga; det kräver en hel del förutsägelse, anpassningsförmåga, och en grundlig förståelse av statistiska chansen. Det enda verkliga sättet att besegra en tvilling skulle vara att agera i noggrant oförutsägbara och oväntade sätt, samtidigt som målet för seger tydligt i åtanke.
3.Nollsummespel
Poker är som det hänvisas till som ett nollsummespel. Detta innebär att vid slutet av varje runda poker, kommer alla spel som släppts ut kommer att hamna i en lycklig person som har den i sin besittning. Beloppet av de vinster som kommer att ha förlorat genom att motståndarlagets spelare. Målet med spelet är att samla in tillräckligt mycket av flexibel resurs som de andra spelarna sitter med noll.
Spelteori behandlar begreppet, i en del, som en flexibel resurs, spelmarker, kan drastiskt gunga spelare strategi spelet. En spelare med mer marker kommer att bete sig annorlunda för en som har mycket få kvar. Detta är en aspekt som ofta förbises av många strategier, och något som kan kasta av ens professionella, erfarna spelare.
4.Perfekt information om spelet
Poker är ett som avses som en perfekt information om spelet. Detta innebär att varje spelare i spelet har exakt samma information som alla andra spelare, utöver de värden av sina egna kort. Det finns ingen flytta en spelare kan göra som är osynliga, eller okända för alla andra spelare.
Detta innebär att resultatet av poker är i hög grad bestäms av hur varje aktör tolkar varje steg. Med andra ord, det finns få spel som är så rättvis, och som bygger på individuell skicklighet, som poker.
5.Optimala strategier
Det sägs att om två spelare gå head to head i ett spel av poker, och en spelare använder en optimal strategi, men att han eller hon kan berätta även det motsatta spelare vad de gör i varje steg, och fortfarande kommer att sluta som segrare. Denna enkla idé förklarar kärnan i spelet teori. Det vill säga; en optimal strategi är effektiv, oberoende av hur mycket information de motståndare har.
Som redan sagts, i en sådan strategi är praktiskt taget omöjligt, men är det yttersta målet, i princip av spelet teoretiker. Det bästa en spelare kan göra tills en mytisk optimala strategin uppnås är att använda ett antal flexibla strategier på bästa möjliga sätt. Och, viktigast av allt, håller inte med samma strategi, som kommer att undvika att det blir förutsägbart.
En värld av information och spelteori
Information teorin skapade ramen kring vilken både den moderna digitala världen, och att räkna kort i kasinon, är baserad.
Att vrida beslutsfattande till en vetenskap snarare än en konstform var en process som utvecklats från omkring 1940-talet och framåt i svar på ett problem som alla företag telefon hade med kommunikation över långa avstånd. Bygga en lång telefon tråd och kvaliteten försämras över avstånd, hålla en amp halva vägen och signalen kommer fortfarande att vara stark, men du kommer att vara att förstärka distorsion för.
Shannon och hans kohorter utvecklat ett system där all information förvandlades till en positiv eller negativ stat som kunde användas för att överföra den symbolik i all kommunikation. Det spelade ingen roll om det var ord, tal, musik, bilder, vad som helst, det kunde vara kodade i en serie av bitar. Dessa bitar (enstaka bitar av ja/nej information) blev den gemensamma nämnaren för information.
Bitar revolutionerat kommunikation... och sedan världen. Mikroprocessorn som du använder för att läsa detta, internet du fick det från, drive kan du lagra den på och faktiskt något komprimering du bryr dig att använda för att göra den mindre, att de alla arbetar fortfarande med binär information, de arbetar fortfarande bitar. På den tiden var detta ett paradigmskifte i att tänka sig att vissa har jämfört med det arbete som einstein.
Rationell och spelar genom spelet teori
• moderna världen bygger på uppgifter teori
• bitar ansluta bitar
Shannons utövande av digital logik i slutet av 1940-talet är direkt ansvariga för det mesta av den moderna teknik som vi nu tar helt för givet. Det är även ansvarigt för det sätt på vilket väldigt många människor tillbringar sin tid att vinna på blackjack. Att räkna kort är bara information teorin användas på ett mycket specifikt sätt.
Spelteori
John larry kelly jnr arbetat för claude shannon på bell telephone lab och kände "informations-teori kan ses som ett sätt att kvantifiera information så att de kan göra det bästa beslutet i ansiktet av ofullständig information" och en av de situationer där det finns bristande information var vid blackjack-bordet.
Historien om blackjack är full av människor med "ett system" men kanske för första gången en matematisk grund tillämpades inte att vinna en enda insats eller hand, men att vinna på lång sikt växande bankrulle för spelaren. Detta fraktionerad betting av sociala avgifter baserade på maximering av den möjlighet som mot risken är fortfarande grunden för korträkning strategier.
Den matematiska formler information teori är nu som tillämpas för den relativt enkla att bygga om ett kortspel, och strävan efter bästa möjliga svar på varje omständighet. Detta är oberoende av beslut som fattas av oppositionen, återförsäljare, eftersom det inte finns någon kontroll över denna sida av situationen.
Kelly-kriteriet är en etablerad och beprövad teori inte bara spel per se, men av någon spekulationen. Tillämpning av dessa teorier och formler har varit så framgångsrik på wall street som de har i las vegas eller ens laboratoriet. Spelteori är bara en del av informationen teori som utforskar hur vi använder informationen för vår egen fördel.
Fångarnas dilemma
Tanken att det finns en logisk grund för beslut trots bristande information var bäst sammanfattas i prisoners dilemma, ett exempel på spelteori. Två fångar som hålls isär och utan kontakt med yttervärlden måste välja att antingen sviker sina kolleger fånge eller hålla tyst. Varje permutation av sina handlingar har en annan utgång.
Om de båda förråda varandra kommer de att få både få 2 år i chokey. Om antingen en förråder den andra de kommer vara gratis, men de andra kommer att tjäna 5 år in. Och om de båda vistelse schtum de får endast 1 år vardera i fängelse på en mindre kostnad. Så nu vad är den bästa åtgärden för var och en?
Bra om båda är rent rationell, logisk sak att göra är för båda att förråda varandra, eftersom det är marknadsföring av egenintresse. Svek av den andra är den bästa åtgärden oberoende av de andra fångarnas åtgärder. Antingen får du 2 år var för att förråda varandra, eller om den andra fången inte du kommer att gå fria. Detta är bättre än 5 år stretch du ska göra om du inte.
Det här exemplet på spelteori är ganska esoterisk som förnekar möjligheten av samarbete (något som människor tenderar mot det mesta) och visar också att du ska aldrig begå ett brott med en forskare eller matematiker eftersom de kommer att gräset på dig. I den verkliga världen spel teori av detta slag tillämpas på verksamhet i wall street lika mycket som det är att blackjack i asien. Rationella val som gjorts från kända data.
Kaos teori: kan det bli en strategi i blackjack & roulette?
Lagen om oberoende prövningar är grundläggande princip som gör att den casino spel industrin att samla massa mängder av rikedomar från intet ont anande kunder. Varje spel i casinot har uppfattningen av att vara helt slumpmässigt. Detta innebär att det är inget att förutse resultatet av en kommande händelse. Vad kasinon lita på är den övergripande fördelen att deras spel har som gynnar casino. Denna tillit förutsätter en statisk satsning av spelare såväl som alla de variabler som förblir konstant. Det är en gren av sannolikhet matematik som utmanar denna idé och det är kaosteorin matematik.
Det enklaste sättet att illustrera kaosteorin är genom en fraktal geometri bild. I sin enklaste form kaos teorin om att en till synes slumpmässig rad längs en geometrisk plan, när de betraktas i ett större sammanhang (eller zoomas ut och läser på en geometrisk plan), visar en urskiljbara mönster. Ett annat centralt begrepp är att små förändringar i ett slutet system leder till drastiska förändringar nedströms från denna händelse. Det klassiska exemplet är att en fjäril som flaxar med sina vingar i djungeln och orsakar en bilolycka i new york.
Den matematiska härledningen av dessa påståenden är ganska komplexa och väl bortom förståelsen av de flesta fritids-och pro-spelare. Denna artikel kommer att strikt fokusera på hur spelare kan dra nytta av även en grundläggande förståelse för hur det kan tillämpas.
BLACKJACK KAOSTEORIN
Varje spel har en uppsättning regler som dikterar den övergripande fördelen kasinot har. Blackjack regler kan variera om du kan dubbla efter en split av om givaren stannar eller träffar på en mjuk 17. För att bestämma vad huset kanten är miljarder dator simuleringar används för att hitta en konvergens av en förlust per dollar med hjälp av en optimal strategi och en platt insats för varje händelse. Blackjack används det första exemplet eftersom systemet är ett beroende man inte baseras på lagen i oberoende försök. Till exempel, när ett ess spelas så är det en mindre ess i leken tillgängliga för en blackjack. Men det är en bra leda till att utvärdera spel som är mer accepterat som följer av lagen oberoende prövningar.
Blackjack är ett dynamiskt spel och vilka kort som är spelade i innan med händerna direkt påverkar vad som händer, kommer att spelas i framtiden. Varje kort spelas antingen lägger till eller drar ifrån från första hus fördel. Ans när tillräckligt många av rätt kort delas ut fördelen gungor till spelarens fördel. Spelarna sedan upp sitt spel och kan vinna fördel över huset. Andra spel som erbjuds av kasinon är också mottagliga för denna typ av attack. Dynamiken är mycket mer subtil, men de finns där. Och som sagt tidigare ett kännetecknande drag för kaosteorin är att små förändringar orsaka drastiska down-stream resultat. Roulette är den vanligaste tillämpningen av denna.
Amerikansk roulette hjul har 38 platser, 1-36 samt en 0 och 00 spår. I en perfekt statistiska världen, bollen skulle landa i varje korg i genomsnitt 1 gång i 38. Detta skulle tyda på att de villkor som bollen var från början snurrade i att förbli densamma för varje spin. Detta är inte fallet. Hjulet oundvikligen upplevelser slitage. Luftfuktigheten i casino förändringar över tid. Temperaturen i hjulet kommer att förändras beroende på hur många personer som är i kasinot. Alla dessa skillnader kan tyckas oviktigt för fritids-spelare, men kaos teori lär oss små förändringar leder till drastiska förändringar i periodens resultat.
Nu är det klart vilka små förändringar som kan leda till en förskjutning blir frågan vad som är slutresultatet och hur kan vi fastställa slutresultatet och den viktigaste frågan-hur kan en kunnig spelare dra nytta av informationen för ekonomisk vinning.
Den första frågan är vad är resultatet? Det tydliga resultatet är att vissa nummer kommer upp oftare än andra, vilket skapar en rad fördomar. Så hur kommer det sig att en spelare som kan avgöra vad fördomar är. Det finns tyvärr inga kort sätt att avgöra detta. Det enda sättet är att samla in data, närmare bestämt en hel del data. För roulette, inte mindre än 50 000 spins på en viss roulette hjulet bör utvärderas. En roulette hjul snurrar cirka 20 gånger per timme. Det är mycket tidskrävande att få de ursprungliga uppgifterna. Detta väcker frågan vad som är den bästa metoden för insamling av data?
Eftersom inte alla hjul ska ha en partisk är det bäst att registrera data för flera hjul på en gång. De uppgifter som bör sättas in i ett kalkylblad och utvärderas för att se vad som frekvensen av varje nummer. En gång i 36 frekvens ger ett positivt spel och alla frekvenser är större än 1 gång 36 är en positiv förväntan spel. Varje gång du kan hitta minst 2 bias hjul i 10 är en stor sök. Det finns både bra och dåliga aspekter av denna metod.
För det första, den dåliga, den uppenbara nedgångar sida är att det tar väldigt lång tid att samla in data, flera månader faktiskt. När uppgifterna samlas in att det tar flera månader att utnyttja systemet och inse positiv förväntan. Det är fullt rimligt att en negativ svacka kan upplevas under de första veckorna, vilket leder till ett känslomässigt kaos. En annan sak att tänka på är att ett casino kan byta ut hjulet när som helst gör alla dina data insamling värdelös.
Nu är det bra, det ekonomiska värdet av detta synsätt är fantastiskt om du hittar ett hjul med frekvenser som förekommer något oftare än 1 gång i 25. Betting siffror på insidan, samt varierar och rött och svart, kan användas i detta synsätt. När du vet vad resultatet på lång sikt kommer att vara att du kan dra full nytta av denna information för en exceptionell vinst.
KAOSTEORIN I ONLINE-KASINON
I online-världen, data kan också samlas in för att avgöra om det finns någon bias i den slumpmässiga nummer generatorer. Det är nästan alltid en liten bias i alla RNG är dock bias kan endast fastställas efter att 100-tusentals evenemang. Chaos theory ansökan kan tillämpas på online baccarat genom detta tillvägagångssätt. Det kan dock inte användas på traditionella bord spel eftersom kasinon endast att använda baccarat kort en gång innan de används inte längre.
Kaos-teorin handlar om att ta tillvara liten undanskymd förändringar i ett system. Det är en omständlig process, men när de tillämpas korrekt är det en mycket lönsam strategi för kasino gaming.
Spelteori i 10 enkla steg
1. SOM DU KANSKE HAR GISSAT, "GAME THEORY" ÄR DEN MATEMATISKA STUDIER AV SPEL
Men inte bara en typ av spel. Spelteori gäller endast spel av strategi mellan två eller flera konkurrerande aktörer. Oftast finns det en tydlig uppsättning regler som definierar möjliga drag att varje spelare kan göra i varje ögonblick i spelet och en följd betyg för varje spelare i slutet av varje spel av spelet.
2. FÖRVÄXLA INTE "GAME THEORY" MED "SPEL TEORI"
Även om de två inte överlappar varandra. Spel teori gäller spel med osäker utgång, med en eller flera spelare, med eller utan skicklighet inblandade. Man kan säga att spelteori handlar om spel av skicklighet och spel teori om spel av en slump (även om en single-player spel som kräver en viss skicklighet skulle inte vara ett ämne av spelteori). Video poker, vilket innebär att bara en enda spelare som försöker att göra vinnande kombinationer, har ett element av skicklighet, men fortfarande skulle det inte vara ett ämne för spelteori. Men live poker, som spelas mellan två eller flera personer, som är ett passande ämne för spelteori. I själva verket, poker-spel, speciellt i en förenklad version, har använts som paradigm i spelteori eftersom john von neumann grundades modern spelteori tillbaka på 1920-talet.
På samma sätt, spelteori gäller inte för spelet av blackjack, även om en skicklig korträknare av en kant över casinot. Men, om du anser att den katt-och-råttalek som korträknare har att utmärka sig på att att tillåtas att fortsätta spela och slog casino spel teori har en hel del att säga om det.
3. SPELTEORI DELAR UPP SPEL I TVÅ TYPER LÄNGS FLERA OLIKA KRITERIER
Det är kooperativa kontra icke-kooperativa spel, noll-summan (eller mer exakt, konstant summa) jämfört med icke-nollsummespel, samtidig jämfört med sekventiell spel, spel med perfekt information kontra spel med ofullständig information, och två spelare-spel kontra spel med tre eller fler spelare. Det finns också symmetrisk och asymmetrisk spel, oändlig spel, kombinatoriska spel, upprepade spel, diskreta eller kontinuerliga spel, befolkning spel, stokastiska spel, meta-spel, och så vidare.
Det är bra att veta att dessa villkor existerar, men jag kommer inte att kunna täcka alla dem här.
4. DEN EKONOMISKA FÖRUTSÄGA BETEENDE MODELL
Spelteorin utvecklades ursprungligen som en matematisk modell för att studera och förutsäga ekonomiska beteende. Men det breda utbudet av spel som spelet teori överväger gör det värdefullt som en modell eller ett verktyg för många områden, inklusive evolutionär biologi, filosofi, statsvetenskap, datavetenskap, krig, och, naturligtvis, multi-person spel om pengar som poker. Kom ihåg den klassiska 1983 filmen war-spel? (om du inte har sett det, det är ditt första hemuppgift.) det är spel teori som har tillämpats för att thermonuclear war.
"perfekt information" i spelet teori betyder inte att du vet framtiden. Det betyder bara att varje spelare har perfekt information om det förflutna
5. JAG VILL SPELA EN (ZERO SUM) SPEL
Ett spel är ett nollsummespel om den totala betyg i slutet av varje spel är noll. Med andra ord, hur mycket en person vinner kommer att förloras genom att den andra spelaren(er) i spelet. Spel om pengar som poker är oftast nollsummespel (inte inklusive huset raken, men inte heller inklusive underhållningsvärdet, vilket är anledningen till att vi spelar i första hand). Det finns vissa spel där spelare kan kombineras göra bättre eller sämre beroende på deras strategier. Spel som detta används ibland som modeller för hur samarbete kan utvecklas mellan annars konkurrerande aktörer.
6. KAN DU FÖRUTSPÅ FRAMTIDEN? DET ÄR PERFEKT
"perfekt information" i spelet teori betyder inte att du vet framtiden. Det betyder bara att varje spelare har perfekt information om de senaste (och närvarande, om det finns samtidigt flyttar av olika aktörer). Det finns ingen dold information som en spelare vet att en annan inte, av en spelare som är dolda kort i poker spelet. Och det finns inga dolda rör sig, som utgångspunkt i ett game av slagskepp.
Spel som schack, dam, och gå är spel som är perfekt information, och det finns en separat gren av matematiken som kallas kombinatorisk spelteori som fokuserar på dem. "vanliga" spel teori fokuserar mer på spel med ofullständig information. Det kan fortfarande vara slumpmässighet och osäkerhet i ett spel med perfekt information. Backgammon är ett bra exempel, och monopol också. (på tal om monopol och war games, i andra världskriget, allierade faktiskt smugglas kartor, kompasser och andra verktyg för att krigsfångar, inne monopol styrelser!)
7. DET HANDLAR OM INELEGANCE
Den huvudsakliga inriktningen av spelteori är på fullt rationell, intelligent spelare.
Spelteori är intresserad av att besvara frågan, "vad är det bästa sättet att spela mot motståndare som tänker som jag gör?" fokusera inte på hur att spela mot en viss motståndare med en viss strategi (även om det kan vara ett steg i en algoritm för att hitta en optimal strategi). Det är som ett geni att spela mot en tvilling.
"vad är det bästa sättet att spela mot motståndare som tänker som jag gör?" fokusera inte på hur att spela mot en viss motståndare med en viss strategi.
8. REN STRATEGI VS BLANDAD STRATEGI
I varje två-spelare nollsummespel, som heads-up poker, det är en strategi (eller en uppsättning av strategier) som inte kan bli slagna, även med de bästa motståndare. Det är det som brukar kallas den optimala strategin. Om du följer den optimala strategin, du kan även berätta för din motståndare hur du spelar (men inte "ge bort" berättar!) och du kan inte bli slagna på lång sikt. Optimala strategier innebär ofta att plocka slumpmässigt (men med exakta sannolikheter) mellan två eller flera olika spela val för vissa eller alla drag av spelet, eftersom en motståndare kan ibland dra nytta av en strategi som är alltför förutsägbara. (detta kallas för en "blandad strategi i spelet teori, i motsats till en "ren strategi" som alltid gör samma val av röra sig i identiska situationer.)
till exempel, i spelet sten-sax-påse (som också kallas roshambo), den optimala strategin är att göra varje spela en tredjedel av tiden. Om du spelade rock med något mer ofta än att dina motståndare kan ha en fördel genom att spela papper oftare än en tredjedel och/eller spela sax mindre ofta. Observera att den optimala strategin i roshambo kommer inte att ge dig en fördel, men det kommer att hindra din motståndare från att få en fördel. Lyckligtvis är det inte sant i poker. Den optimala strategin, om du kan räkna ut och följa det fullt ut, kommer att ge dig en fördel mot nästan vem som helst annars.
Du kanske har hört att poker forskare "löst" en verklig poker spel förra året (heads-up-limit texas hold ' em). De hade inte bokstavligen lösa spelet, men de ville komma nära nog, med hjälp av tusentals dagar dator tid, att de kände att de kunde säga att de "i huvudsak" och löste det. Du kan spela perfekt mot det för hela livet och har fortfarande en bra chans att förlora.
Citat: om du följer den optimala strategin, du kan även berätta för din motståndare hur du spelar (men inte "ge bort" berättar!) och du kan inte bli slagna på lång sikt
9. JÄMVIKT STRATEGIER
Lägg bara en spelare, så det är 3 spelare i ett spel (eller spelet är inte noll-summa) och det är inte garanterat att vara en "bästa" eller "optimalt" sätt att spela. Men, det kan vara "jämvikt strategier", som kallas nash-jämvikter, uppkallad efter john nash, den berömda matematiker som vann nobelpriset i ekonomi 1994 för hans banbrytande arbete. Nash var föremål för flera academy award-vinnande filmen A beautiful mind, baserad på boken med samma namn. Tråkigt nog förra året att han och hans fru omkom i en bilolycka i new jersey, som drivs hem från flygplatsen efter en pris-vinnande resa till norge.
10. GÅ UT OCH SPELA
I en nash-jämvikt, ingen spelare kan göra bättre genom att ensidigt ändra hans eller hennes strategi. Men, två eller fler spelare skulle kunna ändra sin strategi tillsammans och se en förbättring. Genom att tillämpa detta till ett poker spel: när det finns fler än 2 spelare i spelet, det är ingen strategi som alltid kommer att vinna (även om dina motståndare är inte målmedvetet med att sammarbeta mot dig). Det innebär att du måste anpassa din strategi till dina motståndare och hur de spelar på den tiden. För att komplicera saken, de kommer att vara ständigt försöker anpassa sig till dig och alla andra också. Och, ibland, även av en slump, de kanske spelar på ett sätt som du inte kan slå i det långa loppet. Så, hitta en poker spel som du är bekväm i och som de kan vinna på, eller söka en heads-up (två spelare) spel.
Slutligen, som leder oss fram till din sista uppdraget: att komma ut och spela. (tell 'em du bara göra dina läxor!)
Kvantitativa handel
Spelteori
Vi har fått spelet.
Spelteori ringar sant i allt vi gör. Vi är stora på tävling, strategi och hantering av risk – precis som bra spelare är. Ta reda på hur vi använder vår favorit spel för att finslipa våra kunskaper och använda dem till komplexa finansiella marknader.
Spelet poker är värdefulla på fler sätt än du kanske tror. Vi använder poker för att lära ut nya handlare om beslutsfattande under osäkerhet. Våra handlare går igenom liknande processer samtidigt utvärdera det förväntade värdet av en viss handel med och bestämma hur prisrisken.
Vi har funnit att den bästa strategin inte nödvändigtvis beror på vad som redan hänt i spelet, men hur tidigare åtgärder av dina motståndare kan ge en inblick i hur de tänker.
Vi utmanade jennifer shahade, två amerikanska kvinnor i schack mästare, att en simul schack spel. Se matchresultat
Magi kräver samma uppsättning färdigheter för våra näringsidkare använder sig av: beslut med bristfällig information, observation av dina motståndare, och strategizing att maximera din potential att vinna. Det är lite av en big deal här, och så är några av våra spelare.
Vi gillar brädspel som kräver strategiskt tänkande, mönster identifiering och snabb svarstid. Vi gillar utmaningen av backgammon, settlers of catan, SET, motstånd, hanabi, power grid, och dominion – bara för att nämna några.
Strategin är en stor del av vissa tv-spel. Vi gillar action spel som kräver reaktioner på små förändringar i en snabbt föränderlig miljö.
Det finns många lärdomar att föra över från team sport till SIG. Vi arbetar tillsammans, varje spela hans eller hennes del information att samla in, utvärdera alternativ, utförande och riskhantering.
Se hur vi team upp utanför arbetet för våra under vs 30 Över 30 fotboll
Ekonomiska och spelteori
vad är spelteori?
Topp |allmänt | forskning | klasser | länkar | david
Vad ekonomer kallar spelteori psykologer kallar teorin om sociala situationer, vilket är en korrekt beskrivning av vad spelteori handlar om. Även om spelet teori är relevant för parlor spel som poker eller bridge, mest forskning i spelet teori fokuserar på hur grupper av människor interagerar. Det finns två huvudsakliga grenar av spelteori: kooperativa och förteck ningen över icke samarbetsvilliga spel teori. Förteck ningen över icke samarbetsvilliga spelteori handlar till stor del med hur intelligenta individer interagerar med varandra i ett försök att uppnå sina egna mål. Det är den gren av spelteori kommer jag att diskutera här.
Förutom att spelet teori, ekonomisk teori har tre huvudsakliga grenar: beslut teori, allmän jämvikt teori och teorin för allokeringsmekanismer. Alla är nära anslutna till spelteorin.
Beslut teori kan ses som en teori om en person och spel, eller ett spel med en enda spelare mot naturen. Fokus är på inställningar och bildandet av tro. Den vanligaste formen av beslut teori hävdar att preferenser bland riskabla alternativ kan beskrivas genom att den maximering av det förväntade värdet av numeriska verktyg funktion, där verktyget kan bero på flera saker, men i situationer som är av intresse för ekonomer ofta beror på pengar inkomst. Sannolikhetsteori är tungt används för att representera den osäkerhet i resultaten, och bayes lag används ofta för att modellera hur ny information används för att revidera uppfattningar. Beslut teorin används ofta i form av beslut analys, som visar hur man bäst för att få information innan du fattar ett beslut.
Allmän jämviktsteori kan ses som en specialiserad gren av spel teori som handlar om handel och produktion, och vanligtvis med ett relativt stort antal enskilda konsumenter och producenter. Det är allmänt används i makroekonomiska analyser av den allmänna ekonomiska politik som penning-och skattepolitik, i finansiering för att analysera aktiemarknaden, för att studera räntor och valutakurser och andra priser. Under de senaste åren, politisk ekonomi har uppstått som en kombination av allmän jämvikt teori och spelteori som den privata sektorn i ekonomin är modellerad av allmän jämviktsteori, medan rösta beteende och incitament för regeringar analyseras med hjälp av spelteori. Frågor som studeras inkluderar skatt, och handelspolitik, och betydelsen av internationella handelsavtal, såsom europeiska unionen.
Teorin för allokeringsmekanismer skiljer sig från spel teori i det spelet teori tar de regler som ges, medan teorin för allokeringsmekanismer frågar om konsekvenserna av olika typer av regler. Naturligtvis är detta i hög grad beroende av spelteori. Frågor som tas upp i teorin för allokeringsmekanismer även utformningen av ersättningen och löneavtal som på ett effektivt sätt sprida risker samtidigt som incitament för, och utformningen av auktioner för att maximera sina intäkter, eller för att uppnå andra mål.
Ett lärorikt exempel
Ett sätt att beskriva ett spel är genom att lista de spelare (eller personer) som deltar i spelet, och för varje spelare, som innehåller alternativ för val (kallas åtgärder eller strategier) tillgängliga för spelare. I händelse av ett spel för två spelare och åtgärder av den första spelaren form rader, och åtgärder av andra spelare kolumner av en matris. Posterna i matrisen finns två siffror som representerar verktyget eller utdelning till den första och den andra spelaren resp. En mycket berömda spelet är fångarnas dilemma spelet. I det här spelet två spelare som är partners i en brottslighet som har blivit tagna av polisen. Varje misstänker är placerade i en separat cell, och erbjuds tillfälle att erkänna brottet. Spelet kan representeras av följande matris av utdelningen
Inte bekänna | erkänna | |
inte bekänna | 5,5 | -4,10 |
erkänna | 10,-4 | 1,1 |
Observera att högre siffror är bättre (mer nytta). Om ingen misstänkt erkänner, de gå fria, och dela intäkterna för deras brott som vi representerar med 5 enheter verktyget för varje misstänkt. Dock, om en fånge bekänner och den andra inte, den fånge, som bekänner, vittnar mot andra, i utbyte för att gå fri och får hela 10 enheter av verktyget, medan den intagne som inte bekänner går till fängelse och som resulterar i låga nyttan av -4. Om både fångar bekänna, då båda får en nedsatt sikt, men båda är dömda, som vi representerar genom att ge varje 1 enhet av nytta: bättre än att ha den andra fången erkänner, men inte så bra som att gå gratis.
Detta spel har fascinerat spel teoretiker för en mängd olika skäl. För det första är det en enkel representation av en mängd olika viktiga situationer. Till exempel, i stället för att erkänna eller inte erkänna att vi kunde märka strategier bidra till det gemensamma goda" eller "beter sig själviskt." detta fångar en mängd olika situationer som ekonomer beskriver som kollektiva nyttigheter problem. Ett exempel är byggandet av en bro. Det är bäst för alla om bron är byggd, men bäst för varje enskild om någon annan bygger bron. Detta är ibland som avses i ekonomi som en externalitet. På samma sätt det här spelet skulle kunna beskriva de alternativ av två företag konkurrerar på samma marknad, och i stället för att erkänna eller inte erkänna att vi kunde märka strategier "ställa in ett högt pris" och "ställa in ett lågt pris." naturligtvis är det bäst för både företag om de både ställer höga priser, men bäst för varje enskild firma för att ange ett lågt pris samtidigt som oppositionen sätter ett högt pris.
Ett andra inslag i detta spel är att det är självklart hur en intelligent individ ska bete sig. Oavsett vad en misstänkt tror att hans partner kommer att göra, är det alltid bäst att erkänna. Om partnern i den andra cellen är inte att bekänna, det är möjligt att få 10 istället för 5. Om partnern i den andra cellen är att bekänna, det är möjligt att få 1 istället för -4. Men strävan efter individuellt förnuftigt beteende leder till att varje spelare får bara 1 enhet av verktyget, mycket mindre än 5 enheter var att de skulle få om varken erkände. Denna konflikt mellan strävan efter individuella mål och det gemensamma bästa är i centrum för många av spelteoretiska problem.
En tredje funktion i detta spel är att det förändras på ett mycket betydande sätt om spelet upprepas, eller om spelarna kommer att interagera med varandra igen i framtiden. Antag till exempel att efter det här spelet är över, och att de misstänkta har antingen friges eller släpps från fängelset och att de kommer att begå ett annat brott och spelet kommer att spelas igen. I det här fallet i första perioden den misstänkte får anledning att de inte bekänna det, för om de inte deras partner inte kommer att bekänna i det andra spelet. Strängt taget, att denna slutsats är inte giltigt, eftersom det i den andra matchen båda misstänkta kommer att bekänna oavsett vad som hände i första spelet. Dock upprepning öppnar upp möjlighet att belönas eller straffas i framtiden för nuvarande beteende, och spelet teoretiker har lämnat ett antal teorier för att förklara de uppenbara intuition som om spelet upprepas tillräckligt ofta, misstänkta borde samarbeta.
Om vi alla bättre människor skulle världen vara En bättre plats
En del av kraften och betydelsen av spelteorin kan illustreras genom att bedöma uttalande "om vi alla var bättre människor skulle världen vara en bättre plats." det kan tyckas att du själv uppenbarligen sant. Eller du kanske känner igen det som en fråga om logik innebär detta felslut sammansättning: bara för att ett uttalande gäller att varje enskild person som det inte behöver gälla för koncernen. Spelteori kan ge exakta innebörden att ett uttalande av både vad det innebär att vara bättre människor och vad det innebär för världen vara en bättre plats, och gör det möjligt att bevisa eller motbevisa påståendet. Faktum är att påståendet är falskt, och detta kan visas genom en variant av fångarnas dilemma.
Låt oss börja med en variant av fångarnas dilemma spelet, vi kan kalla det stolthet spel.
| Stolt | inte bekänna | erkänna |
stolt | 4.0, 4.0 | 5.4, 3.6 | 1.2, 0.0 |
inte bekänna | 3.6, 5.4 | 5.0, 5.0 | -4.0, 10.0 |
erkänna | 0.0, 1.2 | 10.0, -4.0 | 1.0, 1.0 |
Stolthet spel som fångarnas dilemma spel med tillägg av nya strategi att vara stolt över. En stolt person är en som inte kommer att erkänna utom i repressalier mot en råtta-som motståndare som bekänner. Med andra ord, om jag stå stolt och du erkänner, jag får 1.2, eftersom vi har både erkände och jag kan stå stolt innan din förnedring, men du får 0, eftersom du står förnedrad innan min stolthet. Å andra sidan, om vi är både stolta, då ingen av oss kommer att erkänna det, men vår stolthet kommer till en kostnad, som vi båda försöker förödmjuka andra, så vi får vardera 4, snarare än högre värde av 5 skulle vi få om vi valde helt enkelt att inte erkänna. Det skulle vara värre, självklart för mig att förlora ansiktet innan din stolthet genom att välja att inte erkänna. I detta fall skulle jag få 3.6 istället för 4 och du, stolt i ansiktet av min förnedring skulle få 5.4.
Stolthet spelet är mycket annorlunda än fångarnas dilemma spelet. Antag att vi är både stolta. Inför din stolthet, om jag valde helt enkelt att inte erkänna att jag skulle förlora ansiktet, och mitt verktyg skulle minska från 4 till 3,6. Att erkänna det skulle vara ännu värre som du skulle hämnas genom att bekänna, och jag skulle bli förnedrad också, likvidation med 0. Med andra ord, om vi är både stolta, och vi tror att den andra är stolta över, då vi alla göra rätt val. Morever, så vi är båda rätt, något någon av oss lär sig kommer bara att bekräfta vår redan rätt tro. Denna typ av situation - där spelarna spelar det bästa de kan få deras tro, och de har lärt sig allt som finns att lära sig om sina motståndares spel kallas av spelet teoretiker en nash-jämvikt .
Observera att den ursprungliga jämvikten av fångarnas dilemma bekänna, bikta är inte en jämvikt av stolthet spel: om jag tror att du kommer att erkänna, jag föredrar att stå stolt och förödmjuka dig, snarare än att bara bekänna mig själv.
Antag nu att vi blir bättre människor." att ge exakta innebörden ta detta till att betyda att vi bryr oss mer om varandra, att vi är mer altruistiska, mer generösa. Specifikt, låt oss föreställa oss att eftersom jag är mer generös och bryr sig mer om dig, jag sätter värde både på verktyget som jag får i den "själviska" - spelet som beskrivs ovan och på verktyget som du tar emot. Inte helt altruistiska, jag lägger dubbelt så mycket i vikt på mitt eget verktyg som jag gör på ditt. Så, till exempel, om det i det ursprungliga spelet får jag 3 enheter av verktyg, och du får 6 enheter av verktyget och sedan i det nya spelet som jag är en altruist, jag får ett vägt genomsnitt av mina verktyg och ditt företag. Jag får 2/3 av 3 enheter av verktyg som tillhörde mig i den ursprungliga "själviska" - spelet, och 1/3 av 6 enheter verktyg som tillhörde dig i den "själviska" - spel. Övergripande jag får 4 enheter av nytta istället för 3. Eftersom jag har blivit en bättre och mer generös person, jag är glad att du får 6 enheter av verktyget, och så detta väcker min egen utility från den själviska nivå 3, för att den högre nivån av 4. Det nya spelet med altruistiska spelare beskrivs genom att ta ett vägt genomsnitt av varje spelares nytta med att hans motståndare, placera 2/3 vikt på sin egen nytta och 1/3 vikt på sin motståndare. Detta ger betalningsmatrisen av altruistiska stolthet spel
| Stolt | inte bekänna | erkänna |
stolt | 4.00, 4.00 | 4.8, 4.20* | 0.80, 0.40 |
inte bekänna | 4.20*, 4.80 | 5.00, 5.00 | 0.67, 5.33* |
erkänna | 0.40, 0.80 | 5.33*, 0.67 | 1.00*, 1.00* |
Vad händer? Om du är stolt, jag väljer att inte erkänna en sak: om jag skulle vara stolt att jag får en nytta som är 4, även om jag väljer att inte erkänna att jag får 4.2, och naturligtvis gör jag om jag erkänna att jag får bara 0.4. Letar du vid det ursprungliga spelet, skulle det vara bättre för samhället i stort om när du är stolt jag var att välja att inte erkänna. Detta undviker konfrontation av två stolta människor, även om naturligtvis, på min bekostnad. Men som en altruist, jag inser att kostnaden för mig är små (jag förlorar bara 0,4 enheter utility) medan den fördelen att du är bra (du får med 1,4 enheter av verktyg), så jag föredrar att "inte erkänna det." detta är visat i betalningsmatrisen genom att placera en asterisk bredvid payoff 4.2 i den stolta kolumn.
Vad ska jag göra om du väljer att inte erkänna? Om jag är stolt över, jag får 4.8, om jag väljer att inte erkänna att jag får 5, men om jag erkänner, jag får 5.33. Så jag ska erkänna. Återigen, detta är markerade med en asterisk. Slutligen, om du bekänna, då jag inte längre vill stå stolt, som erkänner att få 0.2 genom förödmjukande du kommer till en kostnad av 1 till dig. Om jag väljer att inte erkänna att jag får bara 0.67. Så det är bäst för mig att bekänna samt.
Vad kan vi konstatera? Det är inte längre en jämvikt för oss båda att vara stolt över. Var och en av oss inför den andra stolthet vill byta till inte bekänna. Det är naturligtvis inte heller en jämvikt för oss båda att välja att inte erkänna en sak: var och en av oss skulle vilja byta till att bekänna. Det enda jämvikt är rutan markeras med två asterisker där vi är båda spelar den bästa vi kan få den andra spelaren spelar: det är där vi båda väljer att erkänna det. Så långt från att göra oss bättre, när vi båda blivit mer altruist och mer vårdande om varandra, istället för att både få en relativt hög nytta som är 4, balansen är rubbad, och vi hamnar i en situation där vi både får ett verktyg för bara 1. Lägg märke till hur vi kan ge en exakt mening till "världen är en bättre plats." om vi båda får nytta av 1 snarare än båda får en nytta som är 4, världen är helt klart en sämre plats.
Nyckeln till spel och teori för att förstå bättre varför människor kan göra världen till en sämre plats är att förstå den känsliga balansen i jämvikt. Det är sant att om vi bara blivit mer omtänksam och ingenting annat som händer i världen kommer åtminstone inte sämre. Men: om vi blir mer och mer omtänksam vi vill förändra hur vi beter oss. Som detta exempel visar, att när vi båda försöker göra detta på samma gång, och slutresultatet kan få oss att alla får det sämre.
För att sätta detta i samband med dag-till-dag-liv: om vi alla var mer altruistiska vi skulle välja att förlåta och glömma och mer kriminellt beteende. Beteendet av brottslingar har en komplikation. Mer altruistiska brottslingar skulle välja att begå färre brott. Men eftersom brottet inte straffas så hårt, att de skulle vara benägen att begå fler brott. Om i balans fler brott begås, världen skulle säkert vara en sämre plats. Exemplet visar hur det kan fungera.
För dem av er som är intresserade av eller redan vet mer avancerad spelteori, stolthet spelet har endast en nash-jämvikt visat att det går att lösa genom upprepad strikt dominans. Den atruistic stolthet spel, dock har flera blandad strategi jämvikter. Du kan beräkna dem med fina öppen källkod-program gambit skriven av richard mckelvey, andrew mclennan och theodore turocy. En jämvikt innebär randomisering mellan stolthet och erkänna det, så är värre än stolt-stolt jämvikt av stolthet spel. Den andra är strikt blandas i att det slumpmässig mellan alla tre strategierna. Utdelningen till att jämvikt ger varje spelare 2.31 - så även om det är bättre än båda spelarna bekänna för vissa, det är fortfarande mindre bra än den unika balansen av stolthet spel.
Jag vill tacka jie zheng för hans hjälp. "Vi är alla bättre människor" exempel är inspirerad av och bygger på en akademisk uppsats av sung-ha hwang och samuel bowles som heter "är altruism dåligt för samarbete?" om du vet några grundläggande kalkyl papperet är mycket läsvärd, och jag kommer att ge en länk så snart som de lägga ut det på nätet. De ger en mycket mer övertygande och robust exempel på hur altruism gör ont samarbete, hårt knuten till experimentella bevis. Om du vill lära dig mer om spelet teori finns ett antal bra böcker om ämnet.
Så, låt oss se vad vi har: utforska området spelteori och se hur det kan utrusta dig för det dagliga beslutsfattandet. På casino spel teori