Ihmishuiput vs. kovin pokeribotti
27.07.2007 | Aihe: Pokeriuutiset
Yksi viikon mielenkiintoisimmista uutisista on ollut Phil Laakin erikoinen ottelu, jossa hän kohtasi yhdessä parikseen valitsemansa Ali Eslamin kanssa Polariksen. Polaris ei ole nettipelaajan lempinimi tai edes ihminen, vaan kanadalaisen yliopiston kehittämä pokeria pelaava tietokoneohjelma, eli pokeribotti. Tämä tarina puuttui Nettipokeri.infon keskiviikon uutiskatsauksesta, koska mittelö oli tuolloin vielä kesken, mutta nyt pelit on pelattu.
Pelit ja tekoäly
Niin oudolta kuin se kuulostaakin, tiedemiehet ovat jo kauan yrittäneet opettaa tietokoneita pelaamaan suosittuja lauta- ja korttipelejä. Kyse ei (ainakaan täysin) ole siitä, että tiedenörtit eivät löytäisi muuten peliseuraa, vaan siitä, että pelit soveltuvat hyvin tekoälyn tutkimiseen. Peleillä on selkeät, tarkoin määritellyt säännöt ja tavoitteet, joten pelit on helppo “opettaa” koneille ja toisekseen projektissa onnistumista on helppo mitata: jos kone päihittää parhaat ihmispelaajat, on tavoite saavutettu.
Tietokoneet ovat nykyisin ihmistä parempia monissa perinteisissä peleissä. Backgammonissa koneet ovat päihittäneet parhaat ihmispelaajat jo kauan, shakissa IBM:n Deep Blue teki silppua Garru Kasparovista 10 vuotta sitten ja juuri äskettäin tutkijaryhmä ilmoitti kehitelleensä tammea pelaavan ohjelman, joka ei voi hävitä edes teoriassa.
Tällä viikolla tulilinjalla tekoälynikkareiden tulilinjalla oli pokeri. Albertan yliopistosta Kanadasta ponnistava ryhmä, joka on myös edellä mainitun tammea pelaavan ohjelman takana, on jo jonkin aikaa kehitellyt pokeriohjelmaa. Jotta ohjelmaa saataisiin kunnolla testattua, haastettiin sitä vastaan pelaamaan kaksi ammattilaista, Phil Laak ja Ali Eslami. Pokeribotti Polaris vs. Laak & Eslami miteltiin Vancouverissa, tekoälyn edistämiseen keskittyvän yhdistyksen tapahtumassa. Virtuaalikorttia ei läiskitty vain lämpimikseen, vaan pelissä oli myös 50.000$.
Testitilanne
Koneiden ja ihmisten välinen pokeriherruus ratkaistiin pelaamalla neljä sessiota duplikaatti heads up limit hold’emia. Mutkikas nimi kätkee taakseen järjestelyn, jonka tarkoitus oli poistaa tuurin osuus lopputuloksesta. Duplikaattimatsit toimivat seuraavalla logiikalla:
Kussakin neljästä sessiossa Laak ja Eslami pelasivat omat heads upinsa Polarista vastaan. Kortit olivat samat molemmissa heads upeissa, mutta ne kortit mitkä toisessa matsissa sai ihminen, sai toisessa tietokone ja päinvastoin. Jos siis Laak sai jossain jaossa vaikkapa JTs ja Polaris QT pöytäkorttien ollessa T43, sai samaan aikaan pelatussa Eslamin matsissa Polaris JTs, Eslami QT ja pöytäkortit olivat T43. Voittiko ihmiskunnan dynaaminen duo vai ilkeä Polaris selviää, kun näin pelatun session jälkeen ynnätään ihmisten tulos: jos Laakin ja Eslamin yhteenlaskettu tulos on plussalla, ovat ihmiset pelanneet paremmin kuin Polaris. Etukäteen oli lisäksi sovittu, että alle 25 pienen betsin erotukseen päättyviä sessioita pidettäisiin tasapeleinä.
Kamppailu lähti käyntiin varsin värittömästi, kun ensimmäinen sessio päättyi tasapeliin. Toisessa sessiossa asennettaan aggressiivisemmaksi muuttanut Polaris yllätti pahasti ihmisjoukkueen, jonka tulos oli -925$. Pisteet ensimmäisen päivän jälkeen ihmiset 0, tietokone 1. Toisen ja kolmannen session välissä saivat molemmat osapuolet rauhassa tutkia logia siihen saakka pelatuista käsistä. Ihmisjoukkueen tutkimustyö ja pikainen strategiasessio tuottivat tulosta, ja toisen päivän aluksi Laak ja Eslami peittosivat tietokoneen selvästi: tulos +820$. Voittajan ratkominen jäi siis viimeisen, neljännen session varaan. Ratkaiseva koitos sujui ammattilaisilta hienosti, molemmat pelaajat tekivät voittoa ja ottelu oli selvä: +570$. Ihmiskunta voitti 2-1.
Laak ja Eslami pelastivat ihmiskunnan pokerimaineen. Ottelun tuoksinassa molemmat pelaajat pitivät bottia vastaan pelaamisen pahimpana vaikeutena sitä, että toisin kuin ihmiset, se ei väsy, eikä sen ote lipsu koskaan. Polariksen kehittämistä johtava Jonathan Schaeffer puolestaan totesi olevansa tyytyväinen ohjelman kehittymiseen, ja että ihmiset suvereenisti heads up fixed limit pokerissa peittoava tietokoneohjelma on kehitettävissä 5 – 10 vuodessa.
Ovela kuin ihminen
Mielenkiintoista yllä kuvatussa testissä oli, että siinä pelattiin nimen omaan fixed limit heads upia. Yleensähän juuri tätä pidetään kaikista pokeripeleistä mekaanisimpana, suoraviivaisimpana, ja siis juuri sinä pelinä, jossa tietokoneen pitäisi pärjätä parhaiten. Tästä huolimatta asialleen omistautuneet yliopiston tekoälytutkijat eivät onnistuneet luomaan ohjelmaa, joka olisi peitonnut ihmispelaajat.
Syynä yksinkertaisimmankin pokeripelin ratkaisemisessa epäonnistumiseen on tietysti pokerin ainutlaatuinen luonne. Shakissa, tammessa ja backgammonissa molemmat pelaajat tietävät yhtä paljon pelin tilanteesta – kaikki tieto on molempien pelaajien nähtävissä. Kuten kaikki tietävät, pokeri on aivan eri tyylilajin peli. Siinä pelaajat tietävät jotain, mitä muut eivät tiedä: omat korttinsa. Yhdessä panostussääntöjen kanssa se luo pelin, jossa on tärkeämpää omata ihmisen ovelat aivot kuin tietokoneen hypernopea laskupää. Joku päivä jossain vielä kehitetään tietokoneohjelma, joka rökittää Laakin, Eslamin ja loput pelaajat mennen tullen, mutta se päivä on vielä kaukana edessä – varsinkin jos ohjelman pitäisi pärjätä muussakin kuin limit heads upissa.
Täydellisen selostuksen tapahtumasta kaikkine yksityiskohtineen voi lukea & katsoa Albertan yliopiston pokerisivuilta.
2 Kommenttia
-
Niitä pelaa siellä jo
Missähän vaiheessa näitä pokeribotteja alkaa pyörimään nettipokerisivuilla. Minua ei ainakaan kiinnosta pelata ylivoimaisia botteja vastaan 🙁