Češi pomohli vytvořit umělou inteligenci s intuicí. Už není jako běžný počítač a nabízí revoluci napříč obory

Umělá inteligence DeepStack blafuje a umí na člověka připravit léčku. Má něco, čemu lze říkat intuice, a díky ní dokázala porazit nejlepší světové hráče pokeru. Zpráva o tomto přelomu, který se dle některých odborníků neměl umělé inteligenci nikdy podařit, vzbudila po světě rozruch. Ještě více potěšující zprávou pro českou vědu je, že za programem stojí i tři čeští vědci.

Využití umělé inteligence se schopností blafovat je veliké. Podobný program, který porazil pokerové hráče, by mohl vyjednávat různé dohody, od ubytování v hotelu po miliardové kontrakty. Využití by našel i v medicíně a další dlouhé řadě jiných oborů.

| Předplatné HN+ je zcela bez reklam.

Mezi autory programu DeepStack jsou Martin Schmid a Matěj Moravčík z katedry aplikované matematiky Matematicko-fyzikální fakulty Univerzity Karlovy. Třetím členem českého týmu je Villiam Lisý z Centra umělé inteligence Fakulty elektrotechniky na ČVUT. "Na Albertské univerzitě v Kanadě program rok připravovalo 10 lidí," říká Viliam Lisý. "Tři z nich byli z českých univerzit. O podílu jejich práce svědčí i to, že kybernetikové z Matematicko-fyzikální fakulty jsou v citacích uvádění na prvních místech." Ve čtvrtek zamířil článek českých vědců i do jedné z nejprestižnějších světových publikací Science.

Hra s neúplnou informací

Poker představuje hru, která - na rozdíl od šachů - není jen o kombinačních schopnostech a paměti, ale do značné míry také o intuici, psychologii a štěstí. Nevypočitatelnost výsledků prohlubuje i významná role náhody zabudovaná v pravidlech.

Odborníci o pokeru mluví jako o hře s nekompletními informacemi, ve které hráči během hry nemají k dispozici stejné informace a stejný pohled na hru, protože část karet zůstane až do konce skrytá. To je důvod, proč se počítači podařilo nad lidským velmistrem (Garrim Kasparovem) zvítězit už roku 1997, zatímco poker představoval mnohem obtížnější výzvu, a někteří odborníci dokonce věřili, že vítězství stroje nad člověkem v této hře není možné.

"Algoritmus DeepStacku je přelomový, protože se nám podařilo přenést myšlenky, které byly klíčové ve hrách s úplnou informací, do světa her s neúplnou informací," uvádí Martin Schmid. "Dosud nebylo jasné, zda je podobný přístup vůbec možný."

DeepStack umožňuje vypočítat vhodnou strategii pro situaci v pokeru, až když nastane, tedy bez nutnosti uvažovat o celé hře předem naráz, což dosud byl převládající přístup.

Úspěch byl možný především tím, že v programu se uplatnily prvky umělé inteligence a schopnost učit se na základě využití principu neuronových sítí. Jde o síť vzájemně propojených prvků, která se učí tak, že (velmi zjednodušeně řečeno) kladná odezva na vykonanou akci posiluje použité struktury sítě. Podobně jako se děje při učení v lidském mozku.

V případě DeepStacku jde o takzvanou hlubokou neuronovou síť, která vyhodnocuje jednotlivé pokerové informace, jde tedy o jistou formu intuice, kterou algoritmus využívá pro správná rozhodnutí.

Uplatnění proti hackerům i cukrovce

Uplatnění těchto postupů se zdaleka netýká jen hazardních her; strategie se hodí například ve finančnictví, nejrůznějších druzích vyjednávání, v medicíně, ve válečnictví nebo při řešení bezpečnostních problémů.

"V reálných situacích se jednotlivé strany jen velmi zřídka rozhodují na základě úplných a totožných informací," vysvětluje Michael Bowling z Albertské univerzity, který tým vedl. "Proto je pokrok v řešení her s neúplnou informací zásadní pro praktické informace," dodává.

"Algoritmus je možné použít například při hledání strategie v takzvaných extenzivních hrách," upřesňuje Viliam Lisý. "Jde o hry v nichž se dvě strany snaží o protichůdné cíle. Příkladem v praxi je třeba střetnutí hackera s administrátorem počítačové sítě, kde neúplnost informace spočívá v tom, že ani jeden z nich nemá informace o tom, co ten druhý ví. Podobnou úlohu představují nejrůznější kontrolní mechanismy, například revizor versus černý pasažér. V medicíně zase třeba dávkování inzulínu, kdy na jedné straně je dávka účinné látky v injekci, na druhé straně složité procesy v těle."

Využití v politice, mezinárodních konfliktech nebo ve vojenství by bylo podle Viliama Lisého složitější: "V pokeru jsou jednoduchá pravidla, zatímco v těchto případech do hry vstupuje mnohem více faktorů. Sestavení modelu by tedy bylo mnohem obtížnější a výsledky méně jisté."

"Podobně jako v případě člověka musí i DeepStack svoji intuici trénovat hraním mnoha pokerových partií," říká Matěj Moravčík. "Naše síť v průběhu učení viděla miliony pokerových situací," upřesňuje.

Při tréninku vědci používali superpočítač, který hrál sám proti sobě. Tak se hluboká neuronová síť učila. "V samotném turnaji ale program běžel na běžné grafické kartě se stejným výkonem, jaký má doma každý milovník počítačových her," říká Lisý.

Stroje proti karbaníkům

DeepStack dosáhl svého historického vítězství při pokerovém turnaji v prosinci 2016 proti výběru třiatřiceti profesionálů ze 17 zemí, které do boje s ním vyslala Mezinárodní federace pokeru. Hrálo se v dvouhráčovém no-limit Texas Hold’em pokeru. Každý z nich měl možnost s počítačem během čtyř týdnů sehrát 3000 her. Všechny dohrálo jen 11 hráčů - a každého z nich program porazil i individuálně. Pouze v jednom případě výhra nebyla statisticky průkazná.

První týmy vyvíjející neživé hráče pokeru vznikly na špičkových univerzitách teprve před několika lety, protože úkol se dlouho zdál být příliš složitý. Vědci z University of Alberta, Carnegie Mellon University, University of Auckland a také z Neo Poker Laboratory to ale nedělali kvůli výhrám v turnajích (které se často pohybují v milionech dolarů - rekordní výhra Jerryho Yanga z roku 2007 dosáhla úctyhodných 59 784 954 dolarů), ale jako výzvu pro vývoj umělé inteligence.

První turnaj kybernetických hráčů pokeru se uskutečnil roku 2005 pod názvem World Series of Poker Robots - kde jinde než v Las Vegas. Tehdy šlo ještě spíš o předvedení programů, které nehrály proti lidem - ale o 10 let později už si robotičtí gambleři troufli i na živé hráče. Na turnaji The 2015 Brain vs AI sice ještě nevyhráli, ale program Claudico z Carnegie Mellon si nevedl špatně. Jeho autoři loni vyvinuli i program Libratus, který si vedl úspěšně proti trojici profesionálních hráčů na dalším ročníku stejné soutěže.

Čeští vývojáři z STRV spustí miliardový fond. Začnou investovat do amerických start-upů - čtěte ZDE

McDonald's dohání konkurenci. Na klíčových trzích zavede rozvoz hamburgerů a placení mobilem - čtěte ZDE

Inflace v eurozóně je nejvyšší za čtyři roky. Rostly ceny energií, potravin i alkoholu - čtěte ZDE

Přidejte si Hospodářské noviny mezi své oblíbené tituly na Google zprávách.

Tento článek máteje zdarma. Když si předplatíte HN, budete moci číst všechny naše články nejen na vašem aktuálním připojení. Vaše předplatné brzy skončí. Předplaťte si HN a můžete i nadále číst všechny naše články. Nyní první 2 měsíce jen za 40 Kč.

Veškerý obsah HN.cz
Možnost kdykoliv zrušit
Odemykejte obsah pro přátele
Ukládejte si články na později
Všechny články v audioverzi + playlist

za 40 Kč nebo za 80 Kč
Navíc mobilní aplikace
a web bez reklam

Češi pomohli vytvořit umělou inteligenci s intuicí. Už není jako běžný počítač a nabízí revoluci napříč obory

Tento článek máteje zdarma. Když si předplatíte HN, budete moci číst všechny naše články nejen na vašem aktuálním připojení. Vaše předplatné brzy skončí. Předplaťte si HN a můžete i nadále číst všechny naše články. Nyní první 2 měsíce jen za 40 Kč.

Nová klimatická hrozba pod ledem: tání ledovců probouzí vulkány. Proč je to nebezpečné?

Kůrovec není takový vyvrhel. Nachystali jsme mu hostinu a zatopili k ní. S předním expertem o lese v Česku a USA, Ondřeji Sekorovi i Donaldu Trumpovi

Záchrana před nebezpečnými planetkami? Jedno blízké setkání u Země by nás mohlo mnohé naučit

Mastička místo antibiotik. Olomoučtí vědci vymýšlejí, jak snížit počet úmrtí na běžné nemoci

Ústup ministerstva financí. Po tlaku ostatních resortů změnilo český postoj k rozpočtu EU. Jde o stovky miliard

Nová klimatická hrozba pod ledem: tání ledovců probouzí vulkány. Proč je to nebezpečné?

Kůrovec není takový vyvrhel. Nachystali jsme mu hostinu a zatopili k ní. S předním expertem o lese v Česku a USA, Ondřeji Sekorovi i Donaldu Trumpovi

Záchrana před nebezpečnými planetkami? Jedno blízké setkání u Země by nás mohlo mnohé naučit

Mastička místo antibiotik. Olomoučtí vědci vymýšlejí, jak snížit počet úmrtí na běžné nemoci

Ústup ministerstva financí. Po tlaku ostatních resortů změnilo český postoj k rozpočtu EU. Jde o stovky miliard

Vybíráme z HN

Horní Měcholupy mají projít zásadní proměnou. Výstavba na Veronském náměstí získala zelenou bez nutnosti dalšího posuzování

Kryptoměny odolávají výkyvům globalizace. Proč bitcoin dokáže držet svou hodnotu?

Síkelův risk s Net4Gas se možná začíná vyplácet. Tranzit plynu přes Česko nečekaně roste

Češi pomohli vytvořit umělou inteligenci s intuicí. Už není jako běžný počítač a nabízí revoluci napříč obory

Tento článek máteje zdarma. Když si předplatíte HN, budete moci číst všechny naše články nejen na vašem aktuálním připojení. Vaše předplatné brzy skončí. Předplaťte si HN a můžete i nadále číst všechny naše články. Nyní první 2 měsíce jen za 40 Kč.

Zaujal vás článek? Pošlete odkaz svým přátelům!

Vyberte způsob sdílení

Vybíráme z HN

Odebírejte oblíbené autory a témata.