Šachové myšlení (1) - nejjednodušší program
V novém seriálu vítám všechny příznivce počítačového šachu.
Pokud chcete vědět, co je to alfabeta, historická heuristika nebo metoda nulového tahu,
čtěte dále.
8.3.2006 09:00 |
Jan Němec
| Články autora
| přečteno 37593×
Šachové myšlení počítače
Šachy jsou určitě nejznámější deskovou hrou dvou hráčů, mají poměrně
jednoduchá, přesně definovaná a již delší dobu neměnná pravidla, která je
možné bez větších problémů implementovat na počítači. Narozdíl od většiny
karetních her mají oba hráči v šachách úplnou informaci o aktuální
pozici (žádné zakryté karty soupeře) a do výsledku partie nevstupuje z vnějšku
náhoda (žádné rozdávání karet). Z těchto důvodů jsou šachy nejen hrou, ale i
oblíbeným mentálním cvičením jak mozků přírodních, tak i těch umělých.
Lidé se snažili vyrobit šachové programy odedávna, prvním známějším pokusem
byl malý technický zázrak - automat z konce 18. století s figurkou
Turka, která pohybovala kameny na šachovnici. Jednalo se pochopitelně o podvod,
v přístroji byl ukrytý šachista člověk. Serióznější pokusy, včetně například
přístroje pro hraní koncovky krále s věží proti králi nebo dokonce ručně
simulovaného algoritmu pro celou hru pocházejí až ze století dvacátého.
S rozvojem počítačů posloužily šachy jako jeden z testů jejich inteligence.
Díky vývoji šachových algoritmů a neustálému zlepšování hardware
začaly programy postupně porážet úplné začátečníky, kavárenské i klubové hráče,
oddílové přeborníky i mistry. Dál už to šlo pomalu a na úroveň nejlepších
světových velmistrů se špičkové programy dostávají teprve v současnosti.
I když známá porážka Kasparova Blue Deepem v zápase v roce 1997 byla jen první
vlaštovkou, která přiletěla trochu předčasně, je zřejmé, že za několik
desetiletí již člověk nebude hře počítačů rozumět.
Dnes to zní směšně, ale ještě zhruba před dvaceti lety si hodně lidí myslelo,
že počítače nikdy nebudou hrát šachy lépe než lidé, protože prý
- Tvůrčí myšlení není možné emulovat algoritmickým myšlením počítačů.
- Pro hraní šachů je třeba tvůrčí myšlení.
První tvrzení definitivně padne, až budou počítače psát hodnotné romány (nebo
zpočátku alespoň generovat telenovely). Nepravdivost druhého tvrzení si ukážeme
v našem seriálu. Jinými slovy nepopiratelná kvalita současných šachových
programů ukazuje především to, že šachy nejsou dobrým testem inteligence.
Celou řadu algoritmů, kterou zde uvedu, lze aplikovat i na jiné hry dvou osob.
Seriál tak lze tedy chápat i jako obecný návod pro naprogramování dámy,
piškvorek a podobně. Šachy však zůstanou hlavním cílem a některé postupy ani
zobecnit na ostatní hry nepůjdou.
Nejjednodušší program
Nejprve je třeba navrhnout základní datové struktury a rutiny jako je vyhledání
všech legálních tahů z pozice, provedení a vrácení tahu, detekce matu a remíz
a podobně. Podobné rutiny musí obsahovat každý šachový program, i když
neobsahuje myslící algoritmus, ale jen například umožňuje hru dvou lidských
hráčů přes síť a kontroluje tahy. Kvalitní implementace myslícího algoritmu
tyto rutiny obsahuje rovněž, ale zpravidla poměrně komplikované, především
kvůli optimalizaci na rychlost nebo proto, že jako vedlejší efekt provádějí i
jinou akci. Na začátek proto budeme předpokládat, že zmíněné rutiny máme již
nějak napsané (to jistě dokáže každý programátor seznámený s pravidly
šachů) a teprve v dalších dílech si o nich povíme víc.
Asi nejjednodušší algoritmus, který nehraje úplně náhodně a aspoň trochu
přemýšlí, bude založený na porovnávání pozic po zahraném tahu. Především
musíme implementovat statickou ohodnocovací funkci. Tato funkce má na vstupu
pozici a výstupem je číslo, které určuje, jak moc je pozice dobrá pro hráče,
který je právě na tahu. Funkce nemá příliš velké ambice a provádí jen velmi
jednoduchou analýzu pozice. Její nejdůležitější a
nejjednodušší složkou je prostý součet materiálu. Pokud má pěšec cenu 1,
jezdec se střelcem 3, věž 5 a dáma 9. Uvedené hodnoty jsou samozřejmě jen
orientační. Číselně málo významnou, ale pro úroveň hry podstatnou složku tvoří
pozice. Každý šachista ví, že věž patří na volný sloupec (např. +0,1),
dvojpěšec je horší než dva pěšci (třeba -0,3), izolovaný pěšec také není dobrý
(-0,1), střelec může z g5 svázat jezdce na f6 (+0,05) a podobně. Hodně věcí se
dá uložit do tabulek. Třeba jezdci můžeme pro každé políčko přiřadit bonus
nebo postih. Podrobnosti statické ohodnocovací funkce nás zatím nebudou
zajímat, vrátíme se k ní v dalších dílech. Důležité je jen to, že funkce
provádí jen jakousi velmi rychlou a zběžnou analýzu pozice a nesnaží se
například vyřešit, zda s tím chyceným střelcem na a7 bílý uteče. Je zřejmé, že
i statickou ohodnocovací funkci dokáže napsat každý šachista - programátor, byť
jistě ne na špičkové úrovni.
Nyní je již vlastní algoritmus velmi jednoduchý. Vygenerujeme ze zadané pozice
všechny tahy a zkoušíme jeden po druhém zahrát. Vzniklou pozici vždy ohodnotíme statickou ohodnocovací funkcí a tah vrátíme. Průběžně si pamatujeme nejlepší
tah a rovněž hodnotu pozice, ke které vede. Po otestování všech vygenerovaných
tahů vrátíme ten nejlepší.
Můžeme zkusit ručně odsimulovat chod algoritmu pro základní postavení.
Na tahu je bílý. Generátor tahů pravděpodobně projde políčka od a1 po h8
a pro každý bílý kámen nalezne jeho tahy. Ty přijdou v pořadí Ja1, Jc3, Jf3,
Jh3, a3, a4, b3, b4, ..., h3, h4. Program zkusí zahrát Ja1 a vzniklou
pozici ohodnotí statickou ohodnocovací funkcí.
Zjistí, že si tahem moc nepolepšil, neboť v tabulkách ohodnocovací funkce bude
pro jezdce na a1 malé číslo, jezdec nestojí u kraje šachovnice příliš
dobře. Žádný jiný tah však zatím nemá, tak si Ja1
zapamatuje, jako dosavadní nejlepší, a uloží si i hodnotu pozice. Poté program
tah vrátí, takže vznikne opět základní postavení. Zahraje Jc3 a statickou
ohodnocovací funkcí zjistí, že výsledná pozice je pro bílého lepší než hodnota
po Ja1. Klíčovou roli opět sehrají tabulky statické ohodnocovací funkce pro
jezdce. Program tedy přepíše proměnné pro nejlepší tah i pro jeho hodnotu na
Jc3 a cenu takto vzniklé pozice. Vrátí tah a pokračuje v propočtu.
Hned další tah Jf3 bude zřejmě nepatrně lepší než Jc3, takže opět přepíše
proměnné pro nejlepší tah a jeho hodnotu. Pozici po Jh1 naproti tomu zavrhne,
neboť je horší než dosavadní maximum po Jf3. Stejným způsobem program ohodnotí
i všech 16 tahů pěšci. Zde nejspíš statická ohodnocovací funkce ocení kontrolu
centra po d4 a e4. Jako výsledný nejlepší tah, tak program zřejmě vrátí d4.
Tento zahajovací tah je oblíbený i lidskými hráči od amatérů až po velmistry.
V základním postavení tedy náš jednoduchý program nezklamal.
V jakémsi pseudokódu ve stylu C by algoritmus vypadal zhruba následovně.
Tah nejlepsiTah(Pozice p) {
Tahy t;
int i, indexNejlepsiho;
int cena, nejlepsi;
t = generujTahy(p);
nejlepsi = -NEKONECNO;
for (i = 0; i < tahy.pocet; i++) {
zahrajTah(p, t[i]);
cena = -hodnotaPozice(p);
zahrajTahZpet(p, t[i]);
if (cena > nejlepsi) {
nejlepsi = cena;
indexNejlepsiho = i;
}
}
return t[indexNejlepsiho];
}
Co reprezentují typy Tah a Pozice asi nemusím vysvětlovat. Tah může být číslo
nebo jednoduchá struktura nesoucí dostatečné informace pro provedení a vrácení
tahu v konkrétní pozici. Je dobré si uvědomit, že pravidla šachu obsahují
několik speciálních typů tahů. Mám na mysli rošádu, braní mimochodem a proměny
pěšců. Kvůli tomu není provedení a vrácení tahu tak jednoduché, jak by jinak
mohlo být. Proměna pěšce ovlivní i samotný typ Tah, musím do něj nějak
zakódovat, zda se pěšec při tahu na poslední řadu mění v dámu, věž,
střelce nebo jezdce. Nestačí si tedy pamatovat jen políčka odkud a kam se
táhne.
Typ Tahy používám jako pole Tahů vylepšené o položku pocet, která označuje
velikost pole. Pozice bude struktura obsahující rozestavěné kameny na
šachovnici - dvourozměrné pole 8 x 8 (později si ukážeme implementaci
s mantinelem - pole 10 x 12) a také informaci o možnostech braní mimochodem a
zkažených rošádách. Pro nešachisty připomínám, že braní mimochodem je možné
pouze bezprostředně poté, co soupeř táhl pěšcem o dvě pole a že rošádu
není možné provést, pokud hráč již táhl králem nebo příslušnou věží, ani když
se potom vrátil na původní pole.
Význam funkcí generujTahy, zahrajTah a zahrajTahZpet
je snad zřejmý, hodnotaPozice je statická ohodnocovací funkce.
Hodnotu pozice (včetně materiálu) počítáme v typu int, cena jednoho pěšce může
být třeba 100. Hodnota je vždy z hlediska hráče, který je právě na tahu, větší
číslo znamená lepší pozici. Zahrání neutrálního tahu tak jen změní znaménko
hodnoty pozice, proto v kódu přiřazuji cenu pozice se znaménkem minus.
Pokračování příště
Uvedený program je sice lepší než náhodný výběr tahů, ale díru do světa
rozhodně neudělá. Porovnává pozice vzniklá po jediném půltahu, a tak klidně
sebere dámou krytého pěšce, nepokryje jednotahový mat a podobně. Asi každého
programátora, který někdy slyšel o rekurzi, napadne okamžitě zlepšení.
Ukážeme si ho v příštím dílu.
Verze pro tisk
|
Příspívat do diskuze mohou pouze registrovaní uživatelé.
|
|

Vyhledávání software

Vyhledávání článků
28.11.2018 23:56 /František Kučera Prosincový sraz spolku OpenAlt se koná ve středu 5.12.2018 od 16:00 na adrese Zikova 1903/4, Praha 6. Tentokrát navštívíme organizaci CESNET. Na programu jsou dvě přednášky: Distribuované úložiště Ceph (Michal Strnad) a Plně šifrovaný disk na moderním systému (Ondřej Caletka). Následně se přesuneme do některé z nedalekých restaurací, kde budeme pokračovat v diskusi.
Komentářů: 1
12.11.2018 21:28 /Redakce Linuxsoft.cz 22. listopadu 2018 se koná v Praze na Karlově náměstí již pátý ročník konference s tématem Datová centra pro business, která nabídne odpovědi na aktuální a často řešené otázky: Jaké jsou aktuální trendy v oblasti datových center a jak je optimálně využít pro vlastní prospěch? Jak si zajistit odpovídající služby datových center? Podle jakých kritérií vybírat dodavatele služeb? Jak volit vhodné součásti infrastruktury při budování či rozšiřování vlastního datového centra? Jak efektivně datové centrum spravovat? Jak co nejlépe eliminovat možná rizika? apod. Příznivci LinuxSoftu mohou při registraci uplatnit kód LIN350, který jim přinese zvýhodněné vstupné s 50% slevou.
Přidat komentář
6.11.2018 2:04 /František Kučera Říjnový pražský sraz spolku OpenAlt se koná v listopadu – již tento čtvrtek – 8. 11. 2018 od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5). Tentokrát bez oficiální přednášky, ale zato s dobrým jídlem a pivem – volná diskuse na téma umění a technologie, IoT, CNC, svobodný software, hardware a další hračky.
Přidat komentář
4.10.2018 21:30 /Ondřej Čečák LinuxDays 2018 již tento víkend, registrace je otevřená.
Přidat komentář
18.9.2018 23:30 /František Kučera Zářijový pražský sraz spolku OpenAlt se koná již tento čtvrtek – 20. 9. 2018 od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5). Tentokrát bez oficiální přednášky, ale zato s dobrým jídlem a pivem – volná diskuse na téma IoT, CNC, svobodný software, hardware a další hračky.
Přidat komentář
9.9.2018 14:15 /Redakce Linuxsoft.cz 20.9.2018 proběhne v pražském Kongresovém centru Vavruška konference Mobilní řešení pro business.
Návštěvníci si vyslechnou mimo jiné přednášky na témata: Nejdůležitější aktuální trendy v oblasti mobilních technologií, správa a zabezpečení mobilních zařízení ve firmách, jak mobilně přistupovat k informačnímu systému firmy, kdy se vyplatí používat odolná mobilní zařízení nebo jak zabezpečit mobilní komunikaci.
Přidat komentář
12.8.2018 16:58 /František Kučera Srpnový pražský sraz spolku OpenAlt se koná ve čtvrtek – 16. 8. 2018 od 19:00 v Kavárně Ideál (Sázavská 30, Praha), kde máme rezervovaný salonek. Tentokrát jsou tématem srazu databáze prezentaci svého projektu si pro nás připravil Standa Dzik. Dále bude prostor, abychom probrali nápady na využití IoT a sítě The Things Network, případně další témata.
Přidat komentář
16.7.2018 1:05 /František Kučera Červencový pražský sraz spolku OpenAlt se koná již tento čtvrtek – 19. 7. 2018 od 18:00 v Kavárně Ideál (Sázavská 30, Praha), kde máme rezervovaný salonek. Tentokrát bude přednáška na téma: automatizační nástroj Ansible, kterou si připravil Martin Vicián.
Přidat komentář
Více ...
Přidat zprávičku
 Poslední diskuze
31.7.2023 14:13 /
Linda Graham iPhone Services
30.11.2022 9:32 /
Kyle McDermott Hosting download unavailable
13.12.2018 10:57 /
Jan Mareš Re: zavináč
2.12.2018 23:56 /
František Kučera Sraz
5.10.2018 17:12 /
Jakub Kuljovsky Re: Jaký kurz a software by jste doporučili pro začínajcího kodéra?
Více ...
|