Perl (81) - CGI - příprava webového serveru

Perl CGI je protokol pro propojení webového serveru s aplikacemi. Nainstalujeme webový server Apache a uděláme nezbytná nastavení k tomu, abychom rozběhali CGI.

15.6.2009 01:00 | Jiří Václavík | přečteno 17042×

CGI znamená Common Gateway Interface. Je to rozhraní, který umožňuje spolupráci programu a webového serveru. Funguje to tak, že webový server pověří nějaký externí program, aby obsloužil klienta.

Podrobněji, tato technologie funguje funguje na následujícím principu.

  1. Server obdrží požadavek od klienta
  2. Server pošle požadavek na obsloužení programu
  3. Program pošle výsledek požadavku serveru
  4. Server pošle výsledek požadavku klientovi

Server tak vůbec nemusí zajímat, co dělá CGI skript. Stará se pouze o umístění programu a předání hodnot pomocí CGI rozhraní. Hodnoty lze programu předávat buď metodou POST nebo GET. Odpověď na požadavek pak CGI skript předává serveru skrz standardní výstup. Na začátku tohoto výstupu musí být uvedeny hlavičky.

Důležité také je, že CGI skript běží na straně serveru. To znamená, že server klientovi nezasílá program, ale pouze jeho výsledky. Vzhledem ke klientským skriptovacím jazykům to má své výhody a nevýhody a obě technologie se mohou výhodně doplňovat.

CGI pracuje metodou "on-the-fly" a umí díky tomu zajistit dynamičnost webu. To znamená, že umožňuje interaktivní komunikaci s klientem. Webový server díky CGI dokáže místo statické stránky zasílat stránku ovlivněnou požadavkem. Tato stránka je tedy v reálném čase vygenerována externím programem.

Typickou ukázkou použití CGI je obsluha formulářů, které na základě vstupních dat vyberou vyhovující záznamy z databáze.

Programům, které tímto způsobem externě spolupracují s webovým serverem se říká CGI skripty. Jak se liší takový CGI skript od běžného programu? Teoreticky vůbec nijak. Nicméně je pravidlem, že CGI skript generuje dokument v určeném formátu. Mohou to tedy být například programy, které vytvářejí stránku v nějakém značkovacím jazyce. Nejčastější je v tomto směru jazyk, kterému rozumí webové prohlížeče - tedy HTML. Samozřejmě je ale možné generovat cokoliv - ať už stránky v jiném značkovacím jazyce, čistý text, obrázky (zde jsou typickou ukázkou human checky) nebo něco úplně jiného.

Každý nepřeložený CGI skript musí obsahovat cestu ke svému interpretu, protože CGI musí vědět, v čem má být program zpracován. Je tedy nutné psát na začátek skriptů řádek #!/cesta/k/interpretu.

Zajímavou otázkou je, jak server pozná, který soubor má obyčejně poslat a který ještě předtím zpracovat - tedy zda bude odpovědí na požadavek statický nebo dynamický dokument. Odpovědí je, že to záleží na nastavení serveru. Je třeba určit soubory, které mají být dynamicky zpracovávány. Kritériem je obvykle typ souborů (tedy například můžeme rozlišovat dle přípony, běžně se používá .cgi případně .pl) nebo umístění ve speciálním adresáři s CGI skripty (obvykle s názvem cgi-bin).

Použití CGI zažívalo vrchol na konci minulého století. Dnes se masově prosazují spíše technologie jako je PHP. Rozdíl mezi aplikacemi napsanými v PHP a CGI je v tom, že webový server PHP skripty zpracovává přímo (samozřejmě s výjimkou případu, kdy použijeme PHP jako CGI), narozdíl od CGI skriptů, které, jak již bylo několikkrát zmíněno, zpracovává samostatný proces. Nicméně i v dnešní době se s CGI můžeme mnohde setkat. Použití CGI je výhodné zejména tehdy, pokud je třeba provést časově náročné operace.

Ovšem nejen PHP, ale i Perl může být na webovém serveru zpracováván přímo. O tom bude dále v seriálu ještě podrobně pojednáno.

Apache

K rozběhání CGI budeme potřebovat nějaký webový server - použijeme Apache. Pokud Apache ve svém systému nemáte, nainstalujte si apache2 balíček, který by měl být dostupný ve vaší linuxové distribuci nebo si stáhněte aktuální verzi a nainstalujte klasicky pomocí příkazů

./configure
make
su -c 'make install'

Pokud bude server nainstalován tímto způsobem, mělo by být CGI již normálně nastaveno. Nebude-li vám z nějakých důvodů CGI chodit, je třeba editovat konfigurační soubor Apache.

Konfigurace Apache pro CGI

Pokud nemáte historickou verzi Apache nebo jiná specifika, pak by se měl konfigurační soubor jmenovat /usr/local/apache2/conf/httpd.conf. Pro podporu CGI skriptů přidáme následující řádky.

AddHandler cgi-script .cgi

ScriptAlias /cgi-bin /usr/local/apache2/cgi-bin

<Directory "/usr/local/apache2/cgi-bin">
  AllowOverride None
  Options ExecCGI
  Order allow,deny
  Allow from all
</Directory>

První řádek říká, že všechny soubory s příponou .cgi má server považovat za CGI skripty. Další řádky mapují skutečný adresář /usr/local/apache2/cgi-bin jako virtuální adresář /cgi-bin pro Apache. Do tohoto adresáře můžeme ukládat CGI skripty, jež budeme chtít přes Apache spouštět. Statické dokumenty jsou implicitně ukládány v /usr/local/apache2/htdocs.

To samozřejmě můžeme změnit. Chceme-li například, aby Apache hledal CGI programy v /home/www/cgi-bin a statické dokumenty v /home/www/htdocs, což je pro leckoho pohodlnější, stačí předchozí zápis změnit a upravit direktivu DocumentRoot.

DocumentRoot "/home/www/htdocs"

AddHandler cgi-script .cgi

ScriptAlias /cgi-bin /home/www/cgi-bin

<Directory "/home/www/cgi-bin">
  AllowOverride None
  Options ExecCGI
  Order allow,deny
  Allow from all
</Directory>

Ještě poznamenejme, že změny provedené v konfiguračním souboru se projeví až při dalším spuštění serveru.

Soubory Apache

Ty nejdůležitější soubory, které Apache využívá najdeme většinou v adresáři /usr/local/apache2, pokud jsme při instalaci volbou --prefix nenastavili jinou cestu. Dále budeme v seriálu pro zjednodušení předpokládat, že náš Apache je právě v /usr/local/apache2.

Výše zmíněný adresář obsahuje několik podadresářů. Za všechny jmenujme alespoň některé. V adresáři bin nalezneme spustitelné soubory. Nás z nich bude dnes zajímat pouze soubor apachectl, kterým nastartujeme či vypneme server.

/usr/local/apache2/bin/apachectl start
/usr/local/apache2/bin/apachectl stop

Do adresáře s názvem cgi-bin se obvykle umísťují samotné CGI skripty. To nás bude samozřejmě velmi zajímat. Z názvu cgi-bin je patrné, že zde budou výhradně binární soubory. Nicméně skutečnost je většinou jiná.

Dále musíme zmínit adresář conf, kde jsou umístěny konfigurační soubory Apache. Bude nás zajímat zejména soubor httpd.conf, ve kterém jsou umístěna nejdůležitější nastavení serveru.

Adresář htdocs uchovává obsah webových stránek. Jsou zde všechny HTML soubory, obrázky, PHP skripty a podobně. Obsah tohoto adresáře stejně jako adresáře cgi-bin je často měněn, a proto, pokud nevyhovuje jejich umístění v /usr/local/apache2, není nic jednoduššího, než vytvořit si sem odkazy z vhodnějších adresářů.

Za zmínku stojí také adresář manual. Obsahuje několik howto týkající se serveru.

Přístup k CGI skriptům na serveru

Nyní máme nainstalován Apache - vše je tedy připraveno na první spuštění. Nastartujme Apache následujícím příkazem.

/usr/local/apache2/bin/apachectl start

Na adrese 127.0.0.1 nebo chcete-li localhost nyní máme přístupný webový server. Nejjednodušší cesta, jak se s ním spojit, je spustit webový prohlížeč a zadat tuto adresu. Pokud jste nic neměnili v kořenovém adresáři, tak se obvykle zobrazí stránka It works! - tedy soubor /usr/local/apache2/htdocs/index.html.

Právě jsme zobrazili (z pohledu serveru) statický dokument. CGI skript test.cgi uložený v /usr/local/apache2/cgi-bin spustíme zadáním http://localhost/cgi-bin/test.cgi. Důležitý je fakt, že CGI skript můžeme spustit pouze tehdy, máme-li na to práva. Každému CGI skriptu tedy přiřadíme právo pro spouštění, stejně jako adresáři, ve kterém je uložen.

Online verze článku: http://www.linuxsoft.cz/article.php?id_article=1606