PHP a HTTP protokol - jelikož PHP slouží převážně k výrobě internetových stránek, není vůbec špatné vědět, jak funguje jejich přenos a jaké triky nám jazyk nabízí v této oblasti.
4.8.2004 15:00 | Petr Zajíc | přečteno 71301×
Aby se ve světě internetu udržel nějaký pořádek, musí existovat
určitá pravidla hry. Tak například webové servery musejí "rozumět"
tomu, na co se jich ptáme. Aby to dovedly, existuje protokol, který se
jmenuje HTTP. Každý prohlížeč musí umět sestavit takzvaný http požadavek a musí být schopen
porozuměnt http odpovědi.
(Každý server zase musí rozumět požadavku a musí být schopen sestavit
podle něj odpověď.) V
praxi to velice zhruba řečeno funguje tak, že jak požadavky, tak
odpovědi mají svůj formát a ten by se měl ctít a dodržovat.
Požadavek se skládá mimo jiné z hlaviček. Ty mohou obsahovat některé důležité věci o tazateli (tedy prohlížeči) nebo o jeho prostředí. PHP umí zjistit, jaké hlavičky byly v požadavku, a umí je zobrazit. Slouží k tomu příkaz getallheaders a funguje to následujícím způsobem:
<?
$hlavicky = getallheaders();
while (list ($nazev, $hodnota) = each ($hlavicky)) {
echo "$nazev:
$hodnota<br>\n";
}
?>
Jelikož má generování hlaviček na starosti prohlížeč, bude
pravděpodobně výstup skriptu pro každý prohlížeč jiný. Hlavičky
požadavku nemají až tak velký význam, ale mohou být užitečné pro
statistiky a podobně. (Často z nich jde vyvěštit, jaký prohlížeč jsme
pro zobrazení stránky použili).
U odpovědí je situace veselejší. Tu sestavujeme sami a můžeme na to
využít PHP. Odpověď webového serveru má dvě části:
Hlavička se do odpovědi propašuje pomocí PHP funkce header. My už
jsme se s touto funkcí v seriálu setkali na dvou místech. V díle o příkladech
na formuláře jsme využili hlavičku Location a v díle o
uploadu a downloadu souborů jsme využili dokonce tři hlavičky,
content-description, content-type a content-disposition. Teď si v tom
uděláme trochu jasno.
Z čistě praktického hlediska není přidání
hlavičky k odpovědi nic jiného, než způsob, jak něco vzkázat
prohlížeči. Hlavičky jsou normalizované,
hotové peklo však může nastat při zjišťování, zda nám cílový prohlížeč
opravdu porozuměl a zda udělal to, co chceme.
Co se týče PHP, musí být všechna volání funkce header provedena
dříve, než se odešle jakýkoli výstup do prohlížeče. Poměrně častá chyba
vznikne tehdy, když máme projekt uložený ve více souborech a ty
spojujeme pomocí require nebo include. I jedna nevinná mezera na konci
includovaného souboru totiž způsobí, že se volání funkce header
nepovede - a chybu možná budeme dlouho hledat.
Pozn.: To, co jsem řekl o
hlavičkách berte jako nástin problematiky. Opravdoví znalci HTTP možná
poukáží na to, že existují různé verze protokolu, že v každé verzi
přibyly nebo ubyly určité hlavičky, že některé hlavičky začaly být od
jisté verze HTTP povinné a podobně. Můžete se realizovat v
diskusi.
V praxi existuje jen několik
hlaviček, které stojí za to si zapamatovat v souvislosti s PHP. Ukažme
si je:
Location
Location se pokusí přemluvit prohlížeč, že by se měl poohlédnout jinde.
Máte-li například stránku s následujícím obsahem:
<?
Header("Location:
http://www.linuxsoft.cz");
?>
budete místo jejího načtení přesměrováni na startovní stránku
Linuxsoftu přesto (nebo možná právě proto ;-) ) že je skript naprosto v
pořádku. Zbytek skriptu se zkrátka neprovede.
Content-disposition
je hlavička, která se pokusí přemluvit prohlížeč, aby to, co bude ve
výstupu následovat, považoval za přílohu. Už jsme o ní mluvili.
<?
Header("Content-Description:
File Transfer");
Header("Content-Type: application/force-download");
Header("Content-Disposition: attachment;
filename=\"nazev.pripona\"");
?>
Cache-control
Existuje sada hlaviček, které se pokusí přemluvit prohlížeč, aby se
nebavil s proxy serverem, ale aby načetl vždy čerstvou kopii stránky ze
serveru.
<?
Header("Pragma:
no-cache");
Header("Cache-control: no-cache");
Header("Expires: ".GMDate("D, d m Y H:i:s")." GMT");
?>
Pozn.: Kéžby to fungovalo vždy. Některé proxy servery bývají napsány tak, že je skoro nemožné je obejít, jiné je potřeba správně nastavit, další mají v rukou lidé, které nemůžete ovlivnit. Většinou to ale dopadne dobře a použití těchto hlaviček způsobí načtení stránky ze serveru, ne z cache proxy.
WWW-Authenticate
je hlavička, která se pokusí vysvětlit prohlížeči, že by měl požadovat
ověření uživatele pomocí jména a hesla. Ještě o ní budeme mluvit
podrobněji, teď jen příklad:
<?
Header("HTTP/1.0
401 Unauthorized");
Header("WWW-Authenticate: Basic realm=\"oblast\"");
?>
Hlavičky nejsou samospásné. Prohlížeče některým nerozumí, jiné se
používají nenormalizovaně, další pozmění nebo nepochopí na cestě
číhající proxy server, prostě bývá s nimi zábava. Ty, které jsem uvedl
výše by v naprosté většině případů měly fungovat správně.
Příště se v našem seriálu přehoupneme do oblasti, na kterou se již všichni těší - bude řeč o databázích.