PHP (54) - Dodržování webových standardů

Při psaní v PHP byste měli dodržovat webové standardy. Jak? Uvidíte v dnešním článku.

11.10.2004 15:00 | Petr Zajíc | přečteno 38641×

Jelikož je PHP velmi úzce spojeno s tvorbou webu, je při psaní stránek pomocí PHP potřeba myslet na dodržování určitých norem. Pojďme se v dnešním díle našeho seriálu podívat, jak nám PHP může být v tomto ohledu nápomocno a jakých chyb bychom se měli v této souvislosti naopak vyvarovat.

Stránky a normy

Pakliže nejste na internetu úplnými nováčky, pravděpodobně víte, že HTML dokumenty mají svoji strukturu, která je předem daná. Na našem webu se o tom psalo například v seriálu o HTML, ale psalo se o tom samozřejmě i na mnoha jiných místech. Při vývoji aplikace byste měli mít na paměti, že výsledkem PHP skriptu bývají HTML stránky a tyto stránky by měly odpovídat normám.

Tak například na webu World Wide Web consortia můžete najít vyčerpávající informace o webových dokumentech, jejich specifikacích a můžete tam rovněž najít HTML validátor, který Vám umožní vaše stránky (nebo skripty) ON-LINE otestovat. Měli byste si zvyknout testovat validitu stránek již během vývoje, zejména pokud se jedná o větší projekty. Je to dobrý zvyk - bez norem by web vůbec nemohl existovat; úplně stačí, že normy okázale ignorují některé prohlížeče.

Pozn.: Tady na Linuxsoftu máme například pravidlo, podle něhož si autor má zkontrolovat validitu článku předtím, než jej předá k uveřejnění. To je nanejvýš rozumné, protože to pomáhá jak autorovi, tak editorovi, tak čtenáři.

Pojďme se teď podívat na některé konkrétní věci, jež s tím souvisejí a jež můžeme ovlivnit pomocí PHP.

Hlavičky

Jednou z věcí, které Váš webový dokument musí mít v pořádku jsou hlavičky. Možná si vzpomínáte na hlavičku Location, pomocí níž můžeme donutit server, aby načetl jinou stránku. Následující hlavička Location je například formálně nesprávná, přestože se v tomto stylu na internetu hojně vyskytuje (a přestože vám většinou bude fungovat):

<?
header
("Location: neco.php");
?>

Nesprávná je proto, že podle specifikace by url v této hlavičce mělo být vždy absolutní. Přitom pomocí PHP není problém absolutní hlavičku sestavit. Již jsme to v seriálu dělali, takže jen připomenu:

<?
$path
=SubStr($SCRIPT_NAME, 0, StrRPos($SCRIPT_NAME,"/"))."/neco.php";
header("Location: http://".$_SERVER["SERVER_NAME"].":".$_SERVER["SERVER_PORT"].$path);  
?>

Podobným problémem může být použití hlavičky Expires, kterážto by měla donutit prohlížeč nečíst (případně) odpověď z vyrovnávací paměti, ale požádat o ni server v případě, že vyprší doba platnosti. Často se nesprávně používá takto:

<?
header
("Expires: 0");
?>

Zase - podle normy by za Expires mělo následovat datum, ne nula. A to ještě ne datum napsané lecjak, ale podle specifikace. Sestavit takové datum pomocí PHP samozřejmě NENÍ problém, takže není důvod proč nevyhovět normě a nenapsat něco jako:

<?
$header
="Expires: ".GMDate("D, d M Y H:i:s \G\M\T");
Header ($header);
?>

Takhle bychom mohli pokračovat. Tyto dvě chyby však jsou zdaleka nejčastější, kterých se programátoři PHP při generování hlaviček dopouštějí. Pokud si nejste jisti, jak má nějaká hlavička vypadat, podívejte se do specifikace.

Tělo dokumentu

Při práci na složitějších webech může být až neuvěřitelně složité zachovat správné pořadí tagů <HTML><HEAD>...</HEAD><BODY>...</BODY></HTML>. To proto, že  výstup do prohlížeče může pocházet z několika různých skriptů a že občas potřebujeme odeslat nějakou tu hlavičku předtím, než pošleme prohlížeči cokoliv jiného.  "Nejlepší" řešení tohoto problému asi neexistuje, ale mohu Vám ukázat některá "správná" řešení. Jedno spočívá v nějaké logické organizaci skriptů a používání include, resp. require ve smyslu:

<?
echo "<HTML>";
require
"./hlavicka.php";
require
"./telicko.php";
echo
"</HTML>";
?>

Jiné dobré řešení spočívá v nasazení nějakého šablonovacího systému, který bude formátování držet pevně ve své režii. Jeho výběr záleží pochopitelně na Vás, můžete se porozhlédnout třeba tady.

Poměrně častý problém v těle dokumentu (sám se toho s oblibou dopouštím) je špatné uvádění odkazů. Co byste řekli na následující kód?

<?
$odkaz
="<a href=\"neco.php?id=1&user=2\">Odkaz</a>";
echo
$odkaz;
?>

Je špatně! Ampresandy nemají v URL co dělat! A přitom by stačilo tak málo. Přepsat kód do podoby:

<?
$odkaz
="<a href=\"neco.php?id=1&amp;user=2\">Odkaz</a>";
echo
$odkaz;
?>

Znakové sady

Ještě malou poznámku ke znakovým sadám: Znakovou sadu stránky byste zcela určitě měli specifikovat v odpovídající hlavičce. Pokud je to jen trochu možné (například, když se rozhodujete při tvorbě nového webu), měli byste dát přednost UTF-8, protože je jakýmsi "nepsaným standardem". Vím o čem mluvím. Tuto radu ocení zejména programátoři pracující v systémech Windows i Linux; důsledné používání UTF Vám ušetří hodně starostí při vývoji na více než jedné platformě.

Nejčastější důvod (a špatný) proč to nedělat je ten, že některé editory zdrojového kódu zkrátka v UTF-8 ukládat neumějí. Jsem ale přesvědčen, že je lepší zvyknout si na jiný editor, než neustále bojovat s konverzemi mezi win CP 1250, ISO 8859-2 a unikódem.

A ještě malá poznámka k seriálu - většinu zde uvedených pravidel v příkladech nedodržuji. Je to schválně - s cílem napsat co nekratší kód, který bude ilustrovat to, k čemu byl napsán, a nic jiného. Pochopitelně, že v "ostrém" provozu by tato filozofie byla odsouzeníhodná. Přesto (nebo možná právě proto?) jsem rád, když na případné odchylky od norem poukazujete ve svých komentářích pod články.

Online verze článku: http://www.linuxsoft.cz/article.php?id_article=443