15. díl nemá jednotné téma. Půjde vesměs o věci, které jsou na celý díl krátké, dosud se nikam výrazněji nehodily a přesto je užitečné něco o nich tušit.
11.10.2005 07:00 | Jiří Václavík | přečteno 31143×
Ještě dříve, než se pustíme do tajemných hlubin regulárních výrazů, bychom se měli seznámit s několika tématy. Proto vznikl tento díl.
$_ je proměnná, kam se implicitně ukládají skalární hodnoty. Typicky - nezadáme-li název proměnné někde, kde je vyžadován, použije se právě $_. Význam je pak stejný, jako bychom použili název $_. Toto pravidlo neplatí všude, ale podporují ho pouze některé konstrukce nebo funkce.
while ($radek = <>){
if ($radek == 0){
exit;
}
print $radek;
}
Tento kód můžeme přepsat pomocí $_:
while (<>){
if ($_ == 0){
exit;
}
print $_;
}
Uvedeme-li jako test jen <>, bude vstup implicitně uložen do proměnné $_ (tedy stejné jako $_ = <>). Příklad můžeme ještě zkrátit. Pokud není funkci print předán žádný parametr, automaticky tiskne hodnota $_:
while (<>){
if ($_ == 0){
exit;
}
print;
}
Takovým způsobem se nechová jen print, ale řada dalších funkcí. To, jestli funkce pracuje s výchozí proměnnou zjistíme vždy v manuálové stránce perlfunc nebo perlvar.
Velmi často se výchozí proměnná také používá u cyklu for. Pokud neuvedeme v hlavičce cyklu skalární proměnnou, použije se právě $_. Díky tomu bude fungovat například následující zápis, který výpíše třetí mocniny čísel od 1 do 10:
print $_ ** 3, "\n" for (1..10);
Za proměnnou v řetězci musí být vždy mezera. Jednou z možností, jak toto "pravidlo" obejít, je uzavření názvu proměnné do složených závorek.
$slovo = "TEXT";
print "zhusteny${slovo}bezMEZER.";
Složené závorky umí ještě obecnější věc. Název proměnné lze získat vyhodnocením výrazu ve složených závorkách.
$p = 1;
${"p" x 3} = 2; #"p" x 3 je vyhodnoceno jako ppp, což je název proměnné
${if($ppp){$p?"a":"b"}else{$p?"c":"d"}} = 3;
print $ppp;#2
print $a;#3
print $b;#nedefinováno
print $c;#nedefinováno
print $d;#nedefinováno
Jak vidíme, můžeme zakomponovat i celé konstrukce jako je if. Jedinou podmínkou je, aby byl úsek kódu ve složených závorkách vyhodnocen jako řetězec, který je platným identifikátorem. Předchozí výraz je vyhodnocen jako "a". Proto bude hodnota přiřazena do proměnné $a.
Nicméně tuto vlastnost opět uvádíme spíše pro úplnost než z praktického hlediska. Mohou s ní být problémy (a to nejen ve strict režimu, který ji zakazuje) a v praxi ji tedy moc neužijeme.
Funkce undef vrací nedefinovanou hodnotu. Takže, například, potřebujeme-li vytvořit pole, v němž budou mít indexy 1, 3, 4 nedefinované hodnoty, můžeme udělat toto:
@p = ("a", undef, "b", undef, undef, "c");
Potřebujete-li vytisknout nějaký delší text, jistě přivítáte tzv. here-document možnost zápisu.
$zaznamu = 91;
print << 'KONEC';
Vyberte z těchto voleb:
+----------------------+
| 1 ... Přidat záznam|
| 2 ... Odebrat záznam |
| 3 ... Konec |
+----------------------+
Záznamů: $zaznamu\n
KONEC
Tisknuto je vše, dokud není nalezeno slovo KONEC na samostatném řádku (avšak který nesmí být zároveň posledním v souboru). Můžeme zvolit libovolné termiální slovo. Je to stejné jako např. v shellech (aneb vybavme si příkazy jako cat > soubor <<EOF).
Protože se k uvození nepoužívají ani apostrofy ani uvozovky, lze je normálně používat v tisknutém řetězci.
$ perl print.pl
Vyberte z těchto voleb:
+----------------------+
| 1 ... Přidat záznam |
| 2 ... Odebrat záznam |
| 3 ... Konec |
+----------------------+
Záznamů: $zaznamu\n
$
Z předchozího výpisu je zřejmé, že nebyly nahrazeny proměnné a escape znaky. To je samozřejmě možné ovlivnit. Nyní je nahradíme jejich obsahem. Změňme apostrofy kolem slova KONEC na uvozovky:
$zaznamu = 91;
print << "KONEC";
Vyberte z těchto voleb:
+----------------------+
| 1 ... Přidat záznam |
| 2 ... Odebrat záznam |
| 3 ... Konec |
+----------------------+
Záznamů: $zaznamu\n
KONEC
Potom se text chová jako řetězec v uvozovkách. Místo řetězce "$zaznamu" se oproti minulému příkladu vytiskla hodnota této proměnné.
$ perl print.pl
Vyberte z těchto voleb:
+----------------------+
| 1 ... Přidat záznam |
| 2 ... Odebrat záznam |
| 3 ... Konec |
+----------------------+
Záznamů: 91
$
Tato syntaxe není svázaná s příkazem print, jak by se doposud mohlo zdát. Lze ji použít prakticky kdekoliv místo řetězce. Tedy například při přiřazení do proměnné.
$x = << 'KONEC';
+----------------------+
| 1 ... Přidat záznam |
| 2 ... Odebrat záznam |
| 3 ... Konec |
+----------------------+
KONEC
Jistou nevýhodou syntaxe here-document v Perlu je, že nelze vložený řetězec odsazovat. Vzniká tím poměrně nečitelný kód. Pokud se o odsazení pokusíme, budou mezery, kterými odsadíme, součástí řetězce. Nicméně v Perlu 6 bude tato věc řešena.
Pokud trváme na odsazení, existuje částečné řešení už nyní. Pomocí regulárních výrazů lze smazat všechna bílá místa na začátku řádku.
($x = << 'KONEC') =~ s/^\s+//gm;
radek 1
radek 2
KONEC
Předchozí kód je také ukázkou dalšího způsobu použití této syntaxe.
To není o here-document zdaleka vše. Koho zajímají další možnosti, tak si může najít informace v manuálové stránce perlop v části Regexp Quote-Like Operators.
Další možností zápisu řetězce je použít uvození pomocí q a qq.
Zápis pomocí q napodobuje řetězec v apostrofech. Liší se tím, že apostrofy v řetězci uvozeném pomocí q můžeme normálně používat. Nahrazuje se zpětné lomítko a uvozovací znak - v našem případě lomítko.
$x = 99;
print q/řetězec jako v apostrofech: ' \n " $x \\ \//;
Vytiskne:
$ perl q.pl
řetězec jako v apostrofech: ' \n " $x \ /
$
Podobně můžeme simulovat uvozovky. Stačí zaměnit q za qq:
$x = 99;
print qq/řetězec jako v uvozovkách: ' \n " $x \\ \//;
Escape znaky i proměnné se nyní normálně nahrazují hodnotami.
$ perl q.pl
řetězec jako v uvozovkách: '
" 99 \ /
$
Není nutné uvozovat lomítkem. Použijme cokoliv, co se, pokud možno, v textu minimálně objevuje. Uvozovací znak v textu předřadíme zpětným lomítkem. Použijeme-li některou ze závorek, je počátečním znakem otevření koncovým uzavření (to platí pro (), {}, [] a <>). Používáme-li křížek jako uvozovací znak, nesmí před ním být bílé místo. V tom případě bude totiž brán jako komentář.
print q{řetězec jako v apostrofech: ' \n " $x \\ \/};
print q#řetězec jako v apostrofech: ' \n " $x \\ \/#;
print q #komentář#;
To samé lze dělat s qq.
print qq"řetězec jako v uvozovkách: ' \n \" $x \\ \/";