Anonymní data jsou nezbytná pro vytváření libovolně složitých datových struktur.
7.11.2006 06:00 | Jiří Václavík | přečteno 19800×
Podprogramy v Perlu nejsou schopny sami rozlišit, co jim je předáváno. Vše se slije do pole @_ a sám programátor musí v podprogramu pole znovu rozdělit. Problém je v tom, že seznamy mají libovolný počet prvků. Nelze tak zjistit hranici mezi předanými seznamy.
Existuje jediné (pomineme-li předání počtů prvků polí nebo jiné informace jako dalších argumentů) řešení - nepředávat seznam, ale pouze adresu, kde leží v paměti. Adresa je skalární hodnotou a tak netřeba hledat hranice mezi poli.
Předávání datových struktur pomocí odkazů je také efektivnější - pole zůstává v paměti na svém místě a odpadá tak jeho kopírování. U větších datových objemů to může mít vliv.
Ukažme si konkrétní ukázku podprogramu, který přijímá 2 pole. Napíšeme program na zjištění duplicitních hodnot z předaných polí.
my @pole1 = (1, 3, 5, 7);
my @pole2 = (1, 2, 4, 5);
my @spolecne_hodnoty = vrat_duplicity(\@pole1, \@pole2);
print "@spolecne_hodnoty\n";
sub vrat_duplicity {
my($r_p1, $r_p2) = @_;
my @spolecne_hodnoty;
foreach my $a (@$r_p1) {
foreach my $b (@$r_p2) {
push(@spolecne_hodnoty, $a) if $a == $b;
}
}
return @spolecne_hodnoty;
}
Podprogram přijímá jako argumenty 2 odkazy. Ty pak dereferencuje a pracuje s nimi jako s obyčejným polem.
Stejný postup - předávání polí pomocí odkazů - lze v případě potřeby uplatnit i při vracení výsledků z procedury. Podprogram procedura vrací odkaz na pole. Jeho hodnoty vytiskneme následovně.
$odkaz_na_pole = procedura(...);
print @$odkaz_na_pole;
Funkce ref přijímá jako parametr skalární proměnnou. Pokud tato proměnná není odkazem, vrací ref nepravdivou hodnotu. V opačném případě vrací datový typ hodnoty, na kterou odkaz ukazuje. ref vrací vždy jednu z těchto hodnot:
Hodnota | Popis |
"" (prázdný řetězec) | parametr funkce není odkazem |
SCALAR | skalár |
ARRAY | pole |
HASH | hash |
CODE | podprogram |
GLOB | typeglob |
REF | odkaz ukazuje na hodnotu, která je také odkazem |
jméno_balíku | balík, se kterým je odkaz svázán (v případě objektu) |
Anonymní data se používají pro vytváření složitých datových struktur, kde může jediná proměnná zpřístupňovat hluboce vnořená data.
Vytváření anonymních dat je v podstatě vytváření dat, ke kterým nebudeme mít přístup přes obyčejnou proměnnou. Jinými slovy, nemáme-li k určitým datům přímý přístup, ale máme jejich adresu, jsou tato data anonymní. Přistupovat k nim lze jen přes odkaz a ne jinak. Tabulka ilustruje skalární anonymní hodnotu v paměti.
Adresa | Hodnota | Proměnná |
3 | ||
4 | ||
5 | "HODNOTA" | |
6 | ||
7 | ||
8 | ||
9 | ||
10 | SCALAR(5) | $r_x |
11 |
K hodnotě "HODNOTA" neexistuje příslušná proměnná. Existuje ale jiná proměnná, ve které je adresa této hodnoty.
Pro jednoduchost jde v tabulce pouze o anonymní skalární data. Ty se ale prakticky nepoužívají. Mnohem větší význam mají anonymní pole, hashe a občas procedury.
Na úvod vytvoříme odkaz na pole.
@pole = (2, 3, 4);
$r_pole = \@pole;
To je klasické pojmenované pole tak, jak ho známe. A teď zkusíme udělat to samé, ale záměrně opustíme rozsah platnosti proměnné @pole.
{
my @pole = (2, 3, 4);
our $r_pole = \@pole;
}
Za blokem již neplatí proměnná @pole. Přesto data zůstávají alokována, protože na ně stále ukazuje globální proměnná $r_pole a čítač odkazů je na hodnotě 1. K poli nyní nelze přistupovat přímo, ale pouze přes odkaz. Jinými slovy, pole se stalo anonymním.
Tento postup je značně neohrabaný a pro tvoření rozsáhlých datových struktur ho použít nelze. Je na něm ale hezky vidět, co to anonymní data vlastně jsou.
V praxi to funguje jinak. Perl umožňuje definovat pole od začátku již jako anonymní. Postup je stejný jako u definice klasického pole, jen se seznam hodnot píše místo kulatých do hranatých závorek.
$r_pole = [2, 3, 4];
Prefixem proměnné $r_pole je dolar, neboť je stále pouze odkazem.
Analogicky lze vytvořit anonymní hashe. Tentokrát se používají složené závorky.
$r_hash = {"h1" => 2, "h2" => 3, "h3" => 4};
Nyní se jen pro zajímavost podívejme na tuto zajímavou situaci. Jak poznáme, kdy složené závorky označují blok a kdy jde o vytvoření odkazu na hash? Někdy to může kolidovat. Jako v tomto případě:
sub rret { { (2, 3, 4) } }
Teď je otázkou, zda budou vnitřní složené závorky brány jako blok nebo jako anonymní hash. Obojí bude z procedury vracet jinou hodnotu. Správně je v tomhle případě první možnost. Lepší je ale jednoznačně určit co je co:
sub rret { +{ (2, 3, 4) } }# + označuje, že jde o anonymní hash
sub rret { {; (2, 3, 4) } }# středník vylučuje anonymní hash - jde o blok
Další možností odkazů je vytvořit odkaz na konstantní skalární hodnotu. Ta je po vytvoření přístupná pouze pro čtení. Značí se zpětným lomítkem před výrazem.
$r_a = \11;
$r_b = \(3 + $$r_a);
$r_c = \"HODNOTA";
print $$r_a; #tiskne 11
print $$r_b; #tiskne 14
print $$r_c; #tiskne "HODNOTA"
Všechny proměnné $$r_a, $$r_b a $$r_c jsou pouze pro čtení. Jestli se je pokusíte měnit, vyskočí na vás:
Modification of a read-only value attempted
sub beze jména vrací odkaz na anonymní podprogram. Vyvolat ho lze předřazením znaku &.
$r_hello = sub { print "Hello world!\n"; };
&$r_hello();
Protože volání podprogramu je příkaz, píše se za ním středník.