Perl (73) - DBM

Perl Jednou z aplikací funkce tie je také systém DBM, který slouží k perzistentnímu uchovávání datových struktur.

30.9.2008 08:00 | Jiří Václavík | přečteno 15226×

Běžným způsobem uložení dat je soubor. Soubory se výborně hodí pro předávání dat. Horší to však už je s jejich úpravou. Vytvoření, smazání a ještě oříznutí zvládneme celkem snadno. Ale jak třeba přidat nebo ubrat text z jeho prostředku? Nebo jak ze souboru získat jednu konkrétní informaci, o níž netušíme, na které pozici je? Tady už máme problém. Je zřejmé, že si s pouhými soubory vždy nevystačíme.

Abychom vyřešili náš problém, můžeme použít databázi. Databáze jsou obecně nějaká data s prostředky pro manipulaci s nimi, které jsou dostupné oprávněným uživatelům.

Pro pouhé ukládání seznamů ve formátu klíč - hodnota lze použít databázi DBM. Pokud potřebujeme něco komplexnějšího, použijeme některou z nabídky SQL databází.

Ukládání hashů

Jak již bylo zmíněno, DBM (DataBase Manager) slouží pro uchovávání dat o struktuře klíč - hodnota. To je v podstatě perzistentní uchovávání hashových proměnných.

Tato jednoduchost má své výhody i nevýhody. Největší výhodou je náročnost. Mimo Perlu a několika modulů nepotřebujeme nic.

Nevýhodou jsou zejména malé možnosti struktury ukládání dat. Tuto nevýhodu částečně eliminují různé postupy, pomocí kterých lze ukládat složitější datové struktury do řetězce.

DBM pro svoji činnost využívá mechanizmu tie. Pomocí něj napojíme nějaký hash na příslušnou třídu: DB_File nebo jí podobnou.

Předvedeme si jednoduché použití knihovny Berkeley DB - tedy modulu DB_File. Vytvoříme program pro správu dat. Po jeho spuštění se objeví menu, které nabídne tři možnosti - Přidat nebo odebrat položku a výpis položek. Tyto datové položky budou perzistentní - budou uloženy i poté, co program skončí a při dalším spuštění je opět načteme.

use DB_File;

my %hash;
$SIG{"INT"} = sub {untie %hash; exit;};

tie %hash, "DB_File", "data.db" or die;
while(1){
    print "1. Přidat\n2. Odebrat\n3. Zobrazit\n";
    my $p = <STDIN>;
    my($polozka, $hodnota);
    if(/^1/){
        print "Zadej položku: "; chomp($polozka = <STDIN>);
        print "Zadej hodnotu: "; chomp($hodnota = <STDIN>);
        $hash{$polozka} = $hodnota;
    }elsif($p =~ /^2/){
        print "Zadej položku: "; chomp($polozka = <STDIN>);
        delete $hash{$polozka};
    }elsif($p =~ /^3/){
        printf "%-20s %-20s\n", $_, $hash{$_} for sort keys %hash;
    }else{
        last;
    }
}
untie %hash;

Mimo Berkeley DB lze použít ODBM (modul ODBM_File), Simple DBM (SDBM_File), New DBM (NDBM_File) nebo GNU DBM (GDBM_File). Tyto knihovny se mimo jiné liší formátem zápisu, takže knihovnu SDBM nelze číst přes GDBM apod. Nicméně práce s nimi je velmi podobná. Také existuje modul AnyDBM_File, který použije tu nejlepší dostupnou variantu. V jeho dokumentaci najdete mimo jiné i srovnání těchto variant podle kritérií.

Pokud nepoužíváme Berkeley DB, je třeba zadat mód otevření a přístupová práva, jež budou aplikována na datový soubor.

use POSIX;
tie %hash, "NDBM_File", "data.db", O_RDWR|O_CREAT, 0644 or die;

Další možnost, jak pracovat s DBM vede přes zvláštní funkci dbmopen, která funguje podobně jako tie.

Pro smazání všech položek seznamu stačí přiřadit do navázaného hashe prázdný seznam.

Ukládání složitých datových struktur

Pokud chceme jako hodnoty hashe v DBM použít něco jiného než skaláry, musíme sáhnout k tomu určeným nástrojům.

V 48. dílu seriálu jsme si představili dva moduly - Storable a Data::Dumper. Tyto moduly umožňují převést libovolnou datovou strukturu Perlu na řetězec a zpět. A abychom nemuseli ručně používat jeden z těchto modulů, existuje přímo modul s názvem MLDBM (MultiLevel DBM), který to dělá automaticky.

MLDBM ke své činnosti potřebuje jeden z modulů Data::Dumper, FreezeThaw nebo Storable. Data::Dumper je implicitní. Nastavit lze také který modul implementace DBM bude používán. Na výběr máme DB_File, SDBM_File (implicitní), NDBM_File nebo GDBM_File.

Nejprve tedy vyzkoušíme uložení do souboru. Použijeme přitom modul Storable a DB_File.

use MLDBM qw(DB_File Storable);
my %hash;
tie %hash, "MLDBM", "data.db";

%hash = (
    "klic0" => ["hodnota0A", "hodnota0B"],
    "klic1" => ["hodnota1A", "hodnota1B", "hodnota1C"],
    "klic2" => ["hodnota2A", "hodnota2B", "hodnota2C"],
    "klic3" => ["hodnota3A", "hodnota3B"]
);
untie %hash;

Nyní můžeme ze souboru data.db číst. Vytiskneme celou uloženou strukturu pomocí Data::Dumper.

use MLDBM qw(DB_File Storable);
use Data::Dumper;

my %hash;
tie %hash, "MLDBM", "dbm_struct.db";
print Dumper \%hash;
untie %hash;

Menší problém nastane, pokud budeme chtít měnit zanořená data. V takovém případě nelze přistupovat přímo přes strukturu, ale musíme pomocí jiných proměnných změnit odkazy. Tedy asi takto.

my $tmp = $hash{"klic2"};
$tmp = "NOVA HODNOTA";
$hash{"klic2"} = $tmp;
Online verze článku: http://www.linuxsoft.cz/article.php?id_article=1560