LINUXSOFT.cz Přeskoč levou lištu

ARCHIV



   

> PostgreSQL (13) - Na co se zapomnělo

Třináctý díl (smolný ;-)) bude věnován věcem, na které se v prozatimním průběhu seriálu zapomnělo, nebo jiným způsobem spadly pod stůl. Při vší snaze o pozornost občas člověku prostě něco unikne. Především se bude jednat o nedostatky, na které mě upozornili sami čtenáři seriálu.

27.7.2005 06:00 | MaReK Olšavský | Články autora | přečteno 19557×

Schémata

Pro programátory ve jazyce C++ bude princip pochopení asi nejjednodušší. Schémata definují jmenné prostory, obsahující tabulky, procedury, objekty, datové typy, které se tak mohou stát duplicitními v rámci jedné databáze. Používají se v momentě, kdy je k dispozici jedna databáze (například na webhostingu) a je třeba, aby na ní fungovalo několik projektů, ve kterých se mohou vyskytovat stejné tabulky (například několik oddělených webshopů v rámci jedinné domény 2. řádu). MySQL by touto funkčností měla disponovat od řady 5 (alespoň dle dokumentace). Přístup k objektům schématu je realizován kvalifikovaným jménem, to znamená, že název objektu bude prodloužen o název schématu, do kterého přísluší oddělený tečkou, název schématu se dává na místo prefixu, tj. před název objektu.

Pro vytvoření schématu slouží příkaz CREATE SCHEMA [jmeno] [AUTHORISATION uzivatel][ element schematu[ ...]], kde jednotlivé položky mají následující význam:

  • jmeno pod kterým bude schéma dostupné. Není-li použito, je nutné zadat parametr AUTHORISATION
  • AUTHORISATION udává uživatele, který bude oprávněn k danému schématu přistupovat. Není-li nastaven název schématu, je toto jméno použito jako název schématu.
  • element schematu je například příkaz k vytvoření objektu (typu, stored procedury, tabulky) příslušného ke schématu. Jednotlivé příkazy se neoddělují středníky, ale ten je teprve za posledním z nich. Při vytváření těchto entit databáze není nutné používat kvalifikovaný (dlouhý) název, ale dostačuje krátký, entity lze definovat kdykoliv později.

Bohužel na rozdíl od standardu SQL není možné nastavit pro každé schema nastavit vlastní kódování. Pokud chce vývojář předejít problémům s potřebou různých znaků v různých jazycích, je už několik let obecným doporučením použití UTF-8, ale i zde číhá drobné nebezpečí a tím je řazení (v Česku se ch řadí za h, nikolivěk, jako v angličtině k c).

Pro zrušení schématu slouží příkaz DROP SCHEMA jmeno [, ...] [CASCADE | RESTRICT], kde jméno schématu je povinné (lze jich uvést několik, není třeba rušit každé zvlášť. Dalším parametrem je CASCADE, pro zrušení všech objektů patřících do tohoto schématu, nebo RESTRICT, kdy schéma není zrušeno, pokud obsahuje nějaké objekty.

Změna parametrů schématu se provádí příkazem ALTER SCHEMA. Před 8. řadou PgSQL bylo možné pouze změnit název schématu pomocí ALTER SCHEMA jmeno RENAME TO nove_jmeno, ale od 8. řady lze změnit i uživatele oprávněného k danému schématu přistupovat příkazem ALTER SCHEMA jmeno OWNER TO novy_vlastnik, přičemž tuto druhou operaci smí provádět jen superuživatel databáze.

Něco příkládků:

-- Vytvoreni schematu a tabulek najednou
CREATE SCHEMA keramika
  CREATE TABLE kategorie(id serial, jmeno varchar(200),
    popis text, zobrazovany char(1))
  CREATE TABLE zbozi(id bigserial, jmeno varchar(200),
    popis text, zobrazovany(1), cenabezdph decimal(10,2),
    skupinadph integer)
  CREATE TABLE skupinydph(id serial, jmeno varchar(200),
    sazba decimal(4,2))
  CREATE TABLE zbozi_kateg(id_zbozi bigint, id_kateg int);

-- Totez vytvorene postupne
CREATE SCHEMA keramika;
CREATE TABLE keramika.kategorie(id serial, jmeno varchar(200),
  popis text, zobrazovany char(1));
CREATE TABLE keramika.zbozi(id bigserial, jmeno varchar(200), 
  popis text, zobrazovany char(1), cenabezdph decimal(10,2),
  skupinadph integer);
CREATE TABLE keramika.skupinydph(id serial, jmeno varchar(200),
  sazba decimal(4,2));
CREATE TABLE keramika.zbozi_kateg(id_zbozi bigint, id_kateg int);
CREATE SCHEMA cms
  CREATE TABLE clanky(id serial, titulek varchar(200), perex text,
    obsah text, zobrazovany char(1));

-- Prejmenovani schematu a nasledna zmena vlastnika
ALTER SCHEMA keramika RENAME TO ker;
ALTER SCHEMA ker OWNER TO petr;

-- prace s daty ve schematu ker
INSERT INTO ker.kategorie(jmeno, popis, zobrazovany) VALUES
  ('Květináče 1','Květináče obyčejné','y');
INSERT INTO ker.kategorie(jmeno, popis, zobrazovany) VALUES
  ('Květináče 2','Květináče zdobené a bílé','y');
SELECT * FROM ker.kategorie;
...
	

Výběry (i joiny mezi tabulkami) jsou pochopitelně možné i mezi jednotlivými schématy. Pomocí kvalifikovaných jmen souborů. Byť třeba spojování tabulek mezi jednotlivými schématy může občas (ne vždy) svědčit o špatném návrhu databáze pro aplikace běžící nad ní. Samozřejmě že výběr, kdy je potřeba spojit tabulky z několika schémat smí provádět pouze uživatel, který má do všech potřebných schémat přístup.

INSERT INTO cms.clanky(titulek, perex, obsah, zobrazovany) VALUES
  ('První','První článeček vložený do redakčního systému','Toto ...',
  'y');
SELECT * FROM ker.kategorie LEFT JOIN cms.clanky ON 
  ker.kategorie.id=cms.clanky.id;
	

Pokud vývojář/správce žádné schéma nedefinuje, je použito implicitní schéma, které je pojmenováno 'public'. Pro přístup do tohoto schématu je možné kvalifikovaného jména public.tabulka, nebo pouze krátkého jména, kdy se použije pouze název tabulky. Pochopitelně, jsou-li v databázi definována schémata a není-li použito kvalifikovaného jména, je tabulka hledána ve schématu public.

Spojování tabulek (JOIN)

V sedmém dílu seriálu byly probírány základy výběru z tabulek, včetně jejich spojování pomocí klauzule JOIN. Od řady 7 tohoto databázového serveru přibyla možnost spojit tabulky bez uvedení spojovací podmínky (na tuto možnost autor zapoměl, protože ji nepoužívá). Zápis je poté o něco kratší a přehlednější, má ale drobné omezení. Aby server poznal, přes které sloupečky má použít spojovací tabulku, musí se tyto sloupce jmenovat stejně a měly by být stejného typu (?jak porovnat desetinné číslo a řetězec bez přetypování?). Pro příklady budou použity tabulky, které byly příslušné k 7. dílu. Zkrácený zápis je možné provést dvěma způsoby, z nichž napřed bude ukázán ten delší, který ale umožní předejít některým problémům krátkého zápisu, na něž bude upozorněno.

Prvním způsobem je požití klíčového slova USING místo booleanovského spojení patřičných prvků v části ON, příkaz pak může vypadat takto SELECT sloupce FROM tabulka1 [INNER [LEFT | RIGHT | FULL] | OUTER] JOIN tabulka2 USING (sl1, sl2);, kde část USING (sl1, sl2) je ekvivalentní zápisu ON (tabulka1.sl1=tabulka2.sl1 AND tabulka1.sl2=tabulka2.sl2).

Druhým způsobem je zápis i bez klíčového slova (části) USING, leč s přidáním klíčového slova NATURAL, dotaz pak vypadá takto SELECT * FROM tabulka1 NATURAL [INNER [LEFT | RIGHT | FULL] | OUTER] JOIN tabulka2;. Jak je vidět, chybí uvedení sloupců, čili databáze si musí najít sama sloupce které jsou stejného jména a typu a přes něž může spojení provést. Výhodou je kratší zápis, nevýhodou bude vymýšlení unikátních názvů sloupců, které jsou spojeny (na toto lze narazit při tvorbě cms (content management system), kdy rubriky i články budou mít datum poslední editace, ale steží jejich shoda bude spojovací podmínkou) a pravděpodobně toto spojení bude i pomalejší (autorem netestováno), než při implicitním vyjmenování sloupců.

Příklady:

-- budou spojeny spatne zaznamy, protoze navrh tabulek na
-- toto spojovani neni udelan
SELECT t1.id AS id, login, first_name, surename, email, visible FROM users AS t1
LEFT OUTER JOIN userdetails AS t2 USING(id);

SELECT t1.id AS id, login, first_name, surename, email, visible FROM users AS t1
NATURAL LEFT OUTER JOIN userdetails AS t2;
	

Omezení počtu řádek výběru

Všechny výběry, které zde byly dosud prezentovány vybíraly všechny záznamy z databáze odpovídající podmínkám, což sice může být použitelné v běžné aplikaci, ale například při tvorbě webových aplikací by toto mohlo být docela nepoužitelné. Jednou možností je vzít všechny záznamy, uložit si je do pole a přes toto pole posléze "stránkovat" v aplikaci, ale první nevýhoda je vidět hned na první pohled a tou jsou paměťové nároky na uložení takovéhoto pole. Druhým a mnohem lepší řešením je použití stránkování přímo v SQL dotazu, kdy se zadá číslo prvního záznamu a počet vrácených řádek, číslo řádku je v podstatě stránka*počet_řádek_na_stránce.

Příkazy, které toto řídí jsou LIMIT (počet_řádek | ALL) a OFFSET číslo_prvního_řádku, řádky jsou počítány od 0 (nuly). V MySQL režii těchto dvou příkazů obstarává pouze LIMIT start, počet_řádek, v případě použití jediného parametru je tento použit jako počet_řádek a start je nastaven na hodnotu 1 (slovy jedna). Číslování řádek je virtuální a řídí se uspořádáním výsledků, které je určeno klauzulí ORDER BY. Jak praví staré přísloví, šedivá je teorie, zelený strom života, mnohem lepší, než popis bude několik příkládků.

-- Ziskani prvniho radku
SELECT * FROM users ORDER BY login LIMIT 1;
-- ziskani 2 stranek po 2 uzivatelich razeno dle id
SELECT * FROM users ORDER BY id LIMIT 2 OFFSET 0;
SELECT * FROM users ORDER BY id LIMIT 2 OFFSET 2;
	

Závěrem

V tomto díle se autor pokusil napravit některé chybky a pozapomenuté informace, které se nabalili za několik předchozích dílů. V příštím díle budou probrány transakce, jakožto základní způsob udržení integrity dat v databázi i přes možné chyby, které mohou při komunikaci mezi databází a aplikací vzniknout.

Verze pro tisk

pridej.cz

 

DISKUZE

trik pro testovani dotazu nad velkymi tabulkami 28.7.2005 23:50 Petr Aubrecht




Příspívat do diskuze mohou pouze registrovaní uživatelé.
> Vyhledávání software
> Vyhledávání článků

28.11.2018 23:56 /František Kučera
Prosincový sraz spolku OpenAlt se koná ve středu 5.12.2018 od 16:00 na adrese Zikova 1903/4, Praha 6. Tentokrát navštívíme organizaci CESNET. Na programu jsou dvě přednášky: Distribuované úložiště Ceph (Michal Strnad) a Plně šifrovaný disk na moderním systému (Ondřej Caletka). Následně se přesuneme do některé z nedalekých restaurací, kde budeme pokračovat v diskusi.
Komentářů: 1

12.11.2018 21:28 /Redakce Linuxsoft.cz
22. listopadu 2018 se koná v Praze na Karlově náměstí již pátý ročník konference s tématem Datová centra pro business, která nabídne odpovědi na aktuální a často řešené otázky: Jaké jsou aktuální trendy v oblasti datových center a jak je optimálně využít pro vlastní prospěch? Jak si zajistit odpovídající služby datových center? Podle jakých kritérií vybírat dodavatele služeb? Jak volit vhodné součásti infrastruktury při budování či rozšiřování vlastního datového centra? Jak efektivně datové centrum spravovat? Jak co nejlépe eliminovat možná rizika? apod. Příznivci LinuxSoftu mohou při registraci uplatnit kód LIN350, který jim přinese zvýhodněné vstupné s 50% slevou.
Přidat komentář

6.11.2018 2:04 /František Kučera
Říjnový pražský sraz spolku OpenAlt se koná v listopadu – již tento čtvrtek – 8. 11. 2018 od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5). Tentokrát bez oficiální přednášky, ale zato s dobrým jídlem a pivem – volná diskuse na téma umění a technologie, IoT, CNC, svobodný software, hardware a další hračky.
Přidat komentář

4.10.2018 21:30 /Ondřej Čečák
LinuxDays 2018 již tento víkend, registrace je otevřená.
Přidat komentář

18.9.2018 23:30 /František Kučera
Zářijový pražský sraz spolku OpenAlt se koná již tento čtvrtek – 20. 9. 2018 od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5). Tentokrát bez oficiální přednášky, ale zato s dobrým jídlem a pivem – volná diskuse na téma IoT, CNC, svobodný software, hardware a další hračky.
Přidat komentář

9.9.2018 14:15 /Redakce Linuxsoft.cz
20.9.2018 proběhne v pražském Kongresovém centru Vavruška konference Mobilní řešení pro business. Návštěvníci si vyslechnou mimo jiné přednášky na témata: Nejdůležitější aktuální trendy v oblasti mobilních technologií, správa a zabezpečení mobilních zařízení ve firmách, jak mobilně přistupovat k informačnímu systému firmy, kdy se vyplatí používat odolná mobilní zařízení nebo jak zabezpečit mobilní komunikaci.
Přidat komentář

12.8.2018 16:58 /František Kučera
Srpnový pražský sraz spolku OpenAlt se koná ve čtvrtek – 16. 8. 2018 od 19:00 v Kavárně Ideál (Sázavská 30, Praha), kde máme rezervovaný salonek. Tentokrát jsou tématem srazu databáze prezentaci svého projektu si pro nás připravil Standa Dzik. Dále bude prostor, abychom probrali nápady na využití IoT a sítě The Things Network, případně další témata.
Přidat komentář

16.7.2018 1:05 /František Kučera
Červencový pražský sraz spolku OpenAlt se koná již tento čtvrtek – 19. 7. 2018 od 18:00 v Kavárně Ideál (Sázavská 30, Praha), kde máme rezervovaný salonek. Tentokrát bude přednáška na téma: automatizační nástroj Ansible, kterou si připravil Martin Vicián.
Přidat komentář

   Více ...   Přidat zprávičku

> Poslední diskuze

31.7.2023 14:13 / Linda Graham
iPhone Services

30.11.2022 9:32 / Kyle McDermott
Hosting download unavailable

13.12.2018 10:57 / Jan Mareš
Re: zavináč

2.12.2018 23:56 / František Kučera
Sraz

5.10.2018 17:12 / Jakub Kuljovsky
Re: Jaký kurz a software by jste doporučili pro začínajcího kodéra?

Více ...

ISSN 1801-3805 | Provozovatel: Pavel Kysilka, IČ: 72868490 (2003-2024) | mail at linuxsoft dot cz | Design: www.megadesign.cz | Textová verze