LINUXSOFT.cz Přeskoč levou lištu

ARCHIV



   

> PostgreSQL (21) - Spojování dotazů

PostgreSQL umí spojovat výsledky několika dotazů do jediného výsledku. Je několik variant a několik omezení. Těchto možností lze využívat například při vytváření RSS pro celý server (blog, webzine, portál).

17.5.2006 06:00 | MaReK Olšavský | Články autora | přečteno 16100×

Spojování dotazů

Všechny výběry z databáze, které se zatím v seriálu objevovaly, se vešly do jediného SELECTu. Ne vždy je toto reálné. Například výše zmíněná tvorba jednoho RSS pro celé www stránky může obsahovat položky z článků, novinek, nového software, ... Pak je zapotřebí buď mít tabulku, kam se dávají data jen pro tvorbu RSS, nebo ve scriptu srovnat výsledky několika dotazů (ale to znamená výrazně vyšší režii na straně scriptovacího serveru), případně mnohem elegantněji využít možností spojení několika dotazů do jediného výsledku.

Toto spojení výběrů má jediné menší omezení. Aby bylo proveditelné, je třeba mít vybírané sloupce stejného typu (tzn. nemusí se jmenovat stejně). Textová pole můžete kombinovat s pevnou i proměnnou délkou (CHAR, VARCHAR, TEXT), číselné typy k sobě bez ohledu na jejich konkrétní typ a datumy také.

Spojení výsledků z několika dotazů na několika tabulkách do jediné množiny výsledků je možné několika způsoby, buď jsou zahrnuty všechny výsledky (UNION ALL mezi příkazy SELECT), nebo jsou vyloučeny multiplicitní hodnoty (prostý UNION), vybrání hodnot z tabulky, které nejsou v následujícím SELECTu (klauzule EXCEPT) a poslední variantou je vybrání pouze multiplicitních hodnot (spojovník INTERSECT). Názvy sloupečků, jak je uvidíte ve výběru, jsou podle prvního SELECTU v řadě, který je prováděn. Použití modifikátoru ALL má neelementárně jasná pravidla:

  • UNION - vrátí prostě všechny řádky
  • EXCEPT - jestliže se řádek (vybíráte-li jen některé sloupce tak je pravděpodobná duplicita hodnot) opakuje v tabulce před EXCEPT m× a v tabulce za EXCEPT n×, bude ve výsledku max(m-n,0)×
  • INTERSECT - jestliže se řádek (vybíráte-li jen některé sloupce tak je pravděpodobná duplicita hodnot) opakuje v tabulce před INTERSECT m× a v tabulce za INTERSECT n×, bude ve výsledku min(m,n)×

Protože více, než rozebírání teorie pomohou příklady, nadefinujeme nyní několik tabulek, které se mohou vyskytnout v běžném CMS (content management system), samozřejmě, že v plném systému jsou tabulky podstatně rozsáhlejší, kde jsou tabulky pro články, novinky a software ke stažení:

CREATE TABLE articles(
articles_id BIGSERIAL,
title CHARACTER VARYING(200),
perex CHARACTER VARYING(1000),
content TEXT,
add_date timestamp without time zone DEFAULT '01-01-0001 00:00:00' NOT NULL
);

CREATE TABLE news(
news_id BIGSERIAL,
title CHARACTER VARYING(200),
content CHARACTER VARYING(1000)
add_date timestamp without time zone DEFAULT '01-01-0001 00:00:00' NOT NULL
);

CREATE TABLE downloads(
downloads_id BIGSERIAL,
name CHARACTER VARYING(200),
description TEXT,
filename CHARACTER VARYING(500)
add_date timestamp without time zone DEFAULT '01-01-0001 00:00:00' NOT NULL
);

-- vlozeni hodnot, je na libovuli studenta tohoto serialu :-)

-- vyber hodnot ze vsech tabulek, s potlacenim duplicit
(SELECT title, perex FROM articles
UNION
SELECT title, content FROM news
UNION
SELECT name, description FROM downloads
) ORDER BY title;

-- vyber hodnot ze vsech tabulek, vcetne duplicit
(SELECT title, perex FROM articles
UNION ALL
SELECT title, content FROM news
UNION ALL
SELECT name, description FROM downloads
) ORDER BY title;

-- Vybrani pouze nazvu a textu/popisu z radku, ktere jsou ve vsech tabulkach
-- s potlacenim duplicitnich radku
(SELECT title, content FROM news
INTERSECT
SELECT name, description FROM downloads
) ORDER BY title;

-- Vybrani pouze nazvu a textu/popisu z radku, ktere jsou ve vsech tabulkach
-- vcetne duplicitnich radku
(SELECT title, content FROM news
INTERSECT
SELECT name, description FROM downloads
) ORDER BY title;

-- Vybrani pouze nazvu a textu/popisu z radku ktere jsou v prvni tabulce,
-- ale nejsou v druhe
(SELECT title, content FROM news
EXCEPT
SELECT name, description FROM downloads
) ORDER BY title

-- Vybrani poslednich 5 zaznamu napric tabulkami, pravdepodobne nejvhodnejsi
-- vyber pro generovani RSS
(SELECT title, perex, add_date FROM articles
UNION
SELECT title, content, add_date FROM news
UNION
SELECT name, description, add_date FROM downloads
) ORDER BY add_date ASC LIMIT 5;

Pokud jste si naplnili data rozumně (a nemáte stejné id například pro oznámení nového programu ke stažení v novinkách a v downloads), máte v tabulkách duplicity a budete vybírat i id, setkáte se s tím, že neodfiltrujete duplicitní záznamy. Aby PostgreSQL umělo duplicity vyřadit (stejný problém se bude týkat i MySQL), musí být všechny hodnoty 100% shodné.

Pokud budete tvořit výše uvedené RSS, budete kromě hodnot potřebovat i identifikovat, ze které tabuky data pochází, protože je pak zapotřebí podle tohoto dodatečného sloupce nasměrovat odkaz na správný script. Pro toto lze použít přímé vložení hodnoty do výběru, kvůli striktnosti PgSQL serveru explicitně přetypované na text a pro pořádek pojmenované podle pořeby, zde tablename:

(SELECT 'articles'::text AS tablename, articles_id AS id, title, 
perex FROM articles
UNION
SELECT 'news'::text, news_id, title, content FROM news
UNION
SELECT 'downloads'::text, downloads_id, name, description FROM downloads
) ORDER BY tablename, id;

Omezení na počet řádek a případné seřazení výsledků se zadává za poslední příkaz SELECT, klauzule WHERE. Omezující výstupní řádky je třeba umístit za jednotlivé SELECTy (vztahuje se tedy partikulárně na každý výběr, nelze jej udělat pro omezení celku). V případě, že potřebujete kombinovat více SELECTů a navíc Vám přistupují kombinace UNION (ALL), INTERSECT (ALL) a EXCEPT (ALL), je vhodné pomocí závorek vymezit priority jednotlivých kombinací, například tab1 UNION tab2 INTERSECT tab3 je bez závorek ekvivalentní zápisu tab1 UNION (tab2 INTERSECT tab3).

Závěrem

Spojováním dotazů lze výrazným způsobem odlehčit zátěži PostgreSQL serveru, potažmo aplikaci, protože jediným dotazem získáme data, která potřebujeme a jak potřebujeme, proto není nutné v aplikaci data "přerovnávat". V příštím díle se podíváme na podvýběry (SELECTy jako součást dalších dotazů a příkazů).

Verze pro tisk

pridej.cz

 

DISKUZE

Odlehčení 19.5.2006 23:49 Lukáš Zapletal
L Re: Odlehčení 22.5.2006 09:50 MaReK Olšavský
  L Re: Odlehčení 23.5.2006 15:42 Lukáš Zapletal
    L Re: Odlehčení 1.6.2006 19:18 sirt2
      L Re: Odlehčení 1.6.2006 20:02 Aleš Hakl
        L Re: Odlehčení 2.6.2006 08:36 Petr Zajíc
vyhladavanie cez string bez diakritiky 23.5.2006 12:58 blindmen
  L Re: vyhladavanie cez string bez diakritiky 23.5.2006 15:47 Lukáš Zapletal
    |- Re: vyhladavanie cez string bez diakritiky 23.5.2006 17:00 blindmen
    | |- Re: vyhladavanie cez string bez diakritiky 24.5.2006 07:19 Petr Zajíc
    | L Re: vyhladavanie cez string bez diakritiky 24.5.2006 18:53 Lukáš Zapletal
    L Re: vyhladavanie cez string bez diakritiky 11.10.2006 10:21 Tomk




Příspívat do diskuze mohou pouze registrovaní uživatelé.
> Vyhledávání software
> Vyhledávání článků

28.11.2018 23:56 /František Kučera
Prosincový sraz spolku OpenAlt se koná ve středu 5.12.2018 od 16:00 na adrese Zikova 1903/4, Praha 6. Tentokrát navštívíme organizaci CESNET. Na programu jsou dvě přednášky: Distribuované úložiště Ceph (Michal Strnad) a Plně šifrovaný disk na moderním systému (Ondřej Caletka). Následně se přesuneme do některé z nedalekých restaurací, kde budeme pokračovat v diskusi.
Komentářů: 1

12.11.2018 21:28 /Redakce Linuxsoft.cz
22. listopadu 2018 se koná v Praze na Karlově náměstí již pátý ročník konference s tématem Datová centra pro business, která nabídne odpovědi na aktuální a často řešené otázky: Jaké jsou aktuální trendy v oblasti datových center a jak je optimálně využít pro vlastní prospěch? Jak si zajistit odpovídající služby datových center? Podle jakých kritérií vybírat dodavatele služeb? Jak volit vhodné součásti infrastruktury při budování či rozšiřování vlastního datového centra? Jak efektivně datové centrum spravovat? Jak co nejlépe eliminovat možná rizika? apod. Příznivci LinuxSoftu mohou při registraci uplatnit kód LIN350, který jim přinese zvýhodněné vstupné s 50% slevou.
Přidat komentář

6.11.2018 2:04 /František Kučera
Říjnový pražský sraz spolku OpenAlt se koná v listopadu – již tento čtvrtek – 8. 11. 2018 od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5). Tentokrát bez oficiální přednášky, ale zato s dobrým jídlem a pivem – volná diskuse na téma umění a technologie, IoT, CNC, svobodný software, hardware a další hračky.
Přidat komentář

4.10.2018 21:30 /Ondřej Čečák
LinuxDays 2018 již tento víkend, registrace je otevřená.
Přidat komentář

18.9.2018 23:30 /František Kučera
Zářijový pražský sraz spolku OpenAlt se koná již tento čtvrtek – 20. 9. 2018 od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5). Tentokrát bez oficiální přednášky, ale zato s dobrým jídlem a pivem – volná diskuse na téma IoT, CNC, svobodný software, hardware a další hračky.
Přidat komentář

9.9.2018 14:15 /Redakce Linuxsoft.cz
20.9.2018 proběhne v pražském Kongresovém centru Vavruška konference Mobilní řešení pro business. Návštěvníci si vyslechnou mimo jiné přednášky na témata: Nejdůležitější aktuální trendy v oblasti mobilních technologií, správa a zabezpečení mobilních zařízení ve firmách, jak mobilně přistupovat k informačnímu systému firmy, kdy se vyplatí používat odolná mobilní zařízení nebo jak zabezpečit mobilní komunikaci.
Přidat komentář

12.8.2018 16:58 /František Kučera
Srpnový pražský sraz spolku OpenAlt se koná ve čtvrtek – 16. 8. 2018 od 19:00 v Kavárně Ideál (Sázavská 30, Praha), kde máme rezervovaný salonek. Tentokrát jsou tématem srazu databáze prezentaci svého projektu si pro nás připravil Standa Dzik. Dále bude prostor, abychom probrali nápady na využití IoT a sítě The Things Network, případně další témata.
Přidat komentář

16.7.2018 1:05 /František Kučera
Červencový pražský sraz spolku OpenAlt se koná již tento čtvrtek – 19. 7. 2018 od 18:00 v Kavárně Ideál (Sázavská 30, Praha), kde máme rezervovaný salonek. Tentokrát bude přednáška na téma: automatizační nástroj Ansible, kterou si připravil Martin Vicián.
Přidat komentář

   Více ...   Přidat zprávičku

> Poslední diskuze

31.7.2023 14:13 / Linda Graham
iPhone Services

30.11.2022 9:32 / Kyle McDermott
Hosting download unavailable

13.12.2018 10:57 / Jan Mareš
Re: zavináč

2.12.2018 23:56 / František Kučera
Sraz

5.10.2018 17:12 / Jakub Kuljovsky
Re: Jaký kurz a software by jste doporučili pro začínajcího kodéra?

Více ...

ISSN 1801-3805 | Provozovatel: Pavel Kysilka, IČ: 72868490 (2003-2024) | mail at linuxsoft dot cz | Design: www.megadesign.cz | Textová verze