Kromě vybírání dat je rovněž potřebujeme nějak rozumně řadit (a to nejenom podle abecedy). V dnešním díle seriálu o MySQL se podíváme, jak na to.
10.5.2005 15:00 | Petr Zajíc | přečteno 78532×
Data mohou být do databáze vkládána v nahodilém pořadí. Často je
však potřebujeme prezentovat v nějaké setříděné formě. Je jasné, že
MySQL na to musí mít nějaké nástroje. A my je dnes prozkoumáme.
Příkaz SELECT může být následován klauzulí ORDER BY, která zajistí
seřazení výsledné množiny záznamů podle nějakého výrazu. Tím "nějakým
výrazem" je nejčastěji hodnota polí ve sloupci, ale jak ještě uvidíme,
nemusí to tak být vždy. Řadit můžeme nejen podle čísel, ale i podle
datumů (databáze si poradí s lahůdkami typu přechodných roků), a
samozřejmě podle řetězců.
Tip.: Řetězce se porovnávají
způsobem, který je definován při tvorbě tabulky pomocí slova collate.
Jestliže žádné řazení nedefinujete, bývá pro řetězce použito výchozí
řazení databáze, případně serveru. Je to častým námětem diskusí a ještě
o tom bude řeč.
Jestliže je požadováno jak filtrování, tak i řazení, musí být klauzule WHERE uvedena před klauzulí ORDER BY. Následuje několik příkladů:
select * from faktury
order by datum;
select * from knihy where cena >= 500 order by nazev;
Další příklady ukazují pro jistotu i nesprávnou syntaxi:
select * from faktury
orderby datum;
select * from knihy order by nazev where cena >= 500;
V prvním případě jsem vynechal mezeru mezi "order" a "by". Ta mezera
tam skutečně musí být. To se vám může v zápalu psaní stát docela často.
Ve druhém případě jsem umístil řazení před filtrování (to se vám moc
často stávat nebude; příkaz SELECT je totiž přes svoji složitost
poměrně intuitivní).
Často budete potřebovat řadit ne podle jednoho sloupce, ale podle více údajů najednou. Například budete chtít faktury seřadit podle data vydání a faktury se stejným datem vystavení ještě podle ceny. Není to žádný problém, když si uvědomíte, že ORDER BY může přijímat seznam výrazů. Řadí pak zleva doprava. Náš příklad bychom tedy mohli napsat asi takhle:
select * from faktury
order by datum, cena;
Řazení podle více sloupců je samozřejmě časově náročnější než řazení podle jednoho sloupce; v praxi se to však používá docela často. Všechna řazení, o nichž jsme zatím mluvili, byla vzestupná. To znamená, že čísla se řadila od menších k větším, události v čase od starších k novějším a řetězce od A do Z. Často ale můžeme potřebovat opačnou věc. Tak třeba bezpečnostní protokol uložený v databázi můžeme chtít seřadit od nejnovějších událostí ke starším. Není to problém. Stačí uvést směr řazení pomocí klíčového slova DESC (descending = sestupně):
select * from protokol
order by datum desc;
Existuje i klauzule ASC (ascending = vzestupně); jestliže se nepoužije, program ji dosadí automaticky. Při řazení podle více sloupců lze samozřejmě kombinovat, takže následující zápis je správný a udělá to, co má:
select jmeno, prijmeni,
datum_nastupu from zamestnanci
order by datum nastupu desc, prijmeni asc, jmeno;
Při práci s databází se snadno můžeme dostat do situace, kdy potřebujeme řadit podle určitého sloupce ve výsledné sadě záznamů, přičemž neznáme předem jeho název. Například můžete chtít napsat obecnou proceduru, která seřadí dodanou sadu podle prvního sloupce. MySQL to umí - stačí místo názvu sloupce v klauzuli ORDER BY uvést jeho pořadové číslo. Takže například následující zápisy jsou rovnocenné:
select id, cislo, datum
from smlouvy order by datum;
select id, cislo, datum from smlouvy order by 3;
Ale pozor - v kombinaci s "hvězdičkovým" příkazem SELECT to může být
poměrně ošemetné. Chcete li řadit například podle třetího sloupce a
zároveň nemáte ani ponětí, v jakém pořadí databáze vrátí sloupce,
pravděpodobně seřadíte data jinak, než jste zamýšleli.
Následující věc nejlépe vysvětlím na příkladu: Dejme tomu, že budete chtít seřadit jednotlivé státy na světě (a třeba je poskytnout webové aplikaci jako podklady pro formulář):
create table staty(nazev
varchar (30));
insert into staty values ('Andorra');
...
insert into staty values ('Česká republika');
...
insert into staty values ('Slovenská republika');
...
insert into staty values ('Zambie');
Asi na to půjdete takto:
select nazev from staty
order by nazev;
Jenomže časem za vámi přijde šéf a bude chtít, abyste na začátek seznamu dali ČR, pak SR a zbytek už podle abecedy. Je to jednoduché, pokud si uvědomíme, že součástí klauzule ORDER BY může být i výraz:
SELECT * FROM staty
order by (nazev='Česká republika') DESC,
(nazev='Slovenská republika') DESC, nazev
Nejprve budeme řadit podle logického výrazu "je to Česká
republika?", pak totéž pro Slovensko a zbytek podle abecedy. Protože
však chceme, aby ČR a SR byly nahoře a protože logická jednička se řadí
POD logickou nulu, musíme v prvních dvou případech řadit sestupně. Celý
výraz by se pochopitelně dal přepsat pomocí predikátu IN.
Až na malé výjimky byste se měli bránit řazení v cílových aplikacích a měli byste nechat řadit MySQL. Důvodem je fakt, že řazení data v databázích prošlo dlouhým vývojem a je silně optimalizováno. Bude tak v naprosté většině případů mnohem rychlejší než cokoli, co byste snad vymysleli sami. Pokud je databáze na jiném (a typicky silnějším) stroji než aplikace, je to o důvod navíc nechat všechnu "špinavou práci" s řazením na MySQL.