PostgreSQL (8) - SELECT II.

Další možnosti výběru dat z PostgreSQL, tentokráte se zaměřením na funkce pro zpracování dat a operace s daty z výběru.

4.4.2005 06:00 | MaReK Olšavský | přečteno 24088×

Při výběru dat z tabulky je efektivnější a rychlejší zpracovat pokud možno co největší část dat zpracovat ihned na straně PostgreSQL serveru. Pro zpracování číselných dat jsou k dispozici aritmetické operace a funkce. Funkce a operátory lze kombinovat a zanořovat stejně, jako v každém programovacím jazyce, jediným rozdílem je, že se výsledek nepřiřazuje do proměnné. Název, pod kterým bude výsledná hodnota vrácena lze určit klíčovým slovem AS.

Syntaxe zápisu operátorů a funkcí je uvedena níže. Na místě proměnných mohou být hodnoty vybrané z tabulky (tj. názvy sloupců), ale i konstanty zadané SQL dotazu a funkce nezávislé na datech (aktuální datum/čas, náhodné číslo,...).

SELECT a operator b AS jmeno ...
SELECT a oper1 (b oper2 c) AS jmeno ...
SELECT fce1(a) AS jmeno ...
SELECT fce2(a oper1 fce2(b)) AS jmeno ...

Operace s číselnými daty

Operace s číselnými hodnotami jsou standardní,pro celá čísla jsou k dispozici logické operace. Níže uvedená tabulka uvádí základní aritmetické operátory.

operátor popis příklad
+ součet
      SELECT 2 + 5 AS soucet;
      soucet
      ------
      7
    
- rozdíl
      SELECT 8 - 3 AS rozdil
      rozdil
      ------
      5
    
* součin
      SELECT 3 * 5 AS soucin
      soucin
      ------
      15
    
/ podíl, jestliže jsou obě čísla celá, jsou desetinná místa oříznuta
      SELECT (25.0 / 2.0) AS podil1, 25 / 2 AS podil2;
      soucin1 | soucin2
      -----------------
      12.5    | 12
    
% modulo, zbytek celočíselného dělení
      SELECT 17 % 5 AS zbytek;
      zbytek
      ------
      2
    
^ umocnění
      SELECT 2^5 AS umocneni
      umocneni
      --------
      32
    
|/ druhá odmocnina
      SELECT |/16 AS odmocnina2;
      odmocnina2
      ----------
      4
    
||/ třetí odmocnina
      SELECT ||/64.0 AS odmocnina3;
      odmocnina3
      ----------
      4
    
! faktoriál (přípona)
      SELECT 5! as fakt;
      fakt
      ----
      120
    
!! faktoriál (předpona)
      SELECT !!6 as fakt;
      fakt
      ----
      720
    
@ absolutní hodnota
      SELECT @(-3 - 5) AS abs;
      abs
      ---
      8
    
& bitový součin
      SELECT 12 & 5 AS logsoucin;
      logsoucin
      ---------
      4
    
| bitový součet
      SELECT 12 | 5 AS logcoucet;
      logsoucet
      ---------
      13
    
# exclusivní bitový součet
      SELECT 5#4 AS xor1, 12#16 AS xor2, 21#42 as xor3;
       xor1 | xor2 | xor3 
       -----+------+------
          1 |   28 |   63
    
~ bitová negace
      SELECT ~17 AS negace;
      negace
      ------
      -18
    
<< bitový posun doleva
(za operátorem se uvádí o kolik bitů je posun)
      SELECT 1<<5 AS lposun;
      lposun
      ------
      32
    
>> bitový posun doprava
(za operátorem se uvádí o kolik bitů je posun)
      SELECT 132>>2 AS pposun;
      pposun
      ------
      33
    

Exklusivní bitového součet (XOR) je definová tak, že jsou-li na stejné pozici (míněno stejném bitu) stejné hodnoty, je výsledkem v tomto bitu 0, liší-li se tyto hodnoty, tj jedna je 0 a druhá je jedna, je výsledkem tohoto bitového součtu hodnota 1. Tento operátor se používá často v hrách a při šifrování.

Kromě běžných aritmetických přistupují i operátory pro práci s binárními řetězci (BIT, BIT VARYING). Binární řetězce pro operace &, # a | musí mít stejnou délku, bitové posuny zachovávají délku původního řetězce a neuchovávají bit, který "přetekl". Pro upřesnění toho, že se jedná i bitová pole lze dát před konstantu prefix "B", toto je podobné, jako v jazyce C/C++. Níže jsou uvedeny již jen příklady bez vysvětlování významu operátorů.

SELECT B'10101' & B'10011' AS bitsoucin;
SELECT B'10101' | B'10011' AS bitsoucet;
SELECT B'10101' # B'10011' AS bitxor;
SELECT ~B'10101' AS bitnot;
SELECT B'10101' << 2 AS lposun;
SELECT B'10011' >> 3 AS pposun;

Číselné funkce

Funkce pro práci s desetinnými čísly (přesnost double precision) jsou v PostgreSQL implementovány pomocí knihoven na hostitelském systému jejich přesnost je proto ne tomto do značné míry závislá. Tzn., že ne 64 bitovém systému by měla být vyšší přesnost, než na 32 bitovém. Některé z operátorů jsou ekvivalentní níže uvedeným funkcím.

V níže uvedém seznamu funkcí je použito označení [dp], pokud je výstupní hodnota typu double precission, nebo je vyžadován vstup tohoto typu. Jestliže je návratová hodnota funkce stejného typu, jako vstupní hodnota, je uvedena zkratka [st], případně bude uveden jiný typ, jako je numeric, decimal...

funkce návratový typ popis příklad
abs(x) [st] absolutní hodnota SELECT abs(-5) AS abshodn;
cbrt([dp]) [dp] druhá odmocnina SELECT cbrt(15) AS odm2
ceil([dp])
ceil(numeric)
[st] nejmenší celé číslo, ne menší než vstup SELECT ceil(25.3) AS ceil1;
SELECT ceil(-25.3) AS ceil2;
degrees([dp]) [dp] převod radiánů na stupně SELECT degrees(.25) AS uhelstupne;
exp([dp])
exp(numeric)
[st] přirozená mocnina (ekvivalentní e^x) SELECT exp(7.3) AS exphodh;
floor([dp])
floor(numeric)
[st] největší celé číslo, ne větší než vstup SELECT floor(4.8) AS floor1;
SELECT floor(-4.8) AS floor2;
ln([dp])
ln(numeric)
[st] přirozený logaritmus SELECT ln(677.0) AS prirlog;
log([dp])
log(numeric)
[st] logaritmus při základu 10 (deset, ne 2 ve dvojkové soustavě) SELECT log(15) AS desetlog;
log(a,b)
a, b typu numeric
numeric logaritmus čísla a při základu b SELECT log(15,5) AS baselogar;
mod(a,b) [st] zbytek celočíselného dělení a/b SELECT mod(15,4) AS zbytek;
pi() [dp] hodnota pí SELECT pi();
pow(a,b)
a,b jsou [dp], případně numeric
[dp], případně numeric umocnění a na b (a^b) SELECT pow(3,2.5);
radians([dp]) [dp] převod velikosti úhlu z radiánů na stupně SELECT radians(90);
random() [dp] Náhodné číslo v rozsahu 0.0-1.0 SELECT 5*random();
round([dp])
round(numeric)
[st] Zaokrouhlení SELECT round(3.45);
round(a,b)
a,b typu [dp], nebo numeric
numeric zaokrouhlení čísla a na b desetinných míst SELECT round(3.5527,3);
sign([dp])
sign(numeric)
[st] znaménko čísla, -1 je-li záporné, 0 je-li O, 1 je-li kladné SELECT sign(-3.5);
sqrt([dp])
sqrt(numeric)
[st] druhá odmocnina čísla SELECT sqrt(.64);
trunc([dp])
trunc(numeric)
[st] oříznutí o desetinnou část SELECT trunc(2.99);
trunc(a,b)
a typu numeric, b je typu integer
numeric oříznutí a na b desetinných míst SELECT trunc(3.1179,2);
acos([dp]) [dp] arcus cosinus (inverzní fce ke cos) SELECT acos(-.022);
asin([dp]) arcus sinus (inverzní funkce k sin) SELECT asin(0.33)
atan([dp]) arcus tangens SELECT atan(.5);
atan2(a,b) arcus tangens z a/b SELECT atan2(3,4)
cos(a) cosinus z úhlu a uvedeného v radiánech SELECT cos(3.1);
cot(a) cotangens úhlu a SELECT cot(6.0);
sin(a) sinus úhlu a SELECT sin(1.57);
tan(a) tangens úhlu a SELECT tan(2.0)

Agregační funkce

Získaná data z databáze lze zpracovat též pomocí agregačních funkcí, které hodnoty z několika řádků zpracují do jedné, používají se například při sdružování dat do skupin pomocí GROUP BY a výběru pomocí HAVING.

Přehled agregačních funkcí je v níže uvedené tabulce. Příklady a vysvětlení možností při práci s agregačními funkcemi jsou za přehledovou tabulkou. Výrazem v parametru může být pouze název sloupce, případně pomocí aritmetických operátorů a funkcí zpracovaný obsah více sloupců.

funkce typ vstupního argumentu typ výstupní hodnoty popis
avg(výraz) smallint, integer, bigint, real, double precision, numeric, interval numeric pro celočíselný vstup, double precision pro ostatní aritmetický průměr ze vstupních hodnot
count(*)   bigint počet vstupních hodnot (řádků při výběru/ve skupině)
count(výraz) libovolný bigint počet vstupních hodnot, které odpovídají zadanému výrazu
max(výraz) číslo, řetězec, datum/čas stejný jako vstup maximální hodnota ze vstupu
min(výraz) číslo, řetězec, datum/čas stejný jako vstup minimální hodnota ze vstupu
stddev(výraz) smallint, integer, bigint, real, double precision, numeric double precision pro desetinná čísla, numeric pro ostatní průměrná odchylka ze vstupu
sum(výraz) smallint, integer, bigint, real, double precision, numeric, interval bigint pro smallint a integer, numeric pro bigint, double precision pro desetinná čísla a ostatní se vrací ve stejném typu, jako byl vstup součet všech hodnot ze vstupu
variance(výraz) smallint, integer, bigint, real, double precision, numeric double precision pro reálná čísla, numeric pro ostatní vážená odchylka (druhá mocnina průměrné odchylky)

Příklady na použití agregačních funkcí:

SELECT avg(unitprice), id_category, count(*) FROM products GROUP BY id_category;
         avg          | id_category | count 
----------------------+-------------+-------
 125.0000000000000000 |           3 |     2
  50.0000000000000000 |           2 |     2
  
SELECT sum(pieces*unitprice), id_category, stddev(unitprice),variance(unitprice) 
 FROM products GROUP BY id_category;
   sum   | id_category |       stddev        |       variance        
---------+-------------+---------------------+-----------------------
 2750.00 |           3 | 35.3553390593273762 | 1250.0000000000000000
  150.00 |           2 |                   0 |                     0

Závěr

Tento díl byl zaměřen na vyjmenování funkcí a operátorů nad čísly a binárními řetězci, společně s vyjmenováním agregačních funkcí, použitelných při výběru dat společně s jejich seskupováním pomocí GROUP BY, či omezování výběru pomocí agregačních funkcí použitím HAVING. Pro někoho mohl být tento díl trochu nudnější a připomínat přepis dokumentace, ale v takovýchto případech se příručka ani moc jinak uspořádat nedá. Bohužel ještě budou nejméně dva takovéto díly, protože zbývají funkce pro práci s řetězci, s datumem/časem, geometrickými a sítovými typy.

Online verze článku: http://www.linuxsoft.cz/article.php?id_article=756