Perl (4) - Čísla a řetězce

Perl Řetězce a čísla jsou v Perlu dva druhy vzájemně zaměnitelných hodnot. Obsah každé skalární proměnné můžeme interpretovat jako číslo i jako řetězec. Mezi řetězci a čísly totiž existuje automatická konverze. Budeme se též věnovat základním operátorům.

10.3.2005 15:00 | Jiří Václavík | přečteno 60349×

Perl datové typy příliš nerozlišuje. V zásadě je ale můžeme rozdělit na tři typy:

Přitom poslední dva typy jsou pouze seznamy skalárních hodnot. Skalární hodnoty mohou být řetězci, čísly nebo odkazy. Již několikkrát zaznělo, že Perl se chová k datovým typům velmi benevolentně. Perl dokáže vyjádřit číslo jako řetězec a naopak, takže toto rozdělení nehraje tak velkou roli jako u striktnějších jazyků. V zásadě každou proměnnou můžeme interpretovat jako číslo nebo jako řetězec (když to je potřeba). Dokonce i odkaz, pole nebo hash. Těmi se ale budeme zabývat později.

Zápis čísel

Perl nerozlišuje mezi celými a racionálními čísly. Bere automaticky všechna čísla jako racionální - tedy jako jeden datový typ. Dělíme-li vzájemně dvě celá čísla, která jsou nedělitelná, řešením je racionální číslo (10 / 3 = 3.33333333333333). To je chování, které programátor zpravidla chce. Kdybychom to samé dělali v Céčku, výsledkem po dělení celých čísel musí být také celé číslo (10 / 3 = 3). Ve skutečnosti se dá Perl také přepnout na celočíselný režim pomocí příkazu use integer; a do racionálního režimu se vrátíme příkazem no integer. Potom Perl vrací vždy celé číslo.

  #!/usr/bin/perl
  
  print 10 / 3;#3.33333333333333
  
  use integer;#odteď celočíselný režim
  print 10 / 3;#3
  
  no integer;#a zase racionální
  print 10 / 3;#3.33333333333333

Charakteristickým znakem Perlu je možnost použít na cokoliv rozmanité způsoby zápisu. Zápis čísel není výjimkou.

Celé číslo zapíšeme jednoduše jako posloupnost číslic. Zapisujeme-li desetinné číslo, desetinná část se odděluje tečkou, nikoliv čárkou. (Konvence zápisu se dle zvyklosti stát od státu liší, Perl vychází ze syntaxe v USA). Možný je zápis v semilogaritmickém tvaru (například číslo 9,4 . 103 v Perlu napíšeme jako 9.4e3).

V zápisu čísel existuje speciání syntaxe pro jiné než desítkovou soustavu:

SoustavaZápisPoužitelné znaky
desítkováklasicky0-9
osmičkovápřed číslem je 00-7
šestnáctkovápřed číslem je 0x0-9, a-f, A-F
dvojkováPřed číslem je 0b0, 1

Jestliže použijeme jiné znaky než ty z uvedených intervalů, obdržíme většinou chybovou hlášku.

V zápisu lze používat takzvané unární operátory + a -. Je to znaménko + nebo - před číslem. Příkladem může být -18 nebo +95. Přívlastek unární se udává proto, že má takový operátor pouze jediný operand. Operandem je myšlena hodnota vcházející do operace. Mimo unární operátory existují v Perlu ještě binární a ternární.

Delší čísla mohou obsahovat pro přehlednost podtržítka. Při vyhodnocení jsou odstraněny.

Jako příklad si uveďme, jakými různými způsoby se dá napsat číslo 2345:

Matematické operace

Proměnné můžeme sčítat, odčítat, násobit, dělit nebo s nimi jinak operovat. Zde je tabulka standardních matematických operátorů:

OperátorOperacePříkladVýsledek
+sčítání9 + 1521
-odčítání6 - 42
*násobení3 * 515
/dělení9 / 42.25
**umocňování3 ** 481
%zbytek po celočíselném dělení9 % 41

U umocňování je levý operand základem a pravý mocnitelem (exponentem). Takže zápis 3 ** 4 v Perlu je ekvivalentní matematickému zápisu 34. Pozor na to, že 3 ^ 4 znamená něco úplně jiného.

Zbytek po celočíselném dělení (modulus) se dá vysvětlit takto: levý operand vydělíme pravým a výsledné číslo zaokrouhlíme celočíselně dolů (to je výsledek celočíselného dělení). Zaokrohlené číslo vynásobíme pravým operandem a tento nový výsledek odečteme od levého operandu. Získaná hodnota je modulus.

Zde je několik triviálních příkladů:

  $a = 1;
  $b = 2;
  $c = 4;
  
  $soucet = $a + $b;    # výsledkem je 1 + 2 = 3
  $rozdil = $c / $a;    # 4 / 1 = 4
  $v1 = $b + $b ** $c;  # 2 + 2 ^ 4 = 18
  $v2 = ($b + $b) ** $c;# (2 + 2) ^ 4 = 256
  
  $v3 = 5 + 9 * 10;     # 95
  $v4 = (5 + 9) * 10;   # 140

Stejně jako v matematice lze závorkovat tam, kde potřebujeme změnit prioritu operací.

Další operátory přiřazování

Přiřazování je základní operací a věnovali jsme mu již část minulého dílu. Vysvětlili jsme si, jak funguje operátor =. Ten přiřadí do proměnné určenou hodnotu. Dnes se podíváme na jiné přiřazovací operátory.

Tabulka přiřazovacích operátorů pro čísla s přepisem na standardní operátor =:

OperátorPříkladPřepisNová hodnota $p pro původní hodnotu $p = 10
=$p = 3$p = 33
+=$p += 3$p = $p + 313
-=$p -= 3$p = $p - 37
*=$p *= 3$p = $p * 330
/=$p /= 3$p = $p / 33.33333333333333
**=$p **= 3$p = $p ** 31000
%=$p %= 3$p = $p % 31
++$p++$p = $p + 111
--$p--$p = $p - 19

Pro názornost se podívejme, jak bychom mohli tyto operátory zapsat v programu. V proměnné $p je hodnota 10. Zdvojnásobme ji, přičtěme 12, umocněme dvěma a vydělme 4. Vzniklou hodnotu dělme 15 a zbytek po celočíselněm dělení tiskněme na výstup. Napíšeme si trochu neohrabaný program, který to spočítá.

  #!/usr/bin/perl
  
  $p = 10; # V proměnné $p je hodnota 10
  $p *= 2; # Zdvojnásobme ji,
  $p += 12;# přičtěme 12,
  $p **= 2;# umocněme na 2.,
  $p /= 4; # a vydělme 4.
  $p %= 15;# Vzniklou hodnotu dělme 15 a zbytek po celočíselném dělení
  
  print "Řešením úlohy je číslo $p.\n";# tiskněme na výstup

Inkrementace, dekrementace

inkrementace je zvýšení hodnoty v proměnné o 1. Dekrementace je naopak snížení hodnoty v proměnné o 1. Jak funguje inkrementace?

  $p = 10;
  $p++;   # Hodnota $p se zvýší o 1
  print $p# Vytiskne hodnotu 11 - tedy hodnotu o 1 větší než byla původní hodnota $p

Dekrementace je totéž obráceně (1 se odečítá) a zapisuje se operátorem --.

  $p = 10;
  $p--;
  print $p # tiskne 10 - 1 = 9

Tyto zápisy jsou tedy ekvivalentní:

  $p = $p + 1;
  $p += 1;
  $p++;

Výhodou operátoru inkrementace je zejména přehlednost.

Postfixová, prefixová a infixová notace operátorů

Existuje několik druhů zápisu operátorů podle toho, v jakém pořadí se uvádějí operátory a operandy. I na pořadí zápisu samozřejmě výsledek závisí.

Způsoby notace si ukážeme na operátorech ++ a --. Ty lze totiž napsat i před proměnnou. To má význam jen v případě, kdy nepoužijeme zápis osamoceně, ale například při přiřazení. Nejen, že inkrementace ovlivní hodnotu proměnné, ale celá operace (stejně jako každá jiná operace) má takzvanou návratovou hodnotu, kterou můžeme také někam přiřadit. Použijeme-li zápis před proměnnou (prefixový zápis), bude hodnota nejdříve inkrementována, až poté přiřazena (tj. až poté se vyhodnotí návratová hodnota). Při zápisu za proměnnou (postfixový zápis), bude nejprve přiřazena a až poté inkrementována.

Podívejme se na příklad pro postfixový zápis:

  $a = 3;
  $b = $a++;#do $b se přiřadí hodnota proměnné $a a až potom se zvýší $a o 1. $b tedy bude mít hodnotu 3
  
  print $a; #4
  print $b; #3

u Prefixového zápisu je výsledek jiný:

  $a = 3;
  $b = ++$a;#tady je to naopak. Nejdříve se $a zvýší o 1 a až potom se hodnota $a přiřadí do $b
  
  print $a; #4
  print $b; #4

Takto je to u inkrementace a dekrementace, ale každý operátor funguje svým způsobem. Nemá smysl se tím nyní příliš zabývat, protože zápis bývá většinou intuitivní.

Infixová notace znamená, že je operátor mezi operandy. Například 5 + 9. U unárních operátorů nemá význam.

Řetězce

Proměnné mohou uchovávat také řetězce.

Dostupnými operacemi s textem v Perlu, které si dnes představíme, je zřetězení a opakování. Zřetězení používá operátor tečky a jeho výsledkem je spojení řetězců z operandů na levé a pravé straně.

  $a = "larry" . "wall";
  print $a; # vytiskne larrywall
  
  $jmeno = "larry";
  $prijmeni = "wall";
  
  $cele_jmeno = $jmeno . " " . $prijmeni;
  
  print $cele_jmeno; # vytiskne larry wall
  

Operátor opakování se se bude hodit studentům. Chceme-li 100x vypsat nějaký řetězec, použijeme zápis:

  print "Budu nosit domácí úkoly.\n" x 100;

Jde vlastně o autozřetězení, kdy několikkrát postupně zřetězujeme s původním řetězcem. Zkusme spustit program:

  $./program.pl
  Budu nosit domácí úkoly.
  Budu nosit domácí úkoly.
  Budu nosit domácí úkoly.
  Budu nosit domácí úkoly.
  Budu nosit domácí úkoly.
  ..... (ještě 94×)
  Budu nosit domácí úkoly.
  $ 

Stejně jako u řetězců můžeme využít několik přiřazovacích operátorů.

OperátorPříkladPřepisNová hodnota $p pro původní hodnotu $p = "abc"
=$p = "xxx"$p = "xxx""xxx"
.=$p .= "def"$p = $p . "def""abcdef"
x=$p x= 3$p = $p x 3"abcabcabc"

Konverze mezi čísly a řetězci

Co se stane, když provádíme numerické výpočty s řetězci a naopak - řetězcové operace s čísly? Již jsme naznačili, že Perl automaticky převede řetězec na číslo nebo číslo na řetězec.

Pravidla konverze jsou prostá. Jestliže na začátku řetězce není číslo, převede Perl řetězec na 0. V opačném případě je řetězec převeden na nejdelší číslo, kterým řetězec začíná a ostatní znaky jsou vypuštěny. Přitom se nebere ohled na bílé znaky na začátku.

  print 10 + "265pps";
  # vytiskne 275

  print 10 + "pps";
  # vytiskne 10

  print "2k5" + "123px";
  # vytiskne 125

  print "2e5" + "123px";
  # tady je zrada! Vytiskne 200123, protože "2e5" je konvertováno na 2e5 = 2 * 105, nikoliv na 2

  print " 2k5" + "123px";
  # bílý znak na začátku (mezera) jako by nebyl, Perl ho ignoruje a řetězec konvertuje na 2.
#Výsledkem tedy je 125

Konverze z čísla na řetězec je intuitivní. Získaný řetězec bude prostě obsahovat číslo.

  print 12 . 6;
  #vytiskne 126
  
  print "retezec" . 6;
  #vytiskne retezec6

Seznam operátorů a jejich priorita

V matematice bývá zvykem, že některé operace se vykonávají přednostně. Například umocňování má přednost před násobením a násobení před sčítáním. Pokud výraz obsahuje operátory stejné priority, zpracováváme ho zleva doprava.

Pravidla pro pořadí vykonávání jsou nezbytná, neboť výsledek nemusí být při různém vyhodnocení jednoznačný. K tomu, která operace se kdy vykoná, slouží v Perlu tabulka priorit. Ty operace, které již známe nebo poznáme brzy (horizont dvou dílů), jsou zvýrazněny zeleně:

OperátorOperaceAsociativitaArita
print, sort atd. (nejvyšší priorita)Operátory pro seznamy (levé)zleva 
->Dereferencezleva2
++, --Inkrementace, dekrementacenení1
**Umocňovánízprava2
+, -, !, \Unární plus, minus, not (logické), odkazzprava1
=~, !~Operace pro práci s regulárními výrazyzleva2
*, /, %, xNásobení, dělení, modulus, opakovánízleva2
+, -, .Plus, minus, spojení řetězcůzleva2
>> <<Bitový posunzleva2
rand atd.Pojmenované unární operátorynení1
<, <=, >=, >, lt, le, ge, gtPorovnávánínení2
==, !=, <=>, eq, ne, cmpPorovnávánínení2
&and (bitové)zleva2
|, ^or, xor (bitové)zleva2
&&and (logické)zleva2
||or (logické)zleva2
.., ...Operátor rozsahunení2
?:Operátor podmínkyzprava3
=, +=, -=, *=, /=, .=, x=, **=, %=Přiřazovací operátoryzprava2
=>, ,Čárkazleva2
open atd.Operátory pro seznamy (pravé)není 
notnot (logické)zprava1
andand (logické)zleva2
or, xor (nejnižší priorita)or (logické)zleva2

Čím výše je operátor, tím má vyšší prioritu - a tedy vykoná se přednostně oproti operacím s operátorem pod ním.

Směr vykonávání (asociativita) určuje, jak se bude vykonávat operace se stejnou prioritu. Jsou 3 možnosti:

Přirozenost požadavku asociativity si lze uvědomit na výrazu 8 / 4. Výsledkem je 2, nikoliv 0.5 (8 dělíme čtyřmi, ne opačně, protože výraz se vykonává zleva).

Vlastnosti operátorů jsou tedy obecně priorita, asociativita, počet operandů (arita), případně i typ a kontext operandů.

Chceme-li změnit prioritu, použijeme kulaté závorky. Lze je používat i tam, kde nejsou nutné (třeba když si nejsme prioritou jistí a nechce se nám hledat, ale je to vhodné i tam, kde by si někdo, kdo bude kód v budoucnu číst, taky nemusel být jistý).

Online verze článku: http://www.linuxsoft.cz/article.php?id_article=737