Ruby VI.

Dnes se podíváme, jak šikovně ošetříme chyby a jak v Ruby pracovat s regulárními výrazy.

9.4.2012 00:00 | Jakub Lares | přečteno 6201×

Výjimky

Musíme si uvědomit, že v každém programu může docházet k celé řádě chyb. Nebudeme brát v úvahu omyl programátora, ale chyby, které se vyskytnou normálním během programu. Například uživatel zadá špatné jméno souboru, bude chtít dělit nulou atd.

Aktivní ošetření chyb

Ošetřování chyb pomocí if/than/else se říká aktivní ošetřování chyb. Ukážeme si to na příkladu s dělením nulou.

Dělení nulou

puts "zadejte 1. cislo"
a = gets.to_i
puts "zadejte 2. cislo"
b = gets.to_i
#Z cyklu vyskocime teprve az uzivatel zada jine cislo nez 0
while b == 0
  puts "Chyba, nulou nelze delit! Opakujte prosim zadnai."
  b = gets.to_i
end
vysledek = a/b
#Operator % zbytek po deleni
zbytek = a%b
puts "Vysledek: #{a} / #{b} = #{vysledek}"
#Zbytek vypiseme pouze pokud nejaky je
puts "Zbytek po deleni: #{zbytek}" if zbytek != 0
Výstup
zadejte 1. cislo
6
zadejte 2. cislo
0
Chyba, nulou nelze delit! Opakujte prosim zadnai.
12
Vysledek: 6 / 12 = 0
Zbytek po deleni: 6

Bude se nám ale stávat, že nebudeme sami vědět, jakým způsobem máme na chybu reagovat. Pro vytvoření opravdu robustního programu musíme tedy testovat výsledky všech volání metod, abychom si byli jistí, že pokrýváme všechny chybové i nechybové stavy. Znamená to nutnost psaní velkého množství podmíněného kódu a kódu, který se stará právě jen o propagaci chyb. Také kdykoli změníme některou existující metodu tak, že může generovat nové, dříve neočekávané chyby, musíme modifikovat veškerá volání takové metody, protože jinak by taková chyba mohla být ignorována. Zkusme se zamyslet, jak bychom detekci a ošetřování chyb mohli vylepšit, aby se pro nás stalo jednodušším a umožnilo nám vytvářet elegantnější a přehlednější kód. Od ideálního řešení očekáváme především, že nám umožní volajícímu objektu signalizovat, že při zpracování jeho požadavku došlo k chybě, a to bez nutnosti dlouhého zkoumání výstupních hodnot. Dále by nám mělo poskytnout přesnou informaci o tom, k jaké chybě došlo, popřípadě také kde. Takovou informaci potřebujeme nejlépe také v textové podobě (nejen jako nějaký číselný kód), abychom případně mohli předat hlášení uživateli, ať již vypsáním na konzoli nebo záznamem v logovacím souboru. Další požadavky máme i na propagaci chyb – v situacích, kdy chybový stav nechceme nebo nemůžeme řešit, měl by automaticky být signalizován volajícímu objektu a ten se pak může opět podobně rozhodovat, jestli bude chybu sám řešit či případně opět propagovat výše v hierarchii volání. V případě propagace chyby volajícímu bychom ale často také chtěli připojit k chybě další vysvětlující nebo popisné informace – uživateli pravděpodobně nebude příliš užitečná chybová hláška "nenalezen soubor C:\config.txt" z obslužného programu pro práci se soubory, pokud nebude vědět, k čemu náš program takový soubor vlastně potřeboval. Pokud se nám tedy podaří při propagaci výjimky přidat např. hlášení "Nezdařilo se načtení nastavení účetního modulu", bude již chyba pro uživatele výrazně přijatelnější. Propagace chyb by zřejmě měla být také selektivní, tj. měli bychom si být schopni vybrat, které chyby řešit na místě a které propagovat výše.

Pasivní ošetření chyb

Nejpoužívanějším postupem pro práci s chybovými stavy jsou tzv. výjimky (reprezentují chybové nebo také obecněji výjimečné stavy). Splňují také většinu požadavků, které jsme na dobré řešení chybových stavů kladli. Výjimka sama o sobě je speciální objekt, obsahující informace o chybě, která v programu nastala (tedy např. textovou chybovou hlášku a číselný kód). Aby výjimky byly užitečné, obsahují programovací jazyky speciální operace pro práci s nimi: Operaci raise pro vyvolání výjimky na místě, kde nastala chyba (parametrem této operace je objekt výjimky), Speciální chráněnou sekci/blok, která obsahuje kód, v němž chceme výjimky detekovat (tj. volání metod, které mohou výjimku vyvolat) a konečně S ní nedílně svázanou sekci rescue, ve které provádíme "zachycení výjimky" a řešení chybového stavu, pokud tento v příslušné chráněné sekci nastane. Tomuto způsobu ošetřování chybových stavů říkáme pasivní ošetření chyb. Ukážeme si to opět na příkladu dělení nulou.

Dělení nulou s výjimkou

Předchozí příklad je možné lehce upravit tak, aby na něm bylo možné demonstrovat použití výjimek. Operace dělení může způsobit výjimku ZeroDivisionError. Tuto výjimku zachytáváme na řádku 10 a pomocí příkazu retry se vracíme na začátek bloku begin a necháme uživatele číslo znovu zadat.

puts "zadejte 1. cislo"
a = gets.to_i
puts "zadejte 2. cislo"
begin
  b = gets.to_i
  #Tato operace muze zpusobit chybu a tim vyhodi vyjimku
  vysledek = a/b
  zbytek = a%b
  #Zachytime pripadnou vyjimku
rescue
puts "Chyba, nulou nelze delit! Opakujte prosim zadani:"
#Navrat na zacatek bloku begin
retry
end
puts "Vysledek: #{a} / #{b} = #{vysledek}"
#Zbytek vypiseme pouze pokud nejaky je
puts "Zbytek po deleni: #{zbytek}" if zbytek != 0
Výstup
zadejte 1. cislo
6
zadejte 2. cislo
0
Chyba, nulou nelze delit! Opakujte prosim zadani:
6
Vysledek: 6 / 6 = 1

Regulární výrazy

Regulární výrazy jsou vyhledávácí vzory popsané speciální syntaxí, pomocí kterých můžeme provádět složitější operace s textem. Například hledat v textu výskyt podřetězce, vytáhnout z textu část, která odpovídá nějakému vzoru, a nebo tuto odpovídající část něčím nahradit. Základní myšlenku si můžeme ukázat na této úvaze: co kdybychom chtěli najít část textu, která začíná slovem „muž“ a končí spolu s koncem věty, která toto slovo obsahovala? Pokud analyzujeme vyhledávací podmínku, jsme ji schopni trochu formálněji popsat: hledáme všechny podřetězce, kde na první pozici je znak „M“ nebo „m“ (může jít i o slovo na začátku věty, tedy s prvním písmenem velkým) na pozici 2 a 3 jsou postupně znaky „u“ a „ž“ od 4. pozice následují libovolné znaky (nebo také žádné znaky pokud je slovo „muž“ již na konci věty) celý podřetězec končí jedním ze znaků „.“, „?“ nebo „!“. Takový popis je sice poměrně přesný, pro jeho zápis ale budeme používat specializovaný jazyk regulárních výrazů, který při zachování stejné přesnosti umožňuje podstatně kratší zápisy. Zatím prozraďme, že výše uvedenému vyhledávání odpovídá regulární výraz „[Mm]už.*[.!?]“. Regulární výrazy se skládají ze zástupných znaků a kvantifikátorů. Nejjednoduší zástupné znaky jsou písmena - odpovídají sama sobě. Dále existují speciální zástupné znaky, která slouží pro vyhledání určité skupiny písmen nebo znaků. Nejdůležitější zástupné znaky shrnuje následující tabulka:

Zástupné znaky
Zápis Význam
[ ]Definuje rozsah. např. vzoru [a-z] vyhovuje jakékoli písmeno malé (anglické) abecedy
\wPísmeno, číslo, nebo podtržítko.  Ekvivalentní vzoru [a-zA-Z0-9_]
\WCokoliv jiného, než \w
\sBílý znak (mezera, tabulátor, nový řádek). Ekvivalent vzoru [ \t\n\r\f]
\SCokoliv jiného než bílý znak
\dĆíslo, ekvivalentní vzoru [0-9]
\DCokoliv jiného než číslo
.Jakýkoliv jeden znak

Pomocí kvantifikátorů se určuje, kolikrát se daný zástupný znak bude v textu vyskytovat. Kvantifikátory se vždy píšou za zástupné znaky, bez nich nemají smysl.

Kvantifikátory
Zápis Význam
*Žádné nebo libovolný počet opakování předchozího
+Jeden nebo více opakování předchozího
{m,n}Nejméně m, nejvíce n opakování předchozího
?Nejvíce jedno opakování předchozího

Dále je možné použít následující speciální operátory pro vytváření skupin ve vzoru a rozhodování podmínkou OR.

Speciální operátory
Zápis Význam
|buď vyhovuje předchozí, nebo následující
()na vzor uvnitř závorek lze použít kvantifikátor jako na celek

Test na obsah podřetezce

V jazyce Ruby se regulární výrazy zapisují mezi 2 lomítka //. Takto definovaný regulární výraz je plnohodnotný objekt, lze jej uložit do proměnné a nebo se může rovnou použít pro porovnání s řetězcem. Toto porovnání se provádí pomocí operátoru =~. Pokud řetězec odpovídá vzoru, tak má výsledek tohoto operátoru pravdivou hodnotu, a podmínka if platí.

ruby = "V jazyce Ruby pisu vetsinu svych programu"
puts "Test: obsahuje retezec dany podretezec:"
#Pomoci operatrou =~ porovname
#jestli retezec ruby odpovida regularnimu vyrazu /Ruby/
puts "Ano!" if ruby =~ /Ruby/
Výstup
Test: obsahuje retezec dany podretezec:
Ano!
Online verze článku: http://www.linuxsoft.cz/article.php?id_article=1921