Programujeme s XML (13.) - XPath a řetězce
Dnes zakončíme náš rychlý úvod do jazyka XPath popisem funkcí 
      pracujících s řetězci.
  
24.8.2004 15:00 | 
Aleš Hakl 				
| Články autora			
| přečteno 16039×
 
      Protože jazyk XPath není určen pro obecné programování, a protože
      je z principu interpretovaný, nebylo by vhodné zpracovávat řetězce 
      po jednotlivých znacích a tudíž to ani není možné, a právě proto nám
      jazyk XPath nabízí řadu funkcí představujících nejčastější operace s 
      řetězci. Tato sada funkcí bohužel neobsahuje žádné zpracování 
      regulárních výrazů, které bych právě v jazyku typu XPath velmi uvítal. 
     
    
      Již minule jsme se seznámili s funkcí string() sloužící
      k převodu libovolného jiného datového typu na řetězec, nyní se tedy 
      podíváme na ostatní:
     
    concat() - Spojování řetězců
    
      Funkce concat() spojí všechny svoje argumenty do jednoho 
      řetězce, argumentů může být 2 nebo více.
     
    starts-with() - Vyhledávání na začátku
    
      Tato funkce slouží k operaci, která se v ostatních jazycích příliš 
      nevyskytuje (snad z výjimkou Javy), zjistí, začíná-li první argument
      obsahem druhého argumentu a podle toho vrátí true nebo 
      false.
     
    contains() - Vyhledávání
    
      Obdoba funkce předchozí s tím rozdílem, že vrací true, 
      pokud se druhý argument vyskytuje kdekoli v prvním.
     
    substring-before() a substring-after()
    
      Tyto dvě funkce vrací část prvního argumentu předcházející (nebo 
      následující) výskyt druhého argumentu. Obě funkce vrátí prázdný řetězec,
      pokud se v prvním argumentu argument druhý nevyskytuje (což může být 
      občas trochu matoucí)
     
    substring() - Část řetězce
    
      Tato funkce vrácí část prvního argumentu určenou pozicí začátku 
      (druhý argument) a délkou (třetí argument). Pozice prvního znaku je 
      1 jako v Pascalu a ne 0 jako ve většině ostatních programovacích jazyků.
     
    string-length() - Délka řetězce
    
      Vrácí délku řetězce (argumentu) ve znacích.
     
    normalize-space() - Normalizace mezer
    
      Funkce normalize-space() zajistí nahrazení mezer a podobných
      znaků (což znamená tabulátor a nový řádek, znaky typu 
      U+3000(ideografická mezera) XML nepovažuje za mezery) dle pravidel XML.
     
    
      Prakticky jde o to, že tyto znaky jsou na začátku a konci řetězce 
      odstraněny a jejich sekvence uprostřed řetězce jsou nahrazeny jednou 
      mezerou.
     
    translate() - Nahrazení znaků
    
      Kdo zná program tr(1), zná i tuto funkci, princip je totiž
      stejný. Funkce vrací první argument ve kterém jsou znaky vyskytující 
      se v druhém argumentu nahrazeny odpovídajícími znaky z třetího 
      argumentu. Pokud
      je třetí argument kratší než druhý, jsou odpovídající znaky jednoduše 
      odstraněny.
     
    Několik příkladů
    concat('foo','bar','quux') =
    foobarquux
 starts-with('nyaa','ny') =
    true
 starts-with('nyaa','mn') =
    false
 contains('foo bar','bar') =
    true
 contains('foo bar','quux') =
    false
 contains('foobar','oba') =
    true
 substring-before('root=/dev/hda1','=') =
    root
 substring-after('root=/dev/hda1','=') =
    /dev/hda1
 substring-before('foo,bar,quux',',') =
    foo
 substring-after('foo,bar,quux',',') =
    bar,quux
 substring-before('foo,bar,quux','=') =
    
 substring-after('foo,bar,quux','=') =
    
 substring('abcdef',2,3) =
    bcd
 substring('abcdef',5,1 div 0) =
    ef
    - Výsledkem dělení nulou je hodnota plus nekonečno.
    
 string-length('abcdef') =
    6
 normalize-space(' bla  bla  foo   ') =
    bla bla foo 
    translate('abcdef','ab','AB') =
    ABcdef
 translate('abcdef','abc','AB') =
    ABdef 
    
      Pokud někde mluvím o znacích, myslím tím samožřejmě znaky Unicode a nikoli
      jednotlivé bajty a toto by mělo platit i pro znaky vyšší než U+FFFF. 
      Jediným problémem můžou být znaky, které ačkoli vypadají jeden jsou 
      reprezentovány více znaky Unicode, případně pro ně existuje více 
      reprezentací, jednou jako jeden znak a podruhé jako dva znaky. Všechny 
      české znaky s diakritikou patří do druhé skupiny, do první patří různé
      komplikovaně skládané znaky některých asijských jazyků.
     
    
      Tímto článkem bych uzavřel naši krátkou odbočku k jazyku XPath a 
      příště se vrátíme k XSL transformacím, pro které jsme teď vyzbrojeni
      jazykem XPath.
     
Verze pro tisk 
 
 
  
  
 
  
|   |  
| 
 Nejsou žádné diskuzní příspěvky u dané položky. 
 
 
Příspívat do diskuze mohou pouze registrovaní uživatelé. 
 |  
 
 | 
 
Vyhledávání software
  
 
Vyhledávání článků
  
28.11.2018 23:56 /František Kučera Prosincový sraz spolku OpenAlt se koná ve středu 5.12.2018 od 16:00 na adrese Zikova 1903/4, Praha 6. Tentokrát navštívíme organizaci CESNET. Na programu jsou dvě přednášky: Distribuované úložiště Ceph (Michal Strnad) a Plně šifrovaný disk na moderním systému (Ondřej Caletka). Následně se přesuneme do některé z nedalekých restaurací, kde budeme pokračovat v diskusi.
 Komentářů: 1
 
12.11.2018 21:28 /Redakce Linuxsoft.cz 22. listopadu 2018 se koná v Praze na Karlově náměstí již pátý ročník konference s tématem Datová centra pro business, která nabídne odpovědi na aktuální a často řešené otázky: Jaké jsou aktuální trendy v oblasti datových center a jak je optimálně využít pro vlastní prospěch? Jak si zajistit odpovídající služby datových center? Podle jakých kritérií vybírat dodavatele služeb? Jak volit vhodné součásti infrastruktury při budování či rozšiřování vlastního datového centra? Jak efektivně datové centrum spravovat? Jak co nejlépe eliminovat možná rizika? apod. Příznivci LinuxSoftu mohou při registraci uplatnit kód LIN350, který jim přinese zvýhodněné vstupné s 50% slevou.
 Přidat komentář 
6.11.2018 2:04 /František Kučera Říjnový pražský sraz spolku OpenAlt se koná v listopadu – již tento čtvrtek – 8. 11. 2018 od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5). Tentokrát bez oficiální přednášky, ale zato s dobrým jídlem a pivem – volná diskuse na téma umění a technologie, IoT, CNC, svobodný software, hardware a další hračky.
 Přidat komentář 
4.10.2018 21:30 /Ondřej Čečák LinuxDays 2018 již tento víkend, registrace je otevřená.
 Přidat komentář 
18.9.2018 23:30 /František Kučera Zářijový pražský sraz spolku OpenAlt se koná již tento čtvrtek – 20. 9. 2018 od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5). Tentokrát bez oficiální přednášky, ale zato s dobrým jídlem a pivem – volná diskuse na téma IoT, CNC, svobodný software, hardware a další hračky.
 Přidat komentář 
9.9.2018 14:15 /Redakce Linuxsoft.cz 20.9.2018 proběhne v pražském Kongresovém centru Vavruška konference Mobilní řešení pro business.
Návštěvníci si vyslechnou mimo jiné přednášky na témata: Nejdůležitější aktuální trendy v oblasti  mobilních technologií, správa a zabezpečení mobilních zařízení ve firmách, jak mobilně přistupovat k informačnímu systému firmy, kdy se vyplatí používat odolná mobilní zařízení nebo jak zabezpečit mobilní komunikaci.
 Přidat komentář 
12.8.2018 16:58 /František Kučera Srpnový pražský sraz spolku OpenAlt se koná ve čtvrtek – 16. 8. 2018 od 19:00 v Kavárně Ideál (Sázavská 30, Praha), kde máme rezervovaný salonek. Tentokrát jsou tématem srazu databáze prezentaci svého projektu si pro nás připravil Standa Dzik. Dále bude prostor, abychom probrali nápady na využití IoT a sítě The Things Network, případně další témata.
 Přidat komentář 
16.7.2018 1:05 /František Kučera Červencový pražský sraz spolku OpenAlt se koná již tento čtvrtek – 19. 7. 2018 od 18:00 v Kavárně Ideál (Sázavská 30, Praha), kde máme rezervovaný salonek. Tentokrát bude přednáška na téma: automatizační nástroj Ansible, kterou si připravil Martin Vicián.
 Přidat komentář 
   Více ...
  Přidat zprávičku
 
  Poslední diskuze  
31.7.2023 14:13 /
Linda Graham iPhone Services 
30.11.2022 9:32 /
Kyle McDermott Hosting download unavailable 
13.12.2018 10:57 /
Jan Mareš Re: zavináč 
2.12.2018 23:56 /
František Kučera Sraz 
5.10.2018 17:12 /
Jakub Kuljovsky Re: Jaký kurz a software by jste doporučili pro začínajcího kodéra? 
 
Více ...
 
 |