Ačkoli je výstupem XSLT transformace vždy fragment DOM stromu či série SAX událostí, můžeme ovlivnit, jakým způsobem bude tato struktura zapsána na výstupu, dnes se tedy podíváme, jaký je mezi jednotlivými způsoby rozdíl.
14.9.2004 15:00 | Aleš Hakl | read 12747×
DISCUSSION
Jak již jsem v minulém dílu zmíníl, můžeme pomocí atributu
method
elementu xsl:output
zvolit způsob výstupu, není v tom žádná magie, a ač to tak na
první pohled nevypadá, jsou první dva způsoby v podstatě stejné
a liší se jen drobnými detaily, zato výstupní metoda
"text"
je úplně o něčem jiném.
HTML
V tomto případě procesor upraví výstup tak, aby byl pokud možno
validním HTML, to znamená, že negeneruje uzavírací tagy
(</img>
) ani prázdné elementy
(<img/>
) pro elementy, které jsou v HTML
považovány za prázdné, nenahrazuje znaky
<>"'&
uvnitř elementů script
a style
a provádí ještě další podobné úpravy
(ohledně instrukcí pro zpracování, atributů a podobně)
V této výstupní metodě má význam používat atribut
indent
elementu xsl:output
, a proto má
implicitní hodnotu "yes"
a atribut
version
určuje verzi výstupního HTML a má implicitně
hodnotu "4.0"
.
Tato výstupní metoda také doplní element meta
specifikující kódování dokumentu jako první položku do elementu
head
, samozřejmě pouze pokud element head
ve výstupním stromu existuje.
XML
Výstupní metoda "xml"
je implicitní a jedná se o
prostý výstup XML dokumentu, takový dokument má XML deklaraci
(což můžeme vypnout atributem omit-xml-declaration
),
speciální znaky jsou v něm nahrazeny entitami dle zvyklostí XML a
podobně.
Pomocí atributu cdata-section-elements
můžeme
vyjmenovat elementy, jejichž textový obsah bude vypsán jako sekce
CDATA namísto normálního textu s případným nahrazením speciálních
znaků entitami.
Stejně jako v případě HTML funguje atribut indent
, jímž
můžeme povolit odsazovaní, ovšem pro XML má implicitní hodnotu
"no"
.
Text
Tato výstupní metoda se hodí na cokoli, co není XML a není HTML,
jedná se o prostý výstup nějakého textu. Obsahem výstupu jsou pouze
textové uzly výstupního stromu v pořadí, v jakém za sebou následují
v tomto stromu.
Pomocí atributu encoding
určíme kódování výstupu.
Vzhledem k tomu, že v tomto režimu není možné (a ani vhodné)
nahrazovat znaky nevyjádřitelné ve výstupní znakové sadě entitami,
způsobí výskyt takového znaku chybu.
Většina ostatních atributů elementu xsl:output
postrádá
pro tuto metodu smysl, jediný, který může ještě jakýsi smysl mít,
je
media-type
, s jeho pomocí určíme MIME typ výstupu
(což využijme nejspíše pouze na serveru při použití nástrojů typu
mod_xslt)
Pomocí metody "text"
můžeme generovat opravdu ledacos,
prostým textem počínaje a zdrojovým kódem v C++ či XBM bitmapou
konče. Pokud pomineme určitou dávku nepohodlí, bylo by možné i
generovat některé polo-binární formáty, ovšem osobně bych vám tento
přístup silně nedoporučoval, není to tak jednoduché, jak se může na
první pohled zdát.
Ačkoli můžeme pomocí XSLT vygenerovat ledacos, řekl bych, že většina
složitějších konverzí s použitím výstupní metody "text"
vyjde mnohem rychleji (jak na čas vývoje tak na čas běhu vlastního
programu), pokud je implementujeme jako samostatný program, soubor
funkcí či třídu v nějakém obecném programovacím jazyce podporujícím
práci s XML na použitelné úrovni.
S výstupem dokumentu také souvisí dva elementy, které jsem v
minulém dílu nezmínil. Element xsl:strip-space
určuje, ve kterých elementech dojde k odstranění textových uzlů
obsahujících pouze prázdné místo (mezery, tabulátory,
nové řádky...). Seznam těchto elementů (oddělených mezerami,
můžeme též použít hvězdičku jako zástupný znak pro jakýkoli element)
uvedeme v atributu nazvaném
překvapivě elements
. Implicitně se takto neděje v
žádných elementech. A druhý element je
xsl:preserve-space
, má opět atribut
elements
a slouží k potlačení efektu elementu
xsl:strip-space
na dané elementy ve výstupním
dokumentu.
Ke stejnému účelu můžeme použít ve výstupním dokumentu atribut xml:space
s hodnotou preserve
, ovšem musíme si být vědomi toho, že se tento atribut bude vyskytovat i ve výstupu.
Ovšem činnost těchto elementů spolu s atributem indent
elementu xsl:output
začne být poněkud nejasná,
procesor totiž odsazování výstupu zajišťuje právě pomocí přidávání
a mazání textových uzlů obsahujících mezery, tabulátory a nové
řádky. Pokud tedy potřebujete mít kontrolu nad tím, kde prázdné místo
bude a kde ne, nepoužívejte odsazování.
Tím máme za sebou větší část XSLT, příště se podíváme na funkce
kterými XSLT rozšiřuje jazyk XPath.