Perl (112) - Práce s PDF

PerlPodívejme se na několik základních postupů, jak lze vytvářet a modifikovat PDF dokumenty.

2.7.2010 00:00 | Jiří Václavík | přečteno 11726×

PDF patří dnes mezi nejrozšířenější formáty pro distribuci textových dokumentů. Jednou z vlastností PDF je to, že je obtížné ho jakkoliv modifikovat. Co kdybychom chtěli rozeslat dopisy stejné až na záhlaví, které bychom vygenerovali pro každý dokument individuálně podle nějaké databáze? Určitě můžeme použít TeX. Ale moc jiných nástrojů nemáme. Podívejme se, jak bychom mohli postupovat při řešení podobných problémů v Perlu. Jako úvod do studia probereme některé základní operace pro manipulaci s PDF.

Pro manipulaci s PDF soubory je třeba využít některého z dostupných modulů. Za všechny můžeme jmenovat například PDF::Reuse, PDF::API2 a Text::PDF.

PDF::Reuse je velmi rychlý modul a ho výhodně použijeme zejména tam, kde je potřeba vyprodukovat větší množství podobných PDF dokumentů - typicky například sadu dopisů, které se liší adresou v hlavičce.

Vytváření PDF dokumentů

Funkcí prFile definujeme výstupní soubor a pomocí prEnd práci ukončíme. Mezi tyto dva příkazy pak budeme zapisovat další kód, který určí, co bude na výsledné stránce. Tedy pro začátek vytvoříme program, jež po spuštění vygeneruje prázdný pdf soubor. Kód bude vypadat následovně.

use PDF::Reuse;

prFile("blank.pdf");
prEnd();

Text

Dalším úkolem bude vypisování nějakého obsahu do dokumentu. Funkcí prText lze do výsledného souboru zapsat text. prText přijímá mimo řetězce také souřadnice - tím jsou myšleny vzdálenosti od levého a od dolního okraje stránky.

Takto vypadá kód, který vygeneruje PDF soubor s nějakým textem.

prFile("text.pdf");
prText(50,800,"Text");
prEnd();

S textem můžeme provádět různé akce. Například rotovat.

prText(200, 200, " Rotace o 0","", 0);
prText(200, 200, " Rotace o 60","", 60);
prText(200, 200, " Rotace o 120","", 120);
prText(200, 200, " Rotace o 180","", 180);
prText(200, 200, " Rotace o 240","", 240);
prText(200, 200, " Rotace o 300","", 300);

Pomocí funkce prPage můžeme zalomit stránku a pokračovat na nové. Potom padesátistránkový dokument s očíslováním stran vytvoříme takto.

  use strict;
  use PDF::Reuse;

  prFile("text.pdf");

  for $_ (1..50) {
      prText(500, 800, $_);

      prText(50,740,"text 1");
      prText(50,720,"text 2");
      prText(50,700,"text 3");
      prText(50,680,"text 4");

      prPage();
  }

  prEnd();

Pro formátování textu existují následující funkce. prFont nastavuje písmo a jako hodnoty lze užít například Times-Roman, Courier, Helvetica. Velikost písma lze měnit funkcí prFontSize.

Grafika

Dále lze použít prAdd pro "nízkoúrovňové" instrukce. Těmi se nebudeme dále zabývat, jen si uvedeme příklad, který vykreslí zelený obdélník.

prAdd("50 700 160 100 re\\n0 1 0 rg\\nb\\n");

K umístění nějakého objektu je třeba zadat souřadnice.

Pro představu se podívejme, jak takové dokumenty mohou vypadat.

Ukázka vygenerovaného dokumentu

Vkládání obrázků

Pomocí prJpeg, prImage atd. lze vkládat již hotové obrázky. Obvykle potřebujeme znát jeho rozměry. Ty můžeme zjistit například pomocí modulu Image::Info. Zde je příklad, který vytvoří vysledek.pdf, který obsahuje předem určený obrázek.

$jpg = "foto.jpg";
$sirka = 400;
$vyska = 300;

prFile("vysledek.pdf");
$int = prJpeg($jpg, $sirka, $vyska);
prAdd("q\\n$sirka 0 0 $vyska 10 10 cm\\n/$int Do\\nQ\\n");
prEnd();

Spojování PDF dokumentů

Podívejme se na trochu jinou úlohu. Máme-li několik PDF dokumentů, ze kterých potřebujeme udělat jediný, nebo pokud chceme udělat z jednoho souboru několikastránkový výřez, pak zde máme funkci prDoc. Ta do výstupního souboru vytiskne příslušný rozsah z vybraného dokumentu. Ukažme si, jak bychom vytvořili dokument, sestávající se z prvních pěti stránek souboru text.pdf, kompletního obsahu blank.pdf a stránky 7 opět z text.pdf.

prFile("vysledek.pdf");

prDoc("text.pdf",1,5);
prDoc("blank.pdf");
prDoc("text.pdf",7);

prEnd();

Modifikace PDF dokumentů

Hlavním využitím modulu PDF::Reuse je hromadná práce s již existujícími dokumenty. Díky němu můžeme relativně jednoduše modifikovat PDF soubory a provádět takové věci jako je přidání čísla stránky nebo hlaviček dopisů.

Pojďme se podívat na tu druhou úlohu. Nechť máme v souboru adresy kontakty v následujícím formátu.

jméno[TAB]adresa[TAB]město[TAB]psč

A dále máme dopis.pdf který chceme každému z nich poslat. Naším úkolem bude vytvořit sadu dopisů, ke kterým navíc vzhledem k dopis.pdf přidáme pro každého člověka vygenerovanou hlavičku s adresou.

Vše spočívá v použití funkce prForm, které předáme PDF soubor, jež bude šablonou (pozadím) pro vytvářené dokumenty. Implementace našeho problému tak bude vypadat následovně.

prFile("vysledek.pdf");
prForm("dopis.pdf");

my $fr;
open($fr, "adresy") or die;

while (<$fr>)  {
      my($jmeno, $adresa, $mesto, $psc) = split /\\t/;
      prText(50, 800, $jmeno);
      prText(50, 785, $adresa);
      prText(50, 770, "$psc $mesto");
      prPage()
}
prEnd();
close $fr;
Online verze článku: http://www.linuxsoft.cz/article.php?id_article=1719