LINUXSOFT.cz Přeskoč levou lištu

ARCHIV



   

> C/C++ (23) - Seznam

Ukážeme si, jak s pomocí strukturovaných typů implementovat jednoduchou datovou strukturu - jednosměrný lineární seznam. Data můžeme za chodu programu přidávat, vyhledávat i mazat, aniž bychom předem specifikovali maximální počet prvků, ten je omezen jen celkovým množstvím dostupné paměti.

6.7.2005 07:00 | Jan Němec | Články autora | přečteno 50590×

Jednosměrný seznam

Programátor občas potřebuje dynamickou datovou strukturu. Chlípný důstojník z minulého dílu si ukládá data o lidech, kteří pro něj mají nějaký význam. Pokud zná jednoho člověka, použije jednu proměnnou, na dva lidi proměnné dvě a na deset lidí nejspíš statické pole. Pokud se počet dozví po spuštění programu a nikoliv již v době překladu, problém vyřeší dynamickou alokací paměti. Skutečná aplikace však bude zřejmě ještě o něco komplikovanější, neboť důstojník bude lidi zadávat, vyhledávat a mazat, aniž by programu po spuštění sdělil, kolik nejvýš záznamů hodlá držet v paměti.

Jednoduchou datovou strukturou, která podobné operace zvládne je seznam. Ukládat do něj budeme čísla typu int, ale úplně stejně bychom postupovali v případě strukturovaných typů z příkladu s chlípným důstojníkem.

typedef struct seznam {
  int data;
  struct seznam *dalsi;
} SEZNAM;

Struktura seznam a jí odpovídající typ SEZNAM reprezentují jeden datový prvek v dynamické datové struktuře. Vlastní data jsou ve stejnojmenné proměnné typu int, položka dalsi je pouze režie datové struktury. Jedná se o ukazatel opět na strukturu typu seznam. Prázdnému seznamu odpovídá proměnná p, ukazatel na SEZNAM s hodnotou NULL, pokud obsahuje jedno číslo bude nenulový, ale v p->dalsi bude NULL. V případě dvou a víceprvkového seznamu ukazuje p->dalsi na druhý prvek, p->dalsi->dalsi na třetí atd. Celý řetízek je zakončen hodnotou NULL.

Všimněte si definice prvku dalsi ve struktuře. Hodil by se ukazatel na SEZNAM, to je ale dosud nedefinovaný typ, takže zde musíme použít strukturu seznam. Je to jediný případ, kdy ve vlastním kódu v C musíme použít jméno struktury a nevystačíme si se jménem typu.

Nejjednodušší operací je výpis celého seznamu.

void vypis(const SEZNAM *ps) {
  if (!ps) return;          /* Prázdný seznam.       */
  printf("%i\n", ps->data); /* Vypiš aktuální prvek  */
  vypis(ps->dalsi);         /* i celý zbytek seznamu */
}

Rekurzivní implementace funkce je asi nejjednodušší, ale efektivnější je se rekurzi vyhnout a vše vyřešit while cyklem.

void vypis(const SEZNAM *ps) {
  while (ps != NULL)  {       /* Dokud nejsme na konci, */
    printf("%i\n", ps->data); /* vypiš aktuální prvek   */
    ps = ps->dalsi;           /* a posuň se na další.   */
  }
}

Aby bylo co vypisovat, musíme nejprve prvky do seznamu přidat.

void pridej(SEZNAM **pps, int prvek) {
  SEZNAM *ps;

  ps = (SEZNAM *) malloc(sizeof(SEZNAM));
  if (!ps) {
    /* Tady bychom nějak ošetřili chybu alokace. */
    return;
  }
  ps->data = prvek;
  ps->dalsi = *pps;
  *pps = ps;
}

Přidání prvku si zaslouží komentář. Především při uvedené implementaci je seznam netříděný a umožňuje přidání duplicit. To nám umožní prostě naalokovat novou hlavu (1. prvek) seznamu a jako druhý prvek poslouží hlava původní. Celý seznam je reprezentován ukazatelem na první prvek a ten se přidáním změní, vstupně výstupní parametr pps proto musí být ukazatel na ukazatel na SEZNAM. Kdybychom (podobně jako v případě výpisu) zvolili jen ukazatel na SEZNAM, přiřazení v posledním řádku by ovlivnilo jen parametr funkce pps, ale nikoli původní proměnnou. Z kódu budeme přidání volat asi takhle:

SEZNAM *s;

s = NULL; /* Důležité, v opačném případě by nebyl seznam ukončen. */
pridej(&s, 1);
pridej(&s, 2);
pridej(&s, 3);

vypis(s);

Mírně komplikovanější je přidání do setříděného seznamu bez duplicit. Při běžné implementaci procházíme seznam while cyklem a postupně porovnáváme zadávaný prvek s daty ze seznamu. Dojde-li k rovnosti, operace skončí s chybou, v opačném případě seznam na příslušném místě rozpojíme a vložíme přidávaný prvek.

Operace mazání se přidání do setříděného seznamu podobá. V našem případě smažeme první prvek s požadovanou hodnotou.

void mazej(SEZNAM **pps, int prvek) {
  SEZNAM *ps, *ps2;

  ps = *pps;
  if (!ps) {
    /* Prázdný seznam. */
    return;
  }
  if (ps->data == prvek) {
    /* Mazání hlavy je speciální. */
    *pps = ps->dalsi;
    free(ps);
    return;
  }
  ps2 = ps->dalsi;
  while (ps2 != NULL) {
    if (ps2->data == prvek) {
      /* Mazání prvku. */
      ps->dalsi = ps2->dalsi;
      free(ps2);
      return;
    }
    /* Posun */
    ps = ps2;
    ps2 = ps->dalsi;
  }
}

Je vidět, že mazání je nejobtížnější operací. I v tak jednoduché struktuře, jakou je lineární seznam je třeba trocha obezřetnosti, musíme pamatovat také na zvláštní případy, jakými jsou pokus o mazání v prázdném seznamu a mazání hlavy.

Po ukončení práce se seznamem je třeba jej smazat a uvolnit paměť. Mohli bychom volat funkci mazej, dokud je seznam neprázdný, ale to by bylo neefektivní. Lepší je napsat speciální funkci.

void mazejvse(SEZNAM **pps) {
  SEZNAM *ps;

  ps = *pps;
  while (ps) {
    *pps = ps->dalsi;
    free(ps);
    ps = *pps;
  }
}

I v tomto případě jsme potřebovali jednu pomocnou proměnnou. Zjednodušené řešení

while (ps) {
  free(ps);
  ps = ps->dalsi; /* Přístup do uvolněné paměti. Chyba. */
}

není správné, neboť jsme přistupovali do dealokované paměti. Chyba je to nebezpečná, neboť se na konkrétních platformách nemusí projevit, případně se projeví jen někdy v závislosti na nepředvídatelných okolnostech.

Funkční zdrojový kód seznamu z dnešního dílu si můžete stáhnou zabalený jako c23.tar.gz.

Lze vymyslet ještě celou řadu operací: vyhledávání prvku, třídění, odstranění duplicit a podobně. V praktických případech často neukládáme do seznamu jen čísla nebo jen nějaký uživatelský typ, ale obojí. Jeden záznam v seznamu pak kromě ukazatele na dalších prvek a vlastních dat obsahuje jednoznačný identifikátor (klíč) záznamu. Může se jednat třeba deskriptor otevřeného souboru, rodné číslo osoby a podobně. V seznamu pak většinou vyhledáváme právě podle tohoto klíče.

Seznamy jsou pro větší objemy dat neefektivní. Složitost mazání i vyhledávání je v průměrném i nejhorším případě lineární, při n záznamech v seznamu musíme projít n/2 v průměrném a n záznamů v nejhorším případě pro každou operaci. Ve skutečných aplikacích, které intenzivně pracující s větším množstvím dat, se proto používají jiné datové struktury. Jednou z možností jsou binární stromy. Zde má každý prvek hned dva následníky (místo jednoho ukazatele dalsi v případě našeho seznamu), levý a pravý, hlavě se v případě stromů říká kořen. Klíč v levém následníku je vždy menší a v pravém větší než rodičovském záznamu. Vyhledávání, přidávání i mazání má potom jen logaritmickou časovou složitost, ovšem algoritmy jednotlivých operací jsou složitější než v případě seznamu, zájemce proto odkazuji například na wikipedii.

Pokračování příště

V příštím dílu probereme operace se soubory.

Verze pro tisk

pridej.cz

 

DISKUZE

ladění 7.7.2005 15:01 losa
  L Re: ladění 7.7.2005 15:14 Jan Němec




Příspívat do diskuze mohou pouze registrovaní uživatelé.
> Vyhledávání software
> Vyhledávání článků

28.11.2018 23:56 /František Kučera
Prosincový sraz spolku OpenAlt se koná ve středu 5.12.2018 od 16:00 na adrese Zikova 1903/4, Praha 6. Tentokrát navštívíme organizaci CESNET. Na programu jsou dvě přednášky: Distribuované úložiště Ceph (Michal Strnad) a Plně šifrovaný disk na moderním systému (Ondřej Caletka). Následně se přesuneme do některé z nedalekých restaurací, kde budeme pokračovat v diskusi.
Komentářů: 1

12.11.2018 21:28 /Redakce Linuxsoft.cz
22. listopadu 2018 se koná v Praze na Karlově náměstí již pátý ročník konference s tématem Datová centra pro business, která nabídne odpovědi na aktuální a často řešené otázky: Jaké jsou aktuální trendy v oblasti datových center a jak je optimálně využít pro vlastní prospěch? Jak si zajistit odpovídající služby datových center? Podle jakých kritérií vybírat dodavatele služeb? Jak volit vhodné součásti infrastruktury při budování či rozšiřování vlastního datového centra? Jak efektivně datové centrum spravovat? Jak co nejlépe eliminovat možná rizika? apod. Příznivci LinuxSoftu mohou při registraci uplatnit kód LIN350, který jim přinese zvýhodněné vstupné s 50% slevou.
Přidat komentář

6.11.2018 2:04 /František Kučera
Říjnový pražský sraz spolku OpenAlt se koná v listopadu – již tento čtvrtek – 8. 11. 2018 od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5). Tentokrát bez oficiální přednášky, ale zato s dobrým jídlem a pivem – volná diskuse na téma umění a technologie, IoT, CNC, svobodný software, hardware a další hračky.
Přidat komentář

4.10.2018 21:30 /Ondřej Čečák
LinuxDays 2018 již tento víkend, registrace je otevřená.
Přidat komentář

18.9.2018 23:30 /František Kučera
Zářijový pražský sraz spolku OpenAlt se koná již tento čtvrtek – 20. 9. 2018 od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5). Tentokrát bez oficiální přednášky, ale zato s dobrým jídlem a pivem – volná diskuse na téma IoT, CNC, svobodný software, hardware a další hračky.
Přidat komentář

9.9.2018 14:15 /Redakce Linuxsoft.cz
20.9.2018 proběhne v pražském Kongresovém centru Vavruška konference Mobilní řešení pro business. Návštěvníci si vyslechnou mimo jiné přednášky na témata: Nejdůležitější aktuální trendy v oblasti mobilních technologií, správa a zabezpečení mobilních zařízení ve firmách, jak mobilně přistupovat k informačnímu systému firmy, kdy se vyplatí používat odolná mobilní zařízení nebo jak zabezpečit mobilní komunikaci.
Přidat komentář

12.8.2018 16:58 /František Kučera
Srpnový pražský sraz spolku OpenAlt se koná ve čtvrtek – 16. 8. 2018 od 19:00 v Kavárně Ideál (Sázavská 30, Praha), kde máme rezervovaný salonek. Tentokrát jsou tématem srazu databáze prezentaci svého projektu si pro nás připravil Standa Dzik. Dále bude prostor, abychom probrali nápady na využití IoT a sítě The Things Network, případně další témata.
Přidat komentář

16.7.2018 1:05 /František Kučera
Červencový pražský sraz spolku OpenAlt se koná již tento čtvrtek – 19. 7. 2018 od 18:00 v Kavárně Ideál (Sázavská 30, Praha), kde máme rezervovaný salonek. Tentokrát bude přednáška na téma: automatizační nástroj Ansible, kterou si připravil Martin Vicián.
Přidat komentář

   Více ...   Přidat zprávičku

> Poslední diskuze

31.7.2023 14:13 / Linda Graham
iPhone Services

30.11.2022 9:32 / Kyle McDermott
Hosting download unavailable

13.12.2018 10:57 / Jan Mareš
Re: zavináč

2.12.2018 23:56 / František Kučera
Sraz

5.10.2018 17:12 / Jakub Kuljovsky
Re: Jaký kurz a software by jste doporučili pro začínajcího kodéra?

Více ...

ISSN 1801-3805 | Provozovatel: Pavel Kysilka, IČ: 72868490 (2003-2024) | mail at linuxsoft dot cz | Design: www.megadesign.cz | Textová verze