LINUX SOFTWARE

Jazyk C poskytuje programátorovi poměrně nízkoúrovňový přístup do paměti. Dnes si ukážeme jak o pamět za běhu programu požádat a jak ji uvolnit. Dojde i na některé další paměťové knihovní funkce.

26.5.2005 06:00 | Jan Němec | přečteno 40241×

Alokace paměti

Z předchozích dílů známe dva odlišné způsoby vyhrazení paměti, v obou případech se jedná o víceméně implicitní alokaci paměti, o kterou se postará překladač při definici proměnné. V prvním případě jde o proměnnou definovanou mimo tělo funkce, zde se místo vyhradí již při zavedení programu do paměti. Do druhé kategorie spadají parametry a lokální proměnné funkcí, pro něž vyhradí překladač místo na zásobníku a to až za běhu programu při vstupu do funkce. Problém nastane, pokud neznáme paměťové požadavky programu již v době překladu. Jedná se přitom o zcela běžnou situaci, například programátor grafického editoru nezná velikost obrázků, které bude uživatel upravovat. První způsob vyhrazení paměti pro data upravovaného obrázku, definice globální proměnné typu pole, je prakticky nepoužitelný. Při malém rozměru bychom nemohli editovat velké obrázky, definice velkého pole by zase znemožnila spuštění programu na slabších počítačích, navíc i na silných strojích by se jednalo o trestuhodné mrhání pamětí, která by pak chyběla jiným procesům. Druhý způsob, definice lokální proměnné sice ve spojení s rekurzí problém teoreticky řeší (ve funkci můžeme definovat malé pole a vyvolat rekurzi do potřebné hloubky, čímž získáme dostatek instancí malých polí, na něž můžeme přistupovat přes ukazatele), ale pro praktickou použitelnost a efektivitu algoritmů by měl podobný přístup ještě mnohem horší důsledky než segmentace paměti v MS-DOSu. Navíc celkové množství paměti na zásobníku může být na konkrétních platformách nepříjemně omezené.

Naštěstí lze o paměť požádat za běhu programu i explicitně.

#include <stdlib.h>

void *malloc(size_t size);
void free(void *ptr);

Funkce malloc alokuje paměť o velikosti size bytů. Typ size_t je nezáporný celočíselný typ podobně jako například unsigned. V případě úspěchu vrací funkce platný ukazatel na počátek alokované paměti, v opačném případě NULL. Obsahem paměti mohou být libovolná data, která můžeme přepsat. Po ukončení práce s pamětí je třeba zavolat free, jinak by zůstala rezervována a nevyužita.

#include <stdlib.h>
#include <stdio.h>

int main(int argc, char **argv) {
  int pocet, i;
  int *pole;
  
  /* Ošetření parametrů programu */
  if (argc != 2 || (pocet = atoi(argv[1])) < 1) {
    puts("syntaxe: alokace [celé kladné číslo]");
    return 1;
  }

  /* Alokace paměti, něco jako definice
  
     int pole[pocet];
     
     ale pocet je proměnná, nikoli konstanta, uvedená definice by tedy
     ani neprošla překladem.
  */
  pole = malloc(pocet * sizeof(int));
  
  /*
    Alokace se nemusí podařit, například pokud chceme větší blok paměti, než
    je dostupný.
  */
  if (!pole) {
    puts("neúspěch alokace");
    return 1;
  }
  
  /*
    Paměť nějakým způsobem použijeme. Jistě by se dal vymyslet užitečnější
    příklad.
  */
  for (i = 0; i < pocet; i++)
    pole[i] = i;
  for (i = 0; i < pocet; i++)
    printf("%i ", pole[i]);
  
  /*
    A uvolníme.
  */
  free(pole);
}

Běžné operační systémy poskytují procesům služby, které zhruba odpovídají funkcím malloc a free, nicméně C runtime knihovna se obvykle snaží využití paměti nějakým způsobem optimalizovat, takže jednotlivá volání ještě nemusí vždy skončit na operačním systému. Udržovat informaci o volném místě pro jednotlivé byty by bylo velmi neefektivní, paměť se proto zpravidla ve skutečnosti volajícímu přiděluje po blocích (například 16 bytů), takže malloc(1) nezabere jen jeden byte. Alokace velkého množství několikabytových polí může být proto neefektivní.

Při práci s dynamicky alokovanou pamětí se můžeme dopustit celé řady chyb s nepříjemnými důsledky. Chyba se v některých případech nemusí projevit vždy, navíc dost často ovlivní chování programu mimo chybné místo.

Přístup na nenaalokované místo
Program zpravidla spadne nebo si přepíše vlastní data.
Přístup za naalokované místo
Nemusí se stát vůbec nic (alokace po blocích), program může spadnout hned (neplatná adresa), později (porušeny struktury volné paměti) nebo si přepsat data z jiné alokace.
Přístup do uvolněné paměti
Projev chyby opět závisí na okolnostech.
Neuvolnění paměti
Dnešní operační systémy paměť uvolní po ukončení procesu, ale při alokaci v cyklu a dostatečně dlouhém běhu programu může nastat nedostatek paměti.
Opakované volání free
Již jednou uvolněný ukazatel znovu dealokujeme. Opět může vést k pádu programu, ale nemusí se stát vůbec nic.

Je vidět, že jazyk C "nabízí" vývojářům opravdu velké množství druhů chyb při práci dynamicky alokovanou pamětí a programátoři tuto "nabídku" intenzivně využívají. Na druhou stranu v C má programátor správu paměti pod kontrolou a záleží jen na něm, zda dokáže svůj program odladit. O modernějších jazycích typu Java, kde se o dealokaci stará runtime se to říci nedá.

Ukazatel vrácený funkcí malloc můžeme přetypovat na ukazatel na unsigned char a získat tak přístup do paměti jako do pole bytů. Jednoduchými for cykly tak lze paměť kopírovat, porovnávat nebo do ní psát, nicméně pro základní operace je jednodušší a efektivnější používat knihovní funkce pro práci s pamětí.

#include <string.h>

void *memcpy(void *dest, const void *src, size_t n);
void *memmove(void *dest, const void *src, size_t n);
void *memset(void *s, int c, size_t n);
int memcmp(const void *s1, const void *s2, size_t n);

Funkce memcpy kopíruje size_t bytů z adresy src na adresu dest, tento ukazatel je zároveň návratovou hodnotou funkce. Důležité je, že se oba bloky paměti nesmějí překrývat, nelze tedy například pomocí memcpy posunout nějaké delší pole o jeden byte. Tento nedostatek odstraňuje funkce memmove, která však může být nepatrně pomalejší. Pomocí memset lze nastavit všechny byty v bloku paměti na adrese s délky n na hodnotu c. V praxi se nejčastěji používá pro nulování. Funkce memcmp paměť porovnává. Oba bloky s1 i s2 mají délku n a funkce vrací záporné číslo pokud je první odlišný byte obou bloků menší u s1, v opačném případě vrací kladné číslo a konečně v případě rovnosti je návratovou hodnotou 0. Když dodám, že porovnání probíhá bezznaménkově, jistě uhodnete, co vypíše na běžné platformě následující program.

#include <stdio.h>
#include <string.h>

int main(void) {
  signed char s1 = 0;
  signed char s2 = -1;
  
  printf("%i\n", memcmp(&s1, &s2, 1));
  return 0;
}

Funkce memcmp porovnává dva jednobytové bloky o hodnotách s1 a s2. Při běžném porovnání pomocí operátoru < by si překladač odvodil z typu operandů, že má použít znaménkové porovnání, ale memcmp kontext volání pochopitelně nezná a porovnává obě čísla, jako by se jednalo o unsigned char. Běžnou implementací záporných čísel je dvojkový doplněk, -1 je 255 bezznaménkově, tedy s1 < s2. Program vypíše -1.

Z příkladu je patrné, že funkce pro práci s pamětí lze použít nejen pro dynamicky alokovanou paměť, ale i na běžné proměnné nebo pole. V těchto případech je vhodné velikost bloku paměti zadat pomocí operátoru sizeof.

#define VELIKOST 1024
int a[VELIKOST];
int b[VELIKOST];

/* ... */

/* do pole a nakopíruj pole b */
memcpy(a, b, sizeof(a));

Nedbalí programátoři jsou často líní definovat velikost pole pomocí makra, a velikost kopírovaného bloku pomocí sizeof. Obvykle také předpokládají, že velikost číselných typů je neměnná. Při změně velikosti polí nebo dokonce platformy programu pak musejí opravovat kód na více místech a vznikají tak zbytečné chyby.

Pokračování příště

V příštím dílu se podíváme na funkce pro práci s řetězci.

C/C++ (20) - Alokace paměti

Alokace paměti

Pokračování příště