C/C++ (27) - Standardní knihovna podruhé

Dnes si povíme něco o práci s časem a o generování pseudonáhodných čísel. Ve dvou příkladech dojde na výpis aktuálního místního času a počítačovou verzi hry Macháček.

10.11.2005 07:00 | Jan Němec | přečteno 36692×

Práce s časem

Pro práci s časem nabízí standardní C množství funkcí, některé z nich jsou užitečné, ale pokrývají jen část toho, co by programátor očekával. Hlavičky funkcí a potřebné typy nalezneme v time.h. Nejdůležitějším typem je time_t, používá se zpravidla pro vyjádření času ve vteřinách a na dnešních běžných platformách jde o 32-bitové bezznaménkové číslo. Aktuální čas získáme funkcí time.

#include <time.h>

/* ... */

time_t t;
t = time(NULL);

Funkce vrací počet vteřin od Nového roku 1970 UTC, poměrně nedávno jsme tedy oslavili rovnou miliardu. V roce 2038 návratová hodnota této běžně užívané funkce (pokud ji chápeme jako 32-bitový int) přeteče do záporných čísel, pesimisté již samozřejmě očekávají pády letadel, výbuchy jaderných elektráren a podobně. Parametrem funkce je ukazatel na time_t. Pokud není NULL, uloží se i do něj návratová hodnota.

Pokud chceme čas vypsat v nějaké pro člověka čitelné podobě, musíme time_t zkonvertovat. Standardní C nabízí typ struct tm a funkce localtime a gmtime.

struct tm {
  int tm_sec;         /* vteřiny 0 - 59, max. 61 */
  int tm_min;         /* minuty 0 - 59 */
  int tm_hour;        /* hodiny 0 - 23 */
  int tm_mday;        /* den v měsíci 1 - 31 */
  int tm_mon;         /* měsíc 0 - 11 */
  int tm_year;        /* rok od 1900 */
  int tm_wday;        /* den v týdnu 0 - 6 od neděle */
  int tm_yday;        /* den v roce 0 - 365*/
  int tm_isdst;       /* letní čas */
};

struct tm *gmtime(const time_t *timep);
struct tm *localtime(const time_t *timep);

Obě funkce mají jako parametr ukazatel na aktuální čas (například získaný funkcí time). Předávání jednoduchého čísla - vstupního parametru pomocí ukazatele je jistě podivné, rozumnější by jej bylo předat přímo. Stejně podivné je i předávání výsledku. Ve standardní knihovně je pro každé vlákno staticky naalokovaná paměť pro struct tm. Funkce jako gmtime a localtime ji změní a vrátí na ni ukazatel. Následující volání těchto funkcí obsah paměti pochopitelně opět změní. Rozumnější chování mají funkce gmtime_r a localtime_r, které mají jako druhý a výstupní parametr ukazatel na uživatelem definovanou strukturu typu struct tm.

#include <stdio.h>
#include <time.h>

int main(void) {
  time_t t;
  struct tm *pt;
  const char *dny[] = {
   "neděle", "pondělí", "úterý",  "středa", "čtvrtek",  "pátek",  "sobota" 
  };

  t = time(NULL);
  pt = localtime(&t);
  if (!pt) {
    perror("Chyba localtime: ");
    return 1;
  }
  if (pt->tm_wday < 0 || pt->tm_wday > 6) {
    fputs("Chyba libc, ale nemusíme kvůli tomu spadnout.\n", stderr);
    return 1;
  }
  printf("Dnes je %s %i.%i.%i, %i:%i:%i místního %sního času.\n",
    dny[pt->tm_wday], pt->tm_mday, pt->tm_mon + 1,
    pt->tm_year + 1900, pt->tm_hour, pt->tm_min, pt->tm_sec,
    pt->tm_isdst ? "let" : "zim");
  return 0;
}

Je vidět, že základní práce s časem není v C obtížná. Důležité je si dát pozor na meze hodnot ve struct tm, například den v měsíci začíná od 1, ale měsíc v roce od 0, k roku je třeba přičíst 1900. Mám s tím osobní zkušenost, mojí "zásluhou" viselo před dvěma lety několik hodin na hlavní stránce jednoho zpravodajského serveru měsíc staré datum hlavního článku. V tehdy vznikajícím systému, kterým server generoval HTML stránky, jsem prostě zapomněl přičíst jedničku k tm_mon.

O něco obtížnější je situace při měření času s přesností větší než jedna vteřina. Standardní zde C nabízí funkci clock, která měří počet tiků, jež strávil program na procesoru. Na dnešních systémech s více procesy tedy nejde použít na měření čas jako fyzikální veličiny.

#include <time.h>

clock_t clock();

Výsledek můžeme převést na vteřiny vydělením konstantou CLOCKS_PER_SEC. Podle normy POSIX má být CLOCKS_PER_SEC rovné 1000000 bez ohledu na vlastnosti procesoru, ale rozhodně bych na to (u programů, které mají být přenositelné) nespoléhal. Navíc se návratová hodnota clock zpravidla mění po krocích. Na mém počítači po setinách vteřiny, ale setkal jsem se i se systémem, kde clock celou vteřinu vracela stejnou hodnotu.

Pokud programátor v C potřebuje měřit čas s větší přesností, musí sáhnout po nějaké nestandardní a nepřenositelné funkci. Na unixových systémech použije zpravidla gettimeofday, zájemce odkazuji na manuálové stránky.

Náhodná čísla

Pro generování pseudonáhodných čísel nabízí standardní C funkce rand a srand.

#include <stdlib.h>

int rand(void);
void srand(unsigned int seed);

Funkce rand vrací pseudonáhodné číslo mezi 0 a RAND_MAX, číslo vypočítá z dat, kterým se říká semínko. S každým voláním rand se jako vedlejší efekt semínko změní a to způsobem, který lze reprodukovat. Semínko můžeme nastavit funkcí srand, na počátku programu je nastavené na jedna. Programátor obvykle inicializuje náhodný generátor funkcí srand jen jednou na začátku programu a potom už jen volá rand. Jako parametr srand se většinou volí nějaká hodnota odvozená z času. Příznivce hry Macháček snad potěším následujícím programem:

#include <stdio.h>
#include <stdlib.h>
#include <time.h>

int main(void) {
  int kostka1, kostka2;
  
  srand(time(NULL));
  kostka1 = rand() % 6 + 1;
  kostka2 = rand() % 6 + 1;

  if (kostka1 < kostka2) {
    int tmp = kostka1;
    kostka1 = kostka2;
    kostka2 = tmp;
  }
  if (kostka1 == kostka2) {
    printf("%i Apač", kostka1);
    switch (kostka1) {
      case 1: puts(""); break;
      case 5:
      case 6: puts("ů"); break;
      default: puts("ové"); break;
    }
  } else {
    if (kostka1 == 2 && kostka2 == 1) {
      puts("Macháček!");
    } else {
      printf("%i%i\n", kostka1, kostka2);
    }
  }
  return 0;
}

Šťourové mi snad odpustí, že program při opakovaném spuštění během jedné vteřiny vrací vždy stejný výsledek a že pokud RAND_MAX není 6 * N - 1, budou na kostkách malá čísla padat s nepatrně větší pravděpodobností.

Generování pseudonáhodných čísel je složitá úloha. Dokládá to i fakt, že starší verze libc měly problémy s implementací funkce rand a například spodní bity návratové hodnoty byly "méně náhodné" než ty horní, takže pro generování výsledků hodu kostkou se doporučovalo místo

kostka = 1 + rand() % 6;

volat raději

kostka = 1 + (int) (6.0 * rand() / (RAND_MAX + 1.0));

Při konkrétních typech generátorů zase hrozí, že po sobě jdoucí vygenerované body v N-rozměrném prostoru se budou nacházet jen v některých nadrovinách (což může hodně vadit třeba při numerickém výpočtu integrálu) a podobně. Je třeba si vždy ujasnit, co od generátoru náhodných čísel očekáváme. Pokud jen generujeme náhodnou krajinu, vybíráme náhodný tah z knihovny zahájení šachového programu nebo množstvím klientských programů s náhodným výběrem kopie serveru rozdělujeme zhruba rovnoměrně zátěž, pak bude rand tou pravou volbou. Pokud implementujeme za pomoci náhodného generátoru nějaký šifrovací protokol, který stojí a padá na kvalitě generátoru, pak je třeba minimálně nastudovat dokumentaci ke standardní knihovně příslušného překladače a případně implementovat generátor vlastními silami nebo za použití nějaké jiné knihovny.

Pokračování příště

V dalším dílu probereme práci s jednotlivými znaky a funkce pro vyhledávání a třídění pole.

Online verze článku: http://www.linuxsoft.cz/article.php?id_article=1017