LamaDict

Dokumentace

Formát databáze

Databáze je tvořena 256 soubory, do těchto souborů je rovnoměrně rozdělana databáze slov. Soubory jsou pojmenovány jmény data0.txt až data255.txt. Počáteční slova souborů dataxxx.txt jsou zapsána v souboru idx.txt.

Soubory dataxxx.txt

Tyto soubor jsou textové a tvoří je 2 sloupce oddělené znakem středník ';' a ukončené znakem enter \n (0x0A). V prvním sloupci je zdrojové slovo, v druhém sloupci je cílové slovo. Pokud je cílových slov více, jsou jednotlivá oddělena znakem trubka '|'.

Soubor idx.txt

Tento soubor je také textový a tvoří ho jeden sloupec ukončený znakem \n. Soubor obsahuje počáteční slova souborů dataxxx.txt.

poznámka

Pro oba směry překladu je třeba udělat samostatnou databázi.

Dále jsou všechny znaky převedeny na malé

Pořadí znaků je bráno následovně
' ', '.', ',', ';', '?', '!', ':', '"', '\'', '`', '-', '|', '/', '\\', '(', ')', '[', ']', '<', '>', '{', '}', '&', '%', '$', '@', '_', '=', '^', '+', '*', '#', '~', 'a', 'á', 'b', 'c', 'č', 'd', 'ď', 'e', 'é', 'ě', 'f', 'g', 'h', 'i', 'í', 'j', 'k', 'l', 'm', 'n', 'ň', 'o', 'ó', 'p', 'q', 'r', 'ř', 's', 'š', 't', 'ť', 'u', 'ú', 'ů', 'v', 'w', 'x', 'y', 'ý', 'z', 'ž', '0', '1', '2', '3', '4', '5', '6', '7', '8', '9'




E-Mail Home