Databáze je tvořena 256 soubory, do těchto souborů je rovnoměrně rozdělana databáze slov. Soubory jsou pojmenovány jmény data0.txt až data255.txt. Počáteční slova souborů dataxxx.txt jsou zapsána v souboru idx.txt.
Soubory dataxxx.txt
Tyto soubor jsou textové a tvoří je 2 sloupce oddělené znakem středník ';' a ukončené znakem enter \n (0x0A). V prvním sloupci je zdrojové slovo, v druhém sloupci je cílové slovo. Pokud je cílových slov více, jsou jednotlivá oddělena znakem trubka '|'.
Soubor idx.txt
Tento soubor je také textový a tvoří ho jeden sloupec ukončený znakem \n. Soubor obsahuje počáteční slova souborů dataxxx.txt.
poznámka
Pro oba směry překladu je třeba udělat samostatnou databázi.