FORMAT PLIKU SOWNIKA UYTKOWNIKA

W czasie wczytywania pliku (lub plikw) zawsze najwaniejsza jest ostatnia
pasujca linia (tzn. wzorce dopasowania pobierane s od ostatniego). Pozwala
to na atwe nadpisywanie ju wczytanych wzorcw poprzez wpisanie pasujcego
do istniejcej ju konstrukcji wzorca w nastpnym pliku.

Linie sownika maj posta:

wzorzec wymowa

gdzie wymowa moe zawiera:
	tekst na ktry ma by przetumaczony wzorzec
	flagi

Flagi rozpoczynaj si znakiem $ i powinny by stosowane wyacznie
w przypadku, gdy przetumaczony tekst jest pojedynczym sowem
W przeciwnym przypadku naley stosowa sekwencje informacyjne
w tumaczeniu.

Komentarze rozpoczynaj si cigiem znakw // i kocz si wraz z kocem
linii.

POSTA WZORCA

Wzorzec stanowi cig znakw nie zawierajcy spacji, ktry bdzie dopasowany
do wejciowego tekstu. Dopasowywany jest na pocztku sowa, dopasowany
tekst musi koczy si na granicy sowa.

We wzorcu mog wystpowa nastpujce znaki:

a) maa litera - dopasowanie do maej lub duej litery
b) dua litera - dopasowanie do duej litery
c) cyfra lub znak przestankowy - dopasowanie do konkretnego znaku
d) znak "_" (podkrelenie) - oznaczajcy opcjonalne wystpienie spacji
d) znak "+" (plus) - oznaczajcy wystpienie co najmniej jednej spacji
e) znak "`" (odwrotny apostrof) - oznaczajcy opcjonalne wystpienie apostrofu
f) znak "~" (tylda) - oznaczajcy opcjonalne wystpienie mylnika i/lub spacji
g) cig liter w nawiasach kwadratowych - oznaczajcy dopasowanie do dowolnej
   litery z cigu
   
   Przykad: ren[e] pasuje do "rene" i "ren"
   
h) cig moliwoci zawarty w nawiasach okrgych oddzielony znakiem "|",
   oznaczajcy dopasowanie do najduszej pasujcej moliwoci.
   
   Przykad: john(a|owi|) pasuje do "johna", "johnowi" i "john"

i) "*" (gwiazdka) - oznaczajcy dopasowanie do reszty liter a do koca wyrazu.
   Nie naley stosowa w sowniku gwnym.
   
Wzorzec musi rozpoczyna si liter lub cyfr. Po znaku "*" nie moe wystpi
litera. Koczcym znakiem nie moe by "_" ani "+".

FLAGI

Aktualnie rozpoznawane s nastpujce flagi:

<cyfra> - ustalenie akcentu na n-tej sylabie od koca
+<cyfra> - ustalenie akcentu pomocniczego na n-tej sylabie od pocztku
S - wyraz jest skrtowcem i ma by przeliterowany
u - wyraz nie jest akcentowany
v - wyraz jest czasownikiem
o - wyraz jest czasownikiem posikowym (nieakcentowanym)

We flagach mona poda co najwyej jedn liter!

Przykady:

// Sowo "DNA" bdzie odczytane jako "de~'en~!a", ale "Dna" nie
DNA $S

// "waszyngton" bdzie akcentowany na trzeciej sylabie od koca
waszyngton $3

// sowo "zno" bdzie potraktowane jako czasownik i w poczeniu
// z poprzedzajcym "nie" bdzie wymawiane najo "ni~!e zno"
zno $v

TEKST WYNIKOWY

Tekst wynikowy jest tekstem, ktry zastpi dopasowany wzorzec. Moe
zawiera znaki akceptowane przez nastpn faz, czyli:

mae litery jzyka polskiego oraz spacje
znak '@' oznaczajcy "schwa" (przydatny w translacji anglojzycznych
	sw, np: merp@l, bit@ls)
znak %, oznaczajcy wynik korespondujcego we wzorcu dopasowania
	do moliwoci w nawiasach lub gwiazdki. Jeli po znaku % nastpi
	cyfra, brany bdzie pod uwag n-ty wynik.

Tekst moe zawiera rwnie sekwencje sterujce wymow:

~! - oznaczajcy akcent gwny na nastpnej samogosce
~, - oznaczajcy akcent pomocniczy na nastpnej samogosce
~' - oznaczajcy zmian wymowy goski (dawniej separator)
~+ - oznaczajcy przeduenie poprzedzajcej samogoski

Przykady:

s~'ingapur (brak zmikczenia 's')
w~!aszyngton (akcent na podanej sylabie)

Kady wyraz tekstu moe by poprzedzony informacjami o wymowie zawartymi
w nawiasach klamrowych oraz informacjami o akcentowaniu, zawartymi
w nawiasach kwadratowych. Z informacji o wymowie powinno si stosowa
wycznie "{v}" oznaczajce czasownik, chocia stosowanie nawet tego
nie jest zalecane. Z informacji o akcentowaniu powinno si stosowa
wycznie:

<cyfra> oraz +cyfra> (znaczenie jak we flagach)
"n" oznaczajcy wyraz nieakcentowany.

Przykad:

po+raz [n]poraz

Plik pl_udict.dat moe stanowi rdo przykadw.
