FORMAT PLIKU STERUJCEGO FRAZERA

UWAGA! Przed przeczytaniem zapoznaj si z formatem sownika
uytkownika (README_udict)!

Oprcz tumaczenia sownikowego, frazer zajmuje si rwnie tumaczeniem
pojedynczych znakw specjalnych oraz interpretacj liczebnikw.

Najprostsz lini jest tu:

spell <znak> <tumaczenie>

podajc w jaki sposb naley wymawia dany znak.

Przykad:

spell @ mapa
spell _ podkrelenie

Cigi znakw mona podawa w linii "emot":

emot <cig> <tumaczenie>

Z uwagi na niemoliwo stosowania spacji w <cig>, stosuje si tu
nastpujc konwencj:

Wyjtkowo ostatnim znakiem tumaczenia moe by "!" lub "?". Oznacza
to zakoczenie frazy po dopasowaniu wszystkich kolejnych emoticonw.

+ - spacja
\<znak> - znak

Przykad:

emot :) haha
emot :-) hahaha
emot <co+jest?> co jest?

Dodatkow lini jest "emotmod" wskazujc modyfikator, z jakim domylnie
bd wymawiane emotikony (domylnie 1).

Nie naley jednak umieszcza linii "emot" w gwnym pliku frazera - w razie
koniecznoci mona poda ciek do dodatkowego pliku. Podstawowe emoticony
zaczone s w pliku pl_emots.dat, automatycznie doczanym w milena_kadu.
Dodanie linii "emot" zmienia nieco dziaanie frazera - kady cig liter
zawarty midzy "<" i ">" bdzie traktowany jak emoticon!

Linia "word" suy do wstawienia linii odpowiadajcej formatowi udict.
Suy przede wszystkim do tego, aby nie tworzy zbyt wielu plikw
(np. dla milena_kadu wystarcza jeden dodatkowy plik zamiast dwch). 

Rwnie proste jest okrelanie jednostek przy liczebnikach mianowanych:

unit <jednostka> <tlumaczenia>

gdzie "jednostka" to zapis jednostki, "tumaczenia" to cztery oddzielone
znakiem "|" sposoby wymowy, okrelajce kolejno:
  jeden		(np. "kilometr")
  od 2 do 4	(np. "kilometry")
  powyej 4	(np. "kilometrw")
  uamek	(np. "kilometra")
  
Przykad:

unit cm centymetr|centymetry|centymetrw|centymetra

ROZPOZNAWANIE I WYMOWA FRAZ Z LICZEBNIKAMI

UWAGA! Wszystkie nazwy s cigami maych liter a-z oraz cyfr.

Do okrelania sposobw rozpoznawania i wymowy su:

I) linia "recognize" podajca wzorce rozpoznawania

recognize <nazwa> <wzorzec>

Podobnie jak w przypadku sownika, wzorce pobierane s od ostatniego.
Jednak jeli nazw poprzedzi si znakiem "+", wzorzec zostanie
wstawiony na koniec listy. Jeli nazwa bdzie poprzedzona znakiem "."
a ostatnim dopasowanym znakiem bdzie kropka, po ktrej nastpi cig
spacji i wielka litera, rozpoznawanie zostanie zakoczone przed kropk,
wymuszajc koniec zdania.

Wzorzec rozpoznawania moe zawiera:

1) cig dowolnych znakw z wyjtkiem spacji, "\" i "{"
2) znak "\" i nastpujcy po nim dowolny znak. Oznacza to, e wystpienie
   znaku nie jest obowizkowe.
3) format rozpoznawania zawarty w nawiasach klamrowych.

Format rozpoznawania rozpoczyna si liter z zakresu a-zA-Z, stanowic
nazw zmiennej, nastpujcego po niej dwukropka oraz dopasowania.
Dopasowanie to:

r - liczba rzymska. Dopasowuje do liczby w zapisie rzymskim z zakresu
od 1 do 39. Zakres mona ograniczy poprzez podanie za liter "r"
wartoci minimalnej i/lub poprzedzonej znakiem "-" wartoci maksymalnej.

Przykad: {a:r1-12}

d - liczba dziesitna. Moe by poprzedzona cyfr oznaczajc dopasowanie
do cigu cyfr podanej dugoci. Rwnie jak w przypadku liczby rzymskiej
zakres mona ograniczy.

Przykad: {s:2d0-59}

e<nazwa> - wyraenie. Dopasowuje do cigu znakw z linii "expr" (patrz niej).
Zapamitan wartoci jest dopasowany cig znakw. Jeli istnieje wicej
niz jedna linia "expr" o danej nazwie, dopasowywane bd wszystkie zaczynajc
od ostatniej.

c<nazwa> - wybr. Dopasowuje do cigu znakw w linii "choice". Zapamitane
s zarwno warto okrelona w "choice", jak i dopasowany cig znakw,
zastpiony odpowiednim cigiem z linii "choiceval" jeli taka istnieje.

Wbudowany wybr "mond" oznacza nazw miesica w dopeniaczu.

u<jednostka> - jednostka z linii "unit"

II) Linia "expr" podajca dopasowania do cigw znakw, ktre musz by
    powtrzone przy wymawianiu. Posta linii to:
    
expr <nazwa> <cig>

Cig to dowolny cig liter, interpretowany podobnie jak w przypadku sownika,
przy czym jedyn specjaln konstrukcj jest lista moliwoci w nawiasach.

Przykad:
expr wieku (wieku|stulecia)

III) Linia "choice" okrelajca jedn z moliwoci. Format linii to:

choice <nazwa> <warto> <string>

Przykad:

choice dtyg 1 pon
choice dtyg 1 poniedziaek
choice dtyg 2 wto
choice dtyg 2 wtorek

IV) Linia "choiceval" okrelajca wymow danej moliwoci. Format linii to:

choiceval <nazwa> <warto> <wymowa>

Przykad:

choiceval dtyg 1 poniedziaek
choiceval dtyg 2 wtorek

V) Linia "sayas" okrelajca sposb wymowy rozpoznanego cigu. Format linii to:

sayas <nazwa> <wymowa>

gdzie "wymowa" moe zawiera:

1) litery z wymawialnego zakresu (mae litery jzyka polskiego)
2) spacje
3) zawarte w nawiasach klamrowych formaty.

Format rozpoczyna si od jednoliterowej nazwy zmiennej (odpowiadajcej nazwie
z linii "recognize") oraz opcjonalnie dwukropka i sposobu wymowy. Jeli
nie podano sposobu wymowy, warto zmiennej bdzie tumaczona na:

a) w przypadku liczby - liczebnik w formie podstawowej
b) w przypadku "expr" - dopasowany cig.
c) w przypadku "choice" - warto z "choiceval" lub dopasowany cig.
d) w przypadku "unit" - odpowiednia forma jednostki.

Sposb wymowy nie dotyczy expr i unit. Podaje on w jakiej formie ma by wymwiony
liczebnik. Istniej nastpujce mozliwoci:

dmx - forma podstawowa (np. "dwa")

dfx - forma podstawowa w rodzaju eskim ("dwie")

df0 - jak dfx, ale dotyczy liczb dwucyfrowych z wymawianym
	pierwszym zerem ("zero dwie")
dap - wyliczenie w formie przyswkowej ("drugo")

dac - ilo w formie przyswkowej ("dwu")

dmt - nazwa miesica w dopeniaczu ("lutego")

Oraz wyliczenia:

dmm - rodzaj mski, mianownik ("drugi")
dfm - rodzaj eski, mianownik ("druga")
dnm - rodzaj nijaki, mianownik ("drugie")
dmc - rodzaj mski, celownik ("drugiemu")
dfd - rodzaj eski, dopeniacz ("drugiej")
dmd - rodzaj mski, dopeniacz ("drugiego")
dfb - rodzaj eski, biernik ("drug")
dmn - rodzaj mski, narzdnik ("drugim")

Kompletne przykady w pliku pl_phraser.dat

