Dokumentti [Arbeidsplan.html] antaa yleiskuvan.
Tässä mennään yksityiskohtiin
- lisätä nämä sanat sanakirjaan: main/words/dicts/fkvnob/inc/dagensord_missing.txt
- lisätä sanakirjasanat fst:hen:
- käydä läpi fkv/src/fst/stems/ ja siinä adverbs.lexc, adjectives.lexc, nouns.lexc, verbs.lexc Tiedostojen lopussa on adv_x, a_x, n_x, v_x. Ne pitää luokitella oikein.
- testata lemmat make check avulla ja korjaa
- lisätä sanat fkv/test/data/inc_aikamatka2.txt fst:hen
- lisätä sanat fkv/test/data/inc_missing_interj
- käydä tekstejä läpi ja lisätä puuttuvia sanoja fst:hen
- miettiä, oliko fkv/morphology/stems/numerals.lexc hyvä idea
Lisätä fst-hen:
cat teksti | preprocess | ufkv | grep '?' | cut -f1
Sen jälkeen katsella, ja lisätä miihin sopi
- main/langs/fkv/src/fst/stems
Lisätä sanakirjaan:
Tee sanakirja-automaatti:
cd
cd main/words/dicts/fkvnob
sh fkvnob.sh
lookup bin/fkvnob.fst
Sitten katsot, onko sanasi jo sanakirjassa:
cat sanakirjaehdokaslista.txt | lookup bin/fkvnob.fst | grep '?' | cut -f1
Sen jälkeen katsella, ja lisätä miihin sopi
- main/words/dicts/fkvnob/src/
- twolc, lexc-morfologia: Leena, Anna-Kaisa, Mari
- lexc-leksikko (n_x, jne.): Mervi n_x Anna-Kaisa muut leksikot
- fkvnob-sanakirja, esimerkit: Pirjo
- fkvnob-sanakirja, fkv-oikoluku: Pirjo (tehty?)
- fkvnob-sanakirja, nob-oikoluku: Tove
- sanakirjan kääntäminen: Ciprian
- nobfkv-työ: Tove, muut
- nob-artikkelien siivoaminen: Tove, muut
- puuttuvien nob-sanojen
- lisääminen: Trond, Tove, pedagogit
- kääntäminen: Pirjo, muut
- Tekstit
- T-tekstien kerääminen: KI
- T, P-tekstien lisääminen korpukseen: Sindre, ...
- Aikamatka-tekstien lisääminen korpukseen: Sindre, ...
- Uusien teksteistä tulevien sanojen lisääminen sanakirjaan ja fst:hen:
Pitää tehdä uusi lista.