-
Notifications
You must be signed in to change notification settings - Fork 0
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Fjerne semtagger ved derivasjoner ( #7
Comments
Comment 13077Date: 2018-11-02 11:22:33 +0100 Vi må få fjernet semtagger ved derivasjoner. Semtaggen gir feil informasjon ved de fleste derivasjoner, f.eks. ceavzilvuohta ceavzil+Ex/A+Sem/Hum+Der/vuota+N+Sg+Nom hvor ceavzilvuohta ikke kan være Sem/hum Unntaket er der hvor vi har N Der/ N, f.eks. biillaš biila+Ex/N+Sem/Veh+Der/Dimin+N+Sg+Nom |
Comment 13498Date: 2019-06-14 11:22:55 +0200 Ja, fant også eksempler. Det ødelegger for disambiguering av særskrivinger. ; "geatnegas" Ex/A Sem/Hum Ex/Attr Der/vuota N Sg Gen Allegro <W:0.0> REMOVE:3463 |
Comment 13499Date: 2019-06-14 12:04:35 +0200 De vil fjerna taggane, heller enn å endra dei? (Det er det lettaste, reint teknisk.) |
Comment 13500Date: 2019-06-14 13:06:24 +0200 (In reply to Sjur Nørstebø Moshagen from comment #2)
Jeg foreslår å fjerne bortsett fra for +Der/Dimin, hvis det er mulig. Dinimutiv beholder det semantiske innholdet som stammen har. For de andre derivasjonene, kan man vurdere å legge inn en tagg i derivasjonsstien, hvis det er ønskelig for grammatikkDivvun. F.eks. +Sem/State for alle +Der/vuohta. Det vil i hvertfall være ganske nært, og vil utelukke +Sem/Hum osv. De ordene som er leksikaliserte, vil jo få taggen som er lagt i stemsfile, f.eks ráhkisvuohta+N+Sem/Perc-emo+Sg+Nom De som ikke er leskikaliserte, vil dat få +Sem/State |
Comment 13501Date: 2019-06-14 13:09:10 +0200 Lag til i svn rev. 180817-180827. Jamfør FØR: $ echo ceavzilvuohta | hfst-lookup -q analyser-gramcheck-gt-desc.hfstol og ETTER: $ echo ceavzilvuohta | hfst-lookup -q analyser-disamb-gt-desc.hfstol Eg har ikkje lagt til sperre mot Der/Dimin - slik filteret er no så blir alle semtaggar fjerna framfor alle derivasjonar. Vi prøver med det, og så ser vi kva som bør endrast etter kvart (og kva som er mogleg). |
Comment 13503Date: 2019-06-17 09:38:39 +0200 (In reply to Sjur Nørstebø Moshagen from comment #4)
Vil det si alle derivasjonan som finnes i lista nedenfor (selvfølgelig bare om ordet har en semtag for å begynne med)? ! 1 2 3 4 POS type ! Der#2
! Der#4 |
Comment 13504Date: 2019-06-17 09:44:13 +0200 (In reply to Linda Wiechetek from comment #5)
Ja. Rettare sagt så fjernar eg semantiske taggar framfor desse taggane: +Der +Der1 +Der2 +Der3 +Der4 +Der5 fordi alle andre derivasjonstaggar skal ha ein slik generell (posisjons)derivasjonstagg framfor seg. |
Comment 13505Date: 2019-06-18 09:14:34 +0200
Ved å gjøre unntak for +Der1, så beholder +Der/Dimin sem-taggen. Det er tre tagger med +Der1 som involverer +N: og alle disse vil beholde sin semantikk ved derivasjon. |
Comment 13506Date: 2019-06-18 09:25:19 +0200 Det er flere tagger, fordi vi må se både på dem som grå fra +A og +N: +Der/ár NSR+Ex/N+Prop+ACR+Der/ár+N+Sg+Acc+Err/Orth-nom-acc For de to siste vil ikke semtaggen holde stikk, fordi NSR er +Sem/Org, Gáivuona er+Sem/Plc og og derivasjonenene burde være +Sem/Hum Den siste har fremdeles +Sem/Plc, hvorfor det? Slik er stien: @U.Cap.Opt@+Der1+Der/t+A+CmpN/SgN+CmpN/SgG+CmpN/Pl |
Comment 13507Date: 2019-06-18 09:31:24 +0200
+Der/NomAg er +Der2- Thomas, burde også +Der/t og +Der/ár være samme +DerN som +Der/NomAg ? |
Comment 13509Date: 2019-06-18 10:01:06 +0200 (In reply to Lene Antonsen from comment #8)
Æ snakka akkurat med Duommá om det og han sier at de siste to kan tas bort eller flyttes til en anna DerN. Æ kunne bare tenkt mæ at Der/t kan være fint å ha om man sammenligner med Der/laš etter Sem/Plc. Ellers har æ ingen store preferanser. |
Comment 13510Date: 2019-06-18 10:04:28 +0200 (In reply to Lene Antonsen from comment #9)
Er ikke Der/NomAg noen som er agens, mens Der/ár og Der/t noen som har en tilhørighet til en plass/organisasjon? |
Comment 13511Date: 2019-06-18 10:40:35 +0200
|
Comment 13512Date: 2019-06-18 10:42:16 +0200
Jeg er enig i å flytte til +Der2, jeg har ikke foreslått å fjerne dem. |
Comment 13513Date: 2019-06-18 10:55:25 +0200
Kanskje det ikke er tatt høyde for +N+Prop+Sem/Plc+Der... ? |
Comment 13516Date: 2019-06-21 10:34:52 +0200 (In reply to Lene Antonsen from comment #14)
Det må kanskje Duommá svare på? |
Comment 13517Date: 2019-06-21 10:41:46 +0200 (In reply to Linda Wiechetek from comment #15)
Beklager at jeg var uklar, jeg burde ha skrevet: Årsaken er kanskje at Sjur ikke har tatt høyde for +N+Prop+Sem/Plc+Der.. i filteret. |
Comment 13524Date: 2019-06-27 18:08:33 +0200 Etter Sjurs endring, så får vi Jeg ser at hvis det er en +Err/Orth, så blir ikke sem-taggen fjernet: vn ci -m "endret fra +Der1 til +Der2 for +Der/t og +Der/ár, se Bz. 2522" src/morphology/root.lexc src/morphology/affixes/ |
This issue was created automatically with bugzilla2github
Bugzilla Bug 2522
Date: 2018-11-02T11:22:33+01:00
From: Lene Antonsen <<lene.antonsen>>
To: Sjur Nørstebø Moshagen <<sjur.n.moshagen>>
CC: elena.j.paulsen, lene.antonsen, linda.wiechetek, maja.l.kappfjell, sjur.n.moshagen, thomas.omma, trond.trosterud
Last updated: 2019-06-27T18:08:33+02:00
The text was updated successfully, but these errors were encountered: