-
Notifications
You must be signed in to change notification settings - Fork 0
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Semtag categories (Bugzilla Bug 2593) #15
Comments
Comment 13463Date: 2019-05-27 16:30:45 +0200 Her vil vi ha diskusjoner angånde semantiske kategorier, bruk av tagger, overflødige tagger, muligens flere distinksjoner, osv. Det blir lettere å følge med og dokumentere på denne måten. |
Comment 13464Date: 2019-05-27 16:57:43 +0200 Spørsmål om hovedtagg og undergruppe. De mange tilfeller har vi hovedkategori og under-gruppe som er en delmengde av hovedkategorien, f.eks. +Sem/Tool Dette vil si at vi i CG legger alle disse under Sem/Tool, f.eks. for å finne komitativ vs. lokativ, bortsett fra de gangene vi ønsker å differensiere. Hvordan er det med -part? Jeg ser at +Sem/Clth-part er slike ting som man ikke kler på seg (riesa, lubma), Sem/Plant-part er kanskje litt samme fordi man kan plante soahki, men ikke soahkelasta? Jeg ser at Sem/Build-part som oftest er rom, f.eks. gievkkan. Sem/Build har ikke ekstra tagg Sem/Plc, men ved å være Sem/Build, tar vi dette settet med i PLACE-kategorien. De fleste medlemmene av +Sem/Build-part passer også der, men ikke alle, fordi her er også noen medlemmer som seaidni og sis-gáhttu. Dette burde differensieres. Hvis det passer å si at -part ikke har samme syntaktiske kjennetegn som hovedkategorien, kunne vi lage et sett +Sem/Build-room for gievkkan med venner? Dette sette vil man også intuitivt forstå at inneholder substantiv som passer inn i PLACE. Og da kan vi ha som hovedregel at -part-settene ikke er delsett av hovedkategorien. |
Comment 13465Date: 2019-05-27 17:18:00 +0200 I sme-katalogen har vi denne taggen lea +Sem/Body-abstr_Feat-cogn Vi har: Skal +Sem/Body-abstr_Feat-cogn egentlig være +Sem/Body-abstr_Feat-psych? |
Comment 13466Date: 2019-05-27 17:43:22 +0200 (In reply to Lene Antonsen from comment giellalt/bugzilla-dummy#1)
Dette burde differensieres. Hvis det passer å si at -part ikke har samme
Jeg foreslå part uten bindestrek: +Sem/Buildpart tilsvarende at vi har +Sem/Aniprod +Sem/Ani Dvs at med bindestrek: underkategori |
Comment 13467Date: 2019-05-28 10:25:59 +0200 (In reply to Lene Antonsen from comment giellalt/bugzilla-dummy#1)
Ja det er sånn som du sier og for å bli konsekvent foreslår æ at vi skriver: Sem/Buildpart i ett ord for det som ikke kan karakteriseres som Build, Clth eller Plant. Og at vi lager den taggen du foreslår for ord som "gievkan", dvs.: Sem/Build-room |
Comment 13468Date: 2019-05-28 10:28:41 +0200 (In reply to Lene Antonsen from comment giellalt/bugzilla-dummy#2)
Ja, vi tar Feat-psych og sletter Feat-cogn. Tror det kanskje er en feil at Feat-cogn kom inn. Æ har det ihvertfall ikke i min liste over mulige tagger. |
Comment 13469Date: 2019-05-28 10:33:44 +0200 (In reply to Lene Antonsen from comment giellalt/bugzilla-dummy#3)
Ja, æ er enig. Foreslo akkurat det samme uten at æ så kommentaren din :) |
Comment 13470Date: 2019-05-28 10:40:11 +0200
jeg har sjekket inn endringene i sme, smj og smn. |
Comment 13471Date: 2019-05-28 10:42:46 +0200
Jeg kan endre dette for de samiske språkene. Når det gjelder å endre fra Sem/Buildpart til Sem/Build-room, så bør dette gjøres av hver enkelt lingvist for sitt språk. Jeg kan ta sme. |
Comment 13472Date: 2019-05-28 14:20:54 +0200 (In reply to Lene Antonsen from comment giellalt/bugzilla-dummy#8)
Æ forandrer i sme gramchk-filan når leksikonet er klar. Så gjerne si ifra når du er ferdig. |
Comment 13473Date: 2019-05-28 15:14:15 +0200
Jeg er ferdig. |
Comment 13476Date: 2019-05-29 13:49:21 +0200 (In reply to Lene Antonsen from comment giellalt/bugzilla-dummy#10)
Takk! Da setter æ igang. |
Comment 13478Date: 2019-05-29 15:57:51 +0200 (In reply to Linda Wiechetek from comment giellalt/bugzilla-dummy#11)
Nå har æ oppdatert de semantiske taggan i valency.cg3, grammarchecker.cg3 og mwe-dis.cg3: Sem/Buildpart |
Comment 13479Date: 2019-05-29 16:00:07 +0200 Jeg har laget et forslag til automatisk skripting for å oppdatere taggene alle steder hvor de skal oppdateres, vi kan diskutere dette i neste uke. |
Comment 13482Date: 2019-05-31 11:33:42 +0200 (In reply to Lene Antonsen from comment giellalt/bugzilla-dummy#13)
Inkluderer det taggdefinisjonan av denne typen? LIST Sem/Body = Sem/Body Sem/Body_Body-abstr Sem/Body_Clth Sem/Body_Food Sem/Body_Group_Hum Sem/Body_Group_Hum_Time Sem/Body_Hum Sem/Body_Mat Sem/Body_Measr Sem/Body_Obj_Tool-catch Sem/Body_Plc Sem/Body_Time ; Dvs. blir alle nye tagkombinasjonan oppdatert i settan? |
Comment 13483Date: 2019-05-31 12:47:51 +0200
Ja, det er meninga. Semtaggene skal inn i flere filer i forskjellige formater, og meninga er at skriptet skal gjøre dette. Jeg har laget et halvferdig skript, men jeg trenger hjelp til å gjøre det helt ferdig. Og vi må se på noen tekniske løsninger, som f.eks. å ha semsettene i en egen fil som inkluderes i cg3-fila via INCLUDE, slik som jeg nå har gjort for sme. Men meninga var at vi diskuterer dette på møtet slik at vi kan ta hensyn til alle filer og behov når det gjelder semsettene. |
Comment 13487Date: 2019-06-05 09:19:38 +0200 Noen som vil se på sammensatte ord som slutter på -prográmma sammen med meg. Det er todelt utfordring; forstå hva begrepene faktisk betyr/inneholder, samt tag'e de med riktig Sem-tag ut i fra dette. De tag'ene som går igjen for denne "ordgruppen" er sålangt Act, Edu, Tool-it, Prod-vis, Prod-audio; dvs veldig varierende fra "program" til "program" :-) Her er de utaggede fra smj (er laangt flere i sma): prográmma som enkeltstående ord er nå tagget +Sem/Act_Tool-it |
Comment 13491Date: 2019-06-06 10:30:03 +0200 (In reply to Elena Junie Paulsen from comment giellalt/bugzilla-dummy#16)
I sme ser det slik ut: Når det er noe man kan se på, sånn som et TV-program, så burde det være Prod-vis. Om man kan si "Mun geahčan prográmma" så kan "prográmma" få Prod-vis også. Det er lurt å se i korpus om ordan virkelig blir brukt sånn som man tror. Man kan får store overraskelser.. |
Comment 13493Date: 2019-06-13 13:01:25 +0200 Nå har æ oppdatert semtaggan i den lulesamiske disambiguatoren: smj/src/syntax/disambiguator.cg3 også. |
Comment 13494Date: 2019-06-13 14:29:08 +0200 (In reply to Linda Wiechetek from comment giellalt/bugzilla-dummy#18)
og jeg har oppdatert sme, smn, sma |
Comment 13877Date: 2020-04-02 09:27:45 +0200 (In reply to Lene Antonsen from comment giellalt/bugzilla-dummy#1)
I am working with languages in the Russian environment where names include both GENDER and TYPE: +Sem/Sur My question is one of categorization: +Sem/Sur-Fem, +Sem/Patr-Mal, +Sem/Ant-Fem or possibly just +Sem/Fem, +Sem/Mal There are merits to both: +Sem/Fem(-...) and +Sem/Mal(-...) indicates we are dealing with categories that might have direct bearing on congruence. |
Comment 13879Date: 2020-04-02 10:21:44 +0200 Eg føreslår at slike allmenne diskusjonar blir flytta over i Zulip, t.d. https://giella.zulipchat.com/#narrow/stream/124588-all_langs, og med ein eigen tråd, t.d. #Semtags. I suggest we use Zulip and not Bugzilla for discussions like these, going forward. |
Comment 13891Date: 2020-04-17 12:05:04 +0200 virker å være en god løsning |
This issue was created automatically with bugzilla2github
Bugzilla Bug 2593
Date: 2019-05-27T16:30:45+02:00
From: Linda Wiechetek <<linda.wiechetek>>
To: Linda Wiechetek <<linda.wiechetek>>
CC: elena.j.paulsen, lene.antonsen, linda.wiechetek, maja.l.kappfjell, marja-liisa.olthuis, rueter.jack, sjur.n.moshagen, thomas.omma, trond.trosterud
Last updated: 2020-04-17T12:05:04+02:00
The text was updated successfully, but these errors were encountered: