Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Fjerne <cohort-with-dynamic-compound> fra korpusanalyse ( #8

Open
albbas opened this issue Nov 5, 2018 · 4 comments
Open

Fjerne <cohort-with-dynamic-compound> fra korpusanalyse ( #8

albbas opened this issue Nov 5, 2018 · 4 comments
Labels
bug Something isn't working

Comments

@albbas
Copy link
Contributor

albbas commented Nov 5, 2018

This issue was created automatically with bugzilla2github

Bugzilla Bug 2529

Date: 2018-11-05T13:09:35+01:00
From: Lene Antonsen <<lene.antonsen>>
To: Sjur Nørstebø Moshagen <<sjur.n.moshagen>>
CC: @[email protected], ciprian.gerstenberger, elena.j.paulsen, lene.antonsen, linda.wiechetek, sjur.n.moshagen, trond.trosterud

Last updated: 2018-11-06T10:30:00+01:00

@albbas
Copy link
Contributor Author

albbas commented Nov 5, 2018

Comment 13085

Date: 2018-11-05 13:09:35 +0100
From: Lene Antonsen <<lene.antonsen>>

echo skuvlahistorjá|hfst-tokenize --giella-cg tools/tokenisers/tokeniser-disamb-gt-desc.pmhfst |vislcg3 -g tools/tokenisers/mwe-dis.cg3 | cg-mwesplit
"<skuvlahistorjá>"
"skuvlahistorjá" N Sem/Domain Sg Nom <W:0.0000000000>

skal bare være synlig for grammarchecker, og ikke for korpusanalyse?

@albbas
Copy link
Contributor Author

albbas commented Nov 6, 2018

Comment 13088

Date: 2018-11-06 10:00:56 +0100
From: Lene Antonsen <<lene.antonsen>>

*** Bug #2530 has been marked as a duplicate of this bug. ***

@albbas
Copy link
Contributor Author

albbas commented Nov 6, 2018

Comment 13089

Date: 2018-11-06 10:22:22 +0100
From: Sjur Nørstebø Moshagen <<sjur.n.moshagen>>

Denne taggen blir lagt til av ein CG-regel for å hjelpa andre CG-reglar med å identifisera samansette ord, inkl leksikaliserte samanetjingar. Vanlegvis vil info om samansetjing berre finnast i ei underlesing når ein nyttar hfst-tokenise, og regelen kopierer den infoen til hovudlesinga. Dermed har vi framleis den informasjonen sjølv etter at vi har fjerna lesingar med dynamisk samansetjing.

Taggen er nyttig i grammatikkontrollen, men eg kan òg tenkja meg at han kan ha nytte i korpussamanhang, fordi det gjer det mogleg å søkja etter (nesten) alle samansette ord, òg dei leksikaliserte.

Namnet på taggen kan vi sjølvsagt endra.

Eg trur ikkje dette eigentleg er mi lus, men ho kan liggja på meg til vi har fått ei betre forståing av kva vi vil i dei ulike samanhengane (gram.kontroll og korpus).

@albbas
Copy link
Contributor Author

albbas commented Nov 6, 2018

Comment 13091

Date: 2018-11-06 10:30:00 +0100
From: Ciprian Gerstenberger <<ciprian.gerstenberger>>

Jeg har ingen problem det den for korpus, for tiden fjerner jeg den.
Senere kan man legge til noe nyttig informasjon om ordsammensetting.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
bug Something isn't working
Projects
None yet
Development

No branches or pull requests

1 participant