Replies: 10 comments
-
Se käyttää ilmeisesti hunspelliä https://forum.languagetool.org/t/finnish-language/4981:
Keskustelussa ei ehkä täydellisesti ymmärretä, että suomen kieli ei ole englantia erilaisin sanoin eli että oikoluvussa oikein kirjoitettujen sanojen lista ei toimi.
Voikon tekeminen palvelimeksi saattaisi toimiakin. (-:
(Mietiskelen saataisiinko palvelinsysteemillä Voikon tavutus LuaLaTeXiin...)
Voikon kääntämisestä hunspelliksi keskusteltiin tässä
voikko/corevoikko#58
|
Beta Was this translation helpful? Give feedback.
-
LT:n API:lle lähtetään tekstiä pätkä, ja sieltä tulee palautteena tällaista: {
"message": "Did you mean “you're” (short for ‘you are’)?",
"shortMessage": "",
"replacements": [
{
"value": "You're"
}
],
"offset": 0,
"length": 4,
"context": {
"text": "Your funny!",
"offset": 0,
"length": 4
},
"sentence": "Your funny!",
"type": {
"typeName": "Other"
},
"rule": {
"id": "YOUR_YOU_RE",
"subId": "5",
"sourceFile": "grammar.xml",
"description": "Your (You're)",
"issueType": "misspelling",
"urls": [
{
"value": "https://languagetool.org/insights/post/your-vs-youre/"
}
],
"category": {
"id": "TYPOS",
"name": "Possible Typo"
}
},
"ignoreForIncompleteSentence": true,
"contextForSureMatch": 4
} APIa on helppo käyttää selainsoftien kanssa. Yritin kääntää Voikkoa, mutta onnistuu ilmeisesti Windowsilla paremmin kuin tällä Linuxilla. LT-palvelimen saa suht. helposti pyörimään noilla docker-imageilla, esim. https://github.com/silvio/docker-languagetool |
Beta Was this translation helpful? Give feedback.
-
pe, 2024-12-20 kello 00:09 -0800, Ilkka Huotari kirjoitti:
Yritin kääntää Voikkoa, mutta onnistuu ilmeisesti Windowsilla paremmin kuin tällä Linuxilla.
Minä käännän Voikon tällä tavalla
`#!/bin/bash
cd $HOME/Lataukset/corevoikko/voikko-fi
make clean
make vvfst DESTDIR=/usr/local/lib/voikko/
sudo make vvfst-install DESTDIR=/usr/local/lib/voikko/
make clean
make vvfst-sukija DESTDIR=/usr/local/lib/voikko/
sudo make vvfst-install-sukija DESTDIR=/usr/local/lib/voikko/
`
Viimeiset 3 käskyä kääntävät Voikon indeksointiversion.
|
Beta Was this translation helpful? Give feedback.
-
Kiitos, sain käänneltyä. Katson, kuinka tuo integrointi onnistuisi LT:hen... |
Beta Was this translation helpful? Give feedback.
-
Moi, Olisikohan suomeen saatavilla/generoitavissa tällaista sanalistaa (yleisimmät sanat)? No ei tätä välttämättä tarvitse. fasttext näyttää osaavat tunnistaa suomen hyvin. |
Beta Was this translation helpful? Give feedback.
-
*Huokaus* Suomea ei voi oikolukea samalla tavalla kuin englantia.
Mutta et sinä tuota kysynyt. 🙂️
Listan voi generoida imuroimalla Wikipedian ja Lönnrot-projektin
(http://lonnrot.net/) suomenkieliset kirjat, erottamalla niistä sanat ja poistamalla sanat, joita Voikko tai Sukija (https://github.com/ahomansikka/sukija) ei tunnista.
su, 2024-12-22 kello 10:43 -0800, Ilkka Huotari kirjoitti:
…
Moi,
Olisikohan suomeen saatavilla/generoitavissa tällaista sanalistaa (yleisimmät sanat)?
[https://github.com/languagetool-org/languagetool/blob/master/languagetool-language-modules/en/src/main/resources/org/languagetool/resource/en/common_words.txt](https://github.com/languagetool-org/languagetool/blob/master/languagetool-language-modules/en/src/main/resources/org/languagetool/resource/en/common_words.txt)
—
Reply to this email directly, [view it on GitHub](#27 (comment)), or [unsubscribe](https://github.com/notifications/unsubscribe-auth/AAOQK3MKUYRJQ42YFYIYZSL2G4B4TAVCNFSM6AAAAABT57HR76VHI2DSMVQWIX3LMV43URDJONRXK43TNFXW4Q3PNVWWK3TUHMYTCNRUGQYTSNA).
You are receiving this because you commented.Message ID: ***@***.***>
[ { ***@***.***": "http://schema.org", ***@***.***": "EmailMessage", "potentialAction": { ***@***.***": "ViewAction", "target": "#27 (comment)", "url": "#27 (comment)", "name": "View Discussion" }, "description": "View this Discussion on GitHub", "publisher": { ***@***.***": "Organization", "name": "GitHub", "url": "https://github.com" } } ]
|
Beta Was this translation helpful? Give feedback.
-
Mainitsemallani tavalla teen Sukijan testiaineiston, ja sen alku näyttää tällaiselta
a
a-a
aa
a-a-a
a-aa
aa-a
aaa
a-a-a-a
a-a-aa
a-aaa
aa-aa
aaa-a
En poista sanoja, joita Voikko/Sukija ei tunnista enkä laske esiintymien määriä. "Sana" tarkoittaa tietysti sanan kaikkia taivutusmuotoja.
su, 2024-12-22 kello 10:43 -0800, Ilkka Huotari kirjoitti:
…
Moi,
Olisikohan suomeen saatavilla/generoitavissa tällaista sanalistaa (yleisimmät sanat)?
[https://github.com/languagetool-org/languagetool/blob/master/languagetool-language-modules/en/src/main/resources/org/languagetool/resource/en/common_words.txt](https://github.com/languagetool-org/languagetool/blob/master/languagetool-language-modules/en/src/main/resources/org/languagetool/resource/en/common_words.txt)
—
Reply to this email directly, [view it on GitHub](#27 (comment)), or [unsubscribe](https://github.com/notifications/unsubscribe-auth/AAOQK3MKUYRJQ42YFYIYZSL2G4B4TAVCNFSM6AAAAABT57HR76VHI2DSMVQWIX3LMV43URDJONRXK43TNFXW4Q3PNVWWK3TUHMYTCNRUGQYTSNA).
You are receiving this because you commented.Message ID: ***@***.***>
[ { ***@***.***": "http://schema.org", ***@***.***": "EmailMessage", "potentialAction": { ***@***.***": "ViewAction", "target": "#27 (comment)", "url": "#27 (comment)", "name": "View Discussion" }, "description": "View this Discussion on GitHub", "publisher": { ***@***.***": "Organization", "name": "GitHub", "url": "https://github.com" } } ]
|
Beta Was this translation helpful? Give feedback.
-
Tuo Tällä hetkellä kielen tunnistus toimii (fasttext), seuraavaksi yritän saada voikkoa mukaan. |
Beta Was this translation helpful? Give feedback.
-
Moi, hyvää joulua, ja kysymyksiä 😆 Mietin, että laitanko Raudikon, vai Voikon. Raudikossa on oikoluku, mutta Voikossa olisi myös kieliopin tarkistus. Voikko siis olisi lähtökohtaisesti parempi, mutta testasin sitä kieliopin tarkistusta, enkä saanut oikein tuloksia. Näistä pitäisi kaiketi tulla sanomista (jos kaikki kielioppisäännöt toimisivat). Mutta en saanut näistä mitään valitusta, menivät siis läpi.
Oikeat muodot luultavasti:
Lisää kielioppivirheitä: Mitä kielioppivirheitä oikoluku löytäisi? |
Beta Was this translation helpful? Give feedback.
-
En myöskään osannut tarkastaa tätä:
Tästä ei tullut virheitä oikofixillä eikä tällä: |
Beta Was this translation helpful? Give feedback.
-
Moi,
Olisiko Voikkoa mahdollista integroida LanguageTooliin, mikä on avoimen lähdekoodin oikolukuohjelma, sisältää mm. palvelinsoftan, jota voi käyttää API:n kautta.
Se käyttää ilmeisesti hunspelliä https://forum.languagetool.org/t/finnish-language/4981:
Oli myös arvelua, voiko sanastoa käyttää:
Voikon voisi myös integroida LT:hen "suoraan":
Olisikohan tuo integrointi iso homma? Ehkä kokeilen.
Beta Was this translation helpful? Give feedback.
All reactions