Энэхүү монгол толь нь Hunspell үгийн алдаа шалгагчид тулгуурлан ажиллах бөгөөд 60 мянга орчим үндэс, тэдгээрийн 2 тэрбум гаруй хувилал бүхий үгийн санг агуулсан.
Толины онцлогийг дурдвал:
- Академич Ц. Дамдинсүрэн нарын "Монгол үсгийн дүрмийн толь" бүтээлийг баримтлан бүтээсэн
- Нөхцөлийн угсруулан холбох зарчимд тулгуурласан (Hunspell v1.3.3-аас хойших хувилбарт ажиллана)
- Алдаатай үгийн зөв хувилбарыг оновчтой тодорхойлно
- Morphological analysis
- Stemming
Хэрэв таны ашиглаж буй программ Hunspell дэмждэггүй эсвэл та их хэмжээний өгөгдлийн бүх алдаатай үгсийг давхцалгүйгээр жагсаалт болгон харахыг хүсвэл Hunspell программыг дараах байдлаар ашиглахыг зөвлөж байна.
Юун түрүүнд Hunspell алдаа шалгагчаа суулгасан байх хэрэгтэй. Хэрхэн суулгах мэдээллийг https://github.com/hunspell/hunspell хаягаас мөн авах боломжтой.
Linux үйлдлийн систем дээр суулгах бол
sudo apt install hunspell
Mac үйлдлийн систем дээр суулгах бол
brew install hunspell
Windows үйлдлийн систем дээр суулгах бол Chocolatey ашиглаж болно
choco install hunspell.portable
Ийнхүү суулгасан бол толь (mn_MN.aff
, mn_MN.dic
) байрлаж буй замыг дараах байдлаар оруулж өгнө
hunspell -d <your-location>/mn_MN,en_US -l input.txt | sort | uniq > output.txt
Дээрх жишээнд монгол, англи толиудыг зэрэг ашигласан байна. Ихэнх программуудад олон толийг нэгэн зэрэг ашиглах боломжгүй байдаг бөгөөд энэ тохиолдолд толиудаа нэгтгэх хэрэгтэй болдог. Үүний тулд hunspell-merge ашиглахыг зөвлөж байна.
Linux үйлдлийн системийн хувьд pyhunspell ашиглахын тулд дараах сангуудыг суулгасан байх хэрэгтэй:
sudo apt install libhunspell-dev
Хэрэв python3.11 дээр ашиглах бол:
sudo add-apt-repository ppa:deadsnakes/ppa
sudo apt update
sudo apt install python3.11 python3.11-dev
Ийнхүү дараах командаар суулгана:
pip install hunspell
эсвэл
pip install spylls
Hunspell программын үндсэн функцүүдийг агуулсан plain-vanilla JavaScript дээр ажиллах nspell алдаа шалгагчийг ашиглах бол
npm install nspell
Node.js дээр ажиллах Nodehun алдаа шалгагчийг ашиглах бол
npm install nodehun
улмаар монгол үгийн алдаа шалгах толийг wooorm/dictionaries санг ашиглан
npm install dictionary-mn
командуудаар тус тус суулгана.
Монгол үгийн алдаа шалгах толины талаарх дэлгэрэнгүй мэдээлэл болон өөр бусад программд хэрхэн ашиглах зааврыг зөв бичигдэв веб сайтаас үзнэ үү.
LibreOffice / dictionaries, wooorm / dictionaries, ONLYOFFICE / dictionaries, Spylls: Hunspell ported to Python