From 72ba061e4a871e83c3d7ab87b724454a701bc042 Mon Sep 17 00:00:00 2001 From: Paulius Zaranka Date: Fri, 12 May 2023 11:33:46 +0300 Subject: [PATCH] UPD: Stemming/Lemmatization --- README.md | 3 +++ 1 file changed, 3 insertions(+) diff --git a/README.md b/README.md index 5a86df5..09a4ee1 100644 --- a/README.md +++ b/README.md @@ -132,6 +132,8 @@ Jei tyrinėjantis algoritmas suteikia atlygį naujiems (prieštai nebandytiems) | Loss function | Nuostolių funkcija |Tiklo funkcija (objective function) - apibrėžtas sprendžiamas uždavinys. Praktikoje gali būti įvairus, pavyzdžiui maksimizuoti tikimybinį pasiskirtymą (P1) ar daugelių tikslų uždavinį (P2). Tam praktikoje konstruojame nuostolių funkciją (loss function) - praktikoje dažnai minimizuojamą funkciją, kurią optimizuodami ieškome nežinomų modelių parametrų (pvz. P1 - neigiama log-tikėtinumo funkcija, P2 - tiesinė kelių uždavinių mažiausių kvadratų funkcija ir pan.). Nuostolių/kaštų funkcijos - vartojamos, kaip sinonimai priklausomai nuo konteksto.| | | Layers | Sluoksnis | | | Leakage | Duomenų nutekėjimas | Tai procesas, kai modelis testuojamas ne ant visiškai nematytų realistiškų duomenų (kas atitinka realius bandymus), bet ant tokių duomenų, kurių dalys pasitaikė ir vertinant modelio parametrus. Pavyzdys: pacientams daromos kelios tyrimų nuotraukos; eksperimento metu atsitiktinai atrenkamas testavimo duomenų rinkinys; Testavimas turi duomenų nutekėjimą, ir toks eksperimentas yra nevalidus; Nepriklausomas testavimo rinkinys reikalautų, jog nė vienas paciento stebėjimas esantis testavimo rinkinyje, nebūtų naudojamas vertinant modelio parametrus (apmokymo metu). | + +| Lemmatization | Pagrindinės žodžio formos nustatymas | | | Long short-term memory (LSTM) | Ilgos trumpalaikės atminties modelis | | | Machine learning | Mašininis mokymas | | | Markov decision process | Markovo sprendimo priėmimo procesai | | @@ -248,6 +250,7 @@ Jei tyrinėjantis algoritmas suteikia atlygį naujiems (prieštai nebandytiems) |Subword tokenization | Teksto skaidymas į teksto vienetus procesas teksto vienetams priskiriant unikalias teksto dalis.|| | Sum pooling layer | Telkimo sumuojant sluoksnis | | | Supervised learning | Prižiūrimas mokymas | | +| Stemming | Žodžio kamieno išskyrimas | | | Swish activation function | Švituojanti aktivacijos funkcija | $$\sigma(x) = \frac{x}{1 + e^{-x}} = x \sigma(x)$$ žr. Pasvertas sigmoidinis tiesinis vienetas | | Threshold | Slenkstinė vertė | | | Template | Šablonas | |