Skip to content

Commit

Permalink
UPD: Stemming/Lemmatization
Browse files Browse the repository at this point in the history
  • Loading branch information
pablozz authored May 12, 2023
1 parent 0eacafb commit 72ba061
Showing 1 changed file with 3 additions and 0 deletions.
3 changes: 3 additions & 0 deletions README.md
Original file line number Diff line number Diff line change
Expand Up @@ -132,6 +132,8 @@ Jei tyrinėjantis algoritmas suteikia atlygį naujiems (prieštai nebandytiems)
| Loss function | Nuostolių funkcija |Tiklo funkcija (objective function) - apibrėžtas sprendžiamas uždavinys. Praktikoje gali būti įvairus, pavyzdžiui maksimizuoti tikimybinį pasiskirtymą (P1) ar daugelių tikslų uždavinį (P2). Tam praktikoje konstruojame nuostolių funkciją (loss function) - praktikoje dažnai minimizuojamą funkciją, kurią optimizuodami ieškome nežinomų modelių parametrų (pvz. P1 - neigiama log-tikėtinumo funkcija, P2 - tiesinė kelių uždavinių mažiausių kvadratų funkcija ir pan.). Nuostolių/kaštų funkcijos - vartojamos, kaip sinonimai priklausomai nuo konteksto.| |
| Layers | Sluoksnis | |
| Leakage | Duomenų nutekėjimas | Tai procesas, kai modelis testuojamas ne ant visiškai nematytų realistiškų duomenų (kas atitinka realius bandymus), bet ant tokių duomenų, kurių dalys pasitaikė ir vertinant modelio parametrus. Pavyzdys: pacientams daromos kelios tyrimų nuotraukos; eksperimento metu atsitiktinai atrenkamas testavimo duomenų rinkinys; Testavimas turi duomenų nutekėjimą, ir toks eksperimentas yra nevalidus; Nepriklausomas testavimo rinkinys reikalautų, jog nė vienas paciento stebėjimas esantis testavimo rinkinyje, nebūtų naudojamas vertinant modelio parametrus (apmokymo metu). |

| Lemmatization | Pagrindinės žodžio formos nustatymas | |
| Long short-term memory (LSTM) | Ilgos trumpalaikės atminties modelis | |
| Machine learning | Mašininis mokymas | |
| Markov decision process | Markovo sprendimo priėmimo procesai | |
Expand Down Expand Up @@ -248,6 +250,7 @@ Jei tyrinėjantis algoritmas suteikia atlygį naujiems (prieštai nebandytiems)
|Subword tokenization | Teksto skaidymas į teksto vienetus procesas teksto vienetams priskiriant unikalias teksto dalis.||
| Sum pooling layer | Telkimo sumuojant sluoksnis | |
| Supervised learning | Prižiūrimas mokymas | |
| Stemming | Žodžio kamieno išskyrimas | |
| Swish activation function | Švituojanti aktivacijos funkcija | $$\sigma(x) = \frac{x}{1 + e^{-x}} = x \sigma(x)$$ žr. Pasvertas sigmoidinis tiesinis vienetas |
| Threshold | Slenkstinė vertė | |
| Template | Šablonas | |
Expand Down

0 comments on commit 72ba061

Please sign in to comment.