V tomto cvičení si vyzkoušíte typickou úlohu z oblasti zpracování přirozeného jazyka (Natural Language Processing - NLP) - analýzu sentimentu.
Výstupem tohoto projektu bude funkce, která z daného webu s anglickými recenzemi (Amazon, Ebay, IMDB, Rotten tomatoes, apod.) vytáhne texty těchto recenzí, dále analyzuje sentiment recenzí (pozitivní, neutrální, negativní), nalezne v recenzích 30 nejpoužívanějších a 30 nejdelších slov a zobrazí vše v přehledném formátu.
Python helper:
NLTK Vader Beautiful soup Příklad obsahu výstupu:
-
URL stránky s recenzemi
-
Výsledky analýzy sentimentu
-
Word cloud výsledku analýzy sentimentu
-
30 nejpoužívanějších slov
-
Word cloud 30 nejpoužívanějších slov
-
30 nejdelších slov
-
Word cloud 30 nejdelších slov
Příklad zobrazení v tabulce: