Этот проект направлен на решение задачи классификации текста с помощью наивного байесовского классификатора. Мы загружаем данные из CSV файла, содержащего текстовые сообщения и их метки класса, разделяем данные на обучающую и тестовую выборки, векторизуем тексты с помощью метода мешка слов, и обучаем наивный байесовский классификатор для предсказания меток классов.
Мы оцениваем производительность модели с помощью нескольких метрик, таких как точность (accuracy), точность (precision), полнота (recall) и F1-мера (F1-score), и выводим полученные результаты.
Этот проект посвящен генерации текста с использованием модели LSTM (Long Short-Term Memory). Мы загружаем текстовые данные из CSV файла, предварительно очищаем текст от знаков препинания и приводим к нижнему регистру. Затем мы токенизируем текст и обучаем LSTM модель для генерации нового текста.
Мы разделяем данные на обучающую и тестовую выборки, преобразуем текст в последовательности токенов, создаем и обучаем модель LSTM, а затем генерируем новый текст, используя обученную модель.
Модель оценивается по проценту совпадения сгенерированного текста с исходными данными.