Language Classifier

Binary Language Classifier with PyTorch and Flask.

Dataset: https://www.kaggle.com/datasets/basilb2s/language-detection

Local Setup

Install requirements

pip install -r requirements.txt

Debug

python src/app.py

Run

SET FLASK_APP=./src/app.py 
python -m flask run

Docker Setup

Build Docker Image

docker build . -t language-classifier-image

Run Docker Container

docker run --name language-classifier -d -p 5000:5000 language-classifier-image

Usage

Train [POST]

Endpoint: http://localhost:5000/train

All hyperparameters are optional and, if not set, default values are used. Below is an example of a body request with the configurable hyperparameters and their default values:

Request

    {
        "epochs": 10,
        "lr": 5, 
        "step_size": 1.0,
        "gamma": 0.1,
        "batch_size": 64,
        "input_dim": 4,
        "embed_dim": 32,
        "num_classes": 17,
        "eval_every": 100
    }

Response

    {
        "accuracy": 0.90
    }

Test [GET]

Endpoint: http://localhost:5000/test

Response

    {
        "test_accuracy": 0.90
    }

Inference [POST]

Endpoint: http://localhost:5000/predict

Request

    {
        "text": "questa è una frase in italiano!"
    }

Response

    {
        "class": 1
    }

TensorBoard

docker cp language-classifier:/app/runs docker_runs
tensorboard --logdir docker_runs

Preprocessing Automated Tests

pytest src/tests.py

Binary to Multi-Class

The model is configured to recognize Italian sentence. To switch to Multi-Class configuration change this line in predict() method:

response = 1 if LANG_LOOKUP[label.item()] == "Italian" else 0

to

response = LANG_LOOKUP[label.item()]

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
data		data
src		src
.gitignore		.gitignore
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt
train_models.py		train_models.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Language Classifier

Local Setup

Install requirements

Debug

Run

Docker Setup

Build Docker Image

Run Docker Container

Usage

Train [POST]

Test [GET]

Inference [POST]

TensorBoard

Preprocessing Automated Tests

Binary to Multi-Class

About

Releases

Packages

Languages

License

matteomedioli/language-classifier

Folders and files

Latest commit

History

Repository files navigation

Language Classifier

Local Setup

Install requirements

Debug

Run

Docker Setup

Build Docker Image

Run Docker Container

Usage

Train [POST]

Test [GET]

Inference [POST]

TensorBoard

Preprocessing Automated Tests

Binary to Multi-Class

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages