Los modelos implementados son :
- Vectorial
- Booleano
- LSI
y como colecciones de prueba se pueden utilizar: Cranfield, CISI y Vaswani.
El lenguaje utilizado es python que nos ofrece como ventaja dos bibliotecas: nlkt, con múltiples opciones para el procesamiento de lenguaje(los documentos y las querys se preprocesan utilizando esta biblioteca), y numpy, utilizado para contruir las matrices de frecuencias y de pesos, a partir de los documentos ya procesados, toda la información acerca del proyecto está en el informe.
- En el archivo "requirements.txt" se encuentran las dependencias del proyecto.Para su instalación ejecutar, en el entorno del proyecto, el comando:
pip install -r requirements.txt
- Eecutar el archivo app_test.py mediante el comando de consola:
pyhon app_test.py