Skip to content

Latest commit

 

History

History
16 lines (14 loc) · 943 Bytes

README.md

File metadata and controls

16 lines (14 loc) · 943 Bytes

SRI-2022

Elementos generales del proyecto:

Los modelos implementados son :

  • Vectorial
  • Booleano
  • LSI

y como colecciones de prueba se pueden utilizar: Cranfield, CISI y Vaswani.

Detalles sobre la implementación:

El lenguaje utilizado es python que nos ofrece como ventaja dos bibliotecas: nlkt, con múltiples opciones para el procesamiento de lenguaje(los documentos y las querys se preprocesan utilizando esta biblioteca), y numpy, utilizado para contruir las matrices de frecuencias y de pesos, a partir de los documentos ya procesados, toda la información acerca del proyecto está en el informe.

Para la ejecución:

  • En el archivo "requirements.txt" se encuentran las dependencias del proyecto.Para su instalación ejecutar, en el entorno del proyecto, el comando:
    pip install -r requirements.txt
  • Eecutar el archivo app_test.py mediante el comando de consola:
    pyhon app_test.py