Skip to content

iGangao/QAsystem

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

20 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

QAsystem

大致架构

image

开发流程

一、准备数据

1、QA数据

数据格式:

image

2. Q-->keyword数据

数据格式:

image

3. keyword matching keyword 数据

数据格式

image

二、训练keyword extract model

1. 使用BERT 预训练模型

主要方法:

三、构建 vectorDB

数据格式

image

构建流程

1. keyword to vector

将关键词向量化

2. vcetor store in DB

将向量存入数据库中,并得到该向量的唯一标识(索引)

3. vector index mapping "reference"

将向量索引和数据“reference”映射 key - value key : vector index value : reference

四、训练keyword matching keyword model

1. text2vec

2. SimCSE

五、LLM finetune

1. LORA

数据格式:

Q:
A:

2....

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published