逆向Pieces-OS GRPC流并转换为标准OpenAI接口的项目
所有模型均由 Pieces-OS 提供
本项目基于GPLV3协议开源
如果帮助到了你,能否给一个Star呢?
请注意下列环境变量!私人使用请添加API_KEY!
- 流式实现
- Serverless部署
- Docker支持
- 静态Proto JS
api
protos
GPTInferenceService.proto # GPT的GRPC定义
VertexInferenceService.proto # 其余几乎所有模型的GRPC定义
index.js Node.js的项目文件,即开即用
cloud_model.json 云端模型的配置文件,请提取unique中的模型使用
- claude-3-5-sonnet@20240620
- claude-3-haiku@20240307
- claude-3-sonnet@20240229
- claude-3-opus@20240229
- gpt-3.5-turbo
- gpt-4
- gpt-4-turbo
- gpt-4o-mini
- gpt-4o
- gemini-1.5-flash
- gemini-1.5-pro
- chat-bison
- codechat-bison
安装 package.json 中定义的依赖库后,执行 node index.js 启动程序
获取模型
curl --request GET 'http://127.0.0.1:8787/v1/models' \
--header 'Content-Type: application/json'
请求
curl --request POST 'http://127.0.0.1:8787/v1/chat/completions' \
--header 'Content-Type: application/json' \
--data '{
"messages": [
{
"role": "user",
"content": "你好!"
}
],
"model": "gpt-4o",
"stream": true
}'
- 描述: API 请求的前缀路径。
- 默认值:
'/'
- 获取方式:
process.env.API_PREFIX || '/'
- 描述: API 请求的密钥。
- 默认值: 空字符串
''
- 获取方式:
process.env.API_KEY || ''
- 描述: 最大重试次数。
- 默认值:
3
- 获取方式:
process.env.MAX_RETRY_COUNT || 3
- 描述: 重试延迟时间,单位为毫秒。
- 默认值:
5000
(5秒) - 获取方式:
process.env.RETRY_DELAY || 5000
- 描述: 服务监听的端口。
- 默认值:
8787
- 获取方式:
process.env.PORT || 8787
- 描述: 通用 gRPC 服务的 proto 文件路径。
- 默认值:
'./VertexInferenceService.proto'
- 描述: GPT 推理 gRPC 服务的 proto 文件路径。
- 默认值:
'./GPTInferenceService.proto'