如何使用 Transformers 启动 GLM-4-9B-Chat 服务端？ #581

Twistzz2 · 2024-10-10T07:22:55Z

当前官方文档提供了使用 Transformers 与 GLM-4-9B 进行对话的代码，但缺少如何使用 Transformers 启动服务端以及实现客户端请求的具体代码或指南。我希望能够补充以下内容：

希望官方能够提供此类代码或文档，以便开发者使用 GLM-4-9B 模型进行服务端部署和应用开发。

我正在使用 GLM-4-9B 模型进行知识的实体关系抽取，因此需要通过 Transformers 启动服务端，方便处理大量客户端请求并进行批量推理。目前官方文档缺少关于如何实现这一需求的详细指南和代码示例，希望能够补充相关内容，以支持模型在实体关系抽取任务中的高效应用和服务端部署。

Provide feedback