Skip to content

Latest commit

 

History

History
108 lines (64 loc) · 3.5 KB

README.md

File metadata and controls

108 lines (64 loc) · 3.5 KB

Text_To_Video

介绍

Text_To_Video 是一个利用本文直接生成视频的项目,可以帮助广大自媒体应用者快速批量生产视频,用户可以在本地进行部署。该项目主要是集成了chatglm-6b、stable diffusion、免费的tts服务,最终利用moviepy合成视频。

Text_To_Video 项目旨在与开源社区一起推动智能项目的工程落地与发展,恳请开发者和大家遵守开源协议,勿将项目代码及基于项目产生的衍生物用于任何可能给国家和社会带来危害的用途以及用于任何未经过安全评估和备案的服务。 该项目后续会出网页版本、windows应用以及os应用和安卓应用

更新信息

使用教程视频:https://space.bilibili.com/1593224315

[2024/07/09] 支持零一万物api的生成。在配置信息页面可以自行配置零一万物api的key和对应的url。

[2024/01/26] 支持生成本地剪映草稿文件。

[2023/12/18] 支持页面语音的重新生成,支持改变语音角色。

[2023/12/15] 解决图片单张修改问题,重新生成,以及文件的删除。

[2023/07/21] 解决图片到处乱窜的问题,语音和图像不同步问题,视频滚动不统一问题。

[2023/07/20] 发布打包的版本,没基础的同学,可以双击即可使用。

[2023/07/16] 发布本地部署,可以支持web网页形式,方便文件的管理,只需要启动根目录下的web_app.py

使用方式

硬件要求

想要批量生成,建议显卡16g+比较合适

环境准备

1、 chatglm的安装,直接访问 [chatglm](https://github.com/THUDM/ChatGLM-6B) 。安装即可。

2、stable diffusion准备,下载可能比较慢,直接上传百度网盘了。

链接:https://pan.baidu.com/s/1OEi3nVLS-COZP5Qkmj6b-w   
提取码:204f   

3、 chatglm、stable diffusion都要启动api服务

4、 在data_tts.py中替换你自己的api-key

数据准备

具体的数据可以是爬取的小说内容,也可以是利用chatglm或者chatgpt直接生成的内容,但是文本格式要满足一下要求。

image/img.png

格式说明:

  • content是具体的文本信息
  • 每一行生成一个视频
  • 如果你批量为小说生成视频,type可以是名称,en_name不能重复,直接story+(递增数字)就可以

程序运行

直接运行main.py中的main方法即可

if __name__ == '__main__':
    # 定义源文件的路径
    # 这里是你自己的源文件路径,一般需要放在data/source_data目录下
    vedio_path = batch_merge('data/source_data/example1.csv')

代码阅读

代码执行逻辑流程如下:

  • 0、准备语料。
  • 1、切割源文件,句号分割语料,形成新的文件。
  • 2、利用chatglm生成提示词,prompt negative。
  • 3、利用第1步的语料,调用tts的api生成语音。
  • 4、利用第2步生成提示词,调用stable diffusion的api生成图片。
  • 5、将第3步的语音和第4步的图片合成视频。

分别对应:

data_prepare.py
data_split.py
data_promt_words.py
data_tts.py
data_to_image.py
data_to_vedio.py

协议

本仓库的代码依照 Apache-2.0 协议开源。

严禁

未经许可,严禁商用。

欢迎关注公众号与知识星球,有问题可以公众号留言

QQ群:1083992954

image/img_1.png image/img_1.png 微信图片_20230612191801.jpg