Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

流式输出声音有杂音[ISSUE] #98

Open
6 tasks done
huai-ying opened this issue Jul 11, 2024 · 5 comments
Open
6 tasks done

流式输出声音有杂音[ISSUE] #98

huai-ying opened this issue Jul 11, 2024 · 5 comments
Labels
bug Something isn't working quick_fix Fixed but needs further follow-up upstream Dependency on upstream fixes

Comments

@huai-ying
Copy link

阅读 README.md 和 dependencies.md

  • 我已经阅读过 README.md 和 dependencies.md 文件

检索 issue 和 discussion

  • 我已经确认之前没有 issue 或 discussion 涉及此 BUG

检查 Forge 版本

  • 我已经确认问题发生在最新代码或稳定版本中

请确认是否与 API 无关?

  • 我已经确认问题与 API 无关

请确认是否与 WebUI 无关?

  • 我已经确认问题与 WebUI 无关

请确认是否与 Fintune 无关?

  • 我已经确认问题与 Fintune 无关

你的issues

流式输出声音有杂音

@zhzLuke96
Copy link
Member

这个问题,官方库正在排查 2noise/ChatTTS#521

@zhzLuke96 zhzLuke96 added bug Something isn't working upstream Dependency on upstream fixes quick_fix Fixed but needs further follow-up labels Jul 12, 2024
@zhzLuke96
Copy link
Member

大pr #102 里面重构了流式生成,应该可以解决一部分杂音问题
这个 issue 标记已修复,如果还有问题可以继续提供详细信息

@wenyangchou
Copy link
Contributor

大pr #102 里面重构了流式生成,应该可以解决一部分杂音问题 这个 issue 标记已修复,如果还有问题可以继续提供详细信息

这个原因是啥,修复逻辑是什么?我这边基于之前的版本集成了vllm,并且支持了流式;但是复用的之前的chunk切割逻辑,所以这块逻辑是有啥问题?

@zhzLuke96
Copy link
Member

大pr #102 里面重构了流式生成,应该可以解决一部分杂音问题 这个 issue 标记已修复,如果还有问题可以继续提供详细信息

这个原因是啥,修复逻辑是什么?我这边基于之前的版本集成了vllm,并且支持了流式;但是复用的之前的chunk切割逻辑,所以这块逻辑是有啥问题?

不是 chunker 的问题,当时定位的问题有两个

  • vocos 模型解码短序列容易出错
  • 音频编码器代码有bug

vocos 这个模型对于短序列解码有问题,可能是模型没训练过短序列也可能是架构就不支持短序列
所以解决方法也很简单,当时 增加了一个参数 stream_chunk_size 默认值从 24 增大设置为 96,之后官方仓库也增加了类似参数 stream_batch
(官方还增加了 pass_first_n_batches 好像也是解决流式质量差的问题的)

@wenyangchou
Copy link
Contributor

感觉不全是这个问题。序列无论怎么切割还是会有碎片问题;在非流场景,短文本也没怎么遇到过噪音问题

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
bug Something isn't working quick_fix Fixed but needs further follow-up upstream Dependency on upstream fixes
Projects
None yet
Development

No branches or pull requests

3 participants