找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
楼主: 哨箭勇度

GPT-SoVITS_V4解压即用N卡整合版_250424

  [复制链接]

0

主题

4

回帖

16

零食

入门显卡4G

积分
20
发表于 2025-5-15 23:58:01 | 显示全部楼层
大哥厉害
回复

使用道具 举报

0

主题

5

回帖

73

零食

初级显卡6G

积分
78
发表于 2025-5-16 00:41:20 | 显示全部楼层
4解压即用N卡整合版
回复

使用道具 举报

0

主题

1

回帖

3

零食

入门显卡4G

积分
4
发表于 2025-5-16 09:35:29 | 显示全部楼层
下载软件111111111111111
回复

使用道具 举报

0

主题

4

回帖

28

零食

入门显卡4G

积分
32
发表于 2025-5-16 13:36:27 | 显示全部楼层
感谢博主啦
回复

使用道具 举报

0

主题

22

回帖

141

零食

初级显卡6G

积分
163
发表于 2025-5-16 17:41:54 | 显示全部楼层
666666666666
回复

使用道具 举报

0

主题

3

回帖

18

零食

入门显卡4G

积分
21
发表于 2025-5-17 11:32:36 | 显示全部楼层
非常感谢,好用!
回复

使用道具 举报

0

主题

3

回帖

18

零食

入门显卡4G

积分
21
发表于 2025-5-17 12:26:33 | 显示全部楼层
请问多音字应该怎么处理啊?谢谢!

我按如下方法操作,有些多音字发音正确,有些仍然错误:

1、添加多音字,修改 \GPT_SoVITS\text\g2pw 目录下的 polyphonic-fix.rep 文件并保存
2、删去缓存文件 polyphonic.pickle,把pycache也删了
3、关闭GPT-SoVITS,重新打开。

在 polyphonic-fix.rep 文件第一行添加了三行,
数数: ['shu3', 'shu4']
祇树给: ['qi2', 'shu4', 'ji3']
长公主: ['zhang3', 'gong1', 'zhu3']

合成语音后,
  [文本中出现两次“数数”,第一次正确;第二次错成 'shu4', 'shu4']
  [错成 gei3]
  [错成 chang3]
回复

使用道具 举报

0

主题

3

回帖

9

零食

入门显卡4G

积分
12
发表于 2025-5-18 13:35:11 | 显示全部楼层
666666666666666666666
回复

使用道具 举报

0

主题

2

回帖

6

零食

入门显卡4G

积分
8
发表于 2025-5-18 21:30:52 | 显示全部楼层
这是什么,我素材3分钟多,分割音频后,也只得到了一个完整的3分多的音频,3连的时候出现以下代码:
Traceback (most recent call last):
  File "D:\GPT-SoVITS_V4_250424\GPT_SoVITS\prepare_datasets\1-get-text.py", line 95, in process
    bert_feature = get_bert_feature(norm_text, word2ph)
  File "D:\GPT-SoVITS_V4_250424\GPT_SoVITS\prepare_datasets\1-get-text.py", line 73, in get_bert_feature
    res = bert_model(**inputs, output_hidden_states=True)
  File "D:\GPT-SoVITS_V4_250424\env\lib\site-packages\torch\nn\modules\module.py", line 1736, in _wrapped_call_impl
    return self._call_impl(*args, **kwargs)
  File "D:\GPT-SoVITS_V4_250424\env\lib\site-packages\torch\nn\modules\module.py", line 1747, in _call_impl
    return forward_call(*args, **kwargs)
  File "D:\GPT-SoVITS_V4_250424\env\lib\site-packages\transformers\models\bert\modeling_bert.py", line 1461, in forward
    outputs = self.bert(
  File "D:\GPT-SoVITS_V4_250424\env\lib\site-packages\torch\nn\modules\module.py", line 1736, in _wrapped_call_impl
    return self._call_impl(*args, **kwargs)
  File "D:\GPT-SoVITS_V4_250424\env\lib\site-packages\torch\nn\modules\module.py", line 1747, in _call_impl
    return forward_call(*args, **kwargs)
  File "D:\GPT-SoVITS_V4_250424\env\lib\site-packages\transformers\models\bert\modeling_bert.py", line 1078, in forward
    embedding_output = self.embeddings(
  File "D:\GPT-SoVITS_V4_250424\env\lib\site-packages\torch\nn\modules\module.py", line 1736, in _wrapped_call_impl
    return self._call_impl(*args, **kwargs)
  File "D:\GPT-SoVITS_V4_250424\env\lib\site-packages\torch\nn\modules\module.py", line 1747, in _call_impl
    return forward_call(*args, **kwargs)
  File "D:\GPT-SoVITS_V4_250424\env\lib\site-packages\transformers\models\bert\modeling_bert.py", line 217, in forward
    embeddings += position_embeddings
RuntimeError: The size of tensor a (728) must match the size of tensor b (512) at non-singleton dimension 1

Traceback (most recent call last):
  File "D:\GPT-SoVITS_V4_250424\webui.py", line 1166, in open1abc
    assert len("".join(opt)) > 0, process_info(process_name_1a, "failed")
AssertionError: 文本分词与特征提取失败
训练集格式化一键三连进程已终止
训练集格式化一键三连进程已终止
回复

使用道具 举报

0

主题

1

回帖

3

零食

入门显卡4G

积分
4
发表于 2025-5-20 11:46:05 | 显示全部楼层
版主的作品很不错,支持下!期待能发表更多好作品!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|圈圈AI吧

GMT+8, 2025-6-17 10:57 , Processed in 0.305801 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表