尝试RVC音色克隆团长音色

news/2024/9/21 22:18:52

前言

昨晚玩剑网3突发奇想,把团长声音克隆下来,利用语音喵制作成语音DBM。
这样不管团长开不开团,打团也能有团长声音听了诶嘿嘿。
于是当场关闭游戏声音录了打本的素材,本文就边做边记录。

下载

在B站找到了这个教程:
【你的声音,现在是我的了!】https://www.bilibili.com/video/BV1P541117yn
粗略看一遍感觉思路清晰,步骤明确。开始尝试。

打开项目页面 https://github.com/RVC-Boss/GPT-SoVITS

Release打开下载页面,下载v2版本,解压
解压好慢,可以先把录制的声音从视频分离出来

电脑上刚好有剪映,视频文件拖进去,右键分离音频,导出音频,wav格式

启动

解压后打开 go-webui.bat
官方中文教程:https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e

官方中文教程提供了在线使用的网址:https://gsv.acgnai.top/ ,里面有训练好的模型可以直接拿来用,配合F12可以下载自定义的语音文件,暂时没有发现有数量限制

UVR5人声伴奏分离&去混响去延迟

因为录制的音频是游戏内语音,加上团长用的麦不是很好,所以需要处理一下混响和噪声
开启 UVR5人声伴奏分离&去混响去延迟工具,等待一会后出现 UVR5 WebUI

选择 onnx_dereverb_by_FoxJoy模型 去混响,去延迟,
贴入wav文件文件夹路径,默认选择flac格式音频,直接转换
转换进度可以在bat窗口查看。5分钟才转换10%,预计要50分钟,可以看一下官方中文教程 睡一觉

睡了一觉发现转换好了,输出在程序的 output\uvr5_opt 文件夹里,确实把混响杂音去掉了一些

再用 DeEcho-Aggressive模型,对刚才用 onnx_dereverb_by_FoxJoy模型 处理过的flac文件重新处理一下
处理完成的文件名开头应该是 vocal,结尾是 main_vocal

语音切分&降噪&ASR

关闭 UVR5 WebUI,打开 GPT-SoVITS WebUI,进行语音切分、降噪、ASR

语音文本校对标注

校对文字,本页校对完成后点击 Submit Text 保存,Next Index下一页
有不需要的音频片段,右边 yes 打钩,上方 Delete Audio
image

开始TTS推理

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.ryyt.cn/news/63118.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈,一经查实,立即删除!

相关文章

隐私保护体系下网络威胁情报共享的研究现状和方案设计

来源:http://netinfo-security.org/article/2024/1671-1122/1671-1122-24-7-1129.shtml威胁情报 网络威胁情报是关于网络中正在进行的或潜在的恶意活动信息,涵盖但不限于特定的恶意软件样本、恶意IP地址、钓鱼电子邮件信息、黑客组织的入侵行为等内容,对于提前感知预警、防范…

Logisim-013-◇汉字显示

转码在线工具地址 https://www.23bei.com/tool/54.html#仓库地址 https://gitee.com/gitliang/logisim-to-cpu

spring6.1在java17环境下使用反射

引包 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-aop</artifactId><version>3.3.4</version> </dependency> 反射代码编写简单的反射方法,如下所示 package com.lw.reflect.c…

实景三维+耕地保护:构建耕地资源管理的全闭环新模式

在耕地资源日益珍贵的今天,如何高效、精准地实施耕地保护,成为了我国农业可持续发展与生态文明建设的关键课题。“实景三维+耕地保护”的创新模式,能够为这一挑战提供突破性的解决方案,打造一个从前端监测到后端管理的全闭环耕地保护管理模式。本文将深入分析这一模式的核心…

IDEA 如何设置TAB页显示多行

前言 我们在使用IDEA开发时,经常需要打开多个TAB页,但是,IDEA默认的方式是最多只能打开少量的TAB页,且打开的TAB页只能堆积在一行上显示,如果超出了数量,就会自动隐藏。这样对于我能经常需要在多个不同TAB页之间打开来说,是比较麻烦的,那么有什么办法能改变下设置呢? …

在Linux下安装MySQL

摘要 在学习MySQL语法之前,我们需要先解决在Ubuntu或CentOs环境下的“软件安装”的问题。本文梳理了安装前后的各个步骤及有关的注意事项,主要涵盖了安装前的准备工作、如何安装mysql,以及安装之后如何启动、如何正式使用这几个方面。建议读者先浏览一遍,留心相关的注意事项…

深入剖析RocketMQ消息消费原理

本文参考转载至《RocketMQ技术内幕 第2版》一. 消息消费概述 消息消费以组的模式开展,一个消费组可以包含多个消费者,每个消费组可以订阅多个主题,消费组之间有集群模式和广播模式两种消费模式。集群模式是当前主题下的同一条消息只允许被其中一个消费者消费。广播模式是当前…

27. 守护进程、进程间通信

1. 僵尸进程与孤儿进程1.1 前言 在unix中,所有的子进程都是由父进程创建的,子进程再创建新的子进程 子进程的结束和父进程的运行是一个异步的过程,即子进程运行完成时,父进程并不知道 当子进程运行完成时,父进程需要调用wait()或waitpid()来获取子进程的运行状态 1.2 僵尸…