-
GPT SoVITS WebUI – 快速声音AI克隆工具,完美复刻任何角色的语音、语调、语气!
语音技术在人工智能的驱动下,正在以前所未有的速度推进。GPT-SoVITS-WebUI正是这一变革的先驱它利用少量的声音源,可以快速地训练出一个语音合成(Text-to-Speech,简称TTS)模型。 这个强大的Web界面工具不仅提供了零次学习和少量次学习的文本到语音(TTS)功能,还支持跨语言的语音转换,为语音技术的爱好者和开发者打开了一扇新的大门。 一、GPT SoVITS WebUI的功能…- 2.1k
-
Mubert – 背景音乐在线生成AI工具,100+风格,海量曲库智能搜索引擎,ProductHunt单日产品榜首~
Mubert曾获得过 ProductHunt 单日产品第一名。 一、Mubert是什么? Mubert是一个由音乐制作人提供支持的平台,帮助创作者和品牌在人工智能的帮助下创作无限的免版税音乐。Mubert的使命是赋予创作者权力并保护他们。创业目的是使创造者经济民主化。 它支持通过文本和图像生成音乐,现在还上线了一个新功能,可以通过一个音频生成类似风格的新音频,是提升音乐生成效率的利器。Mubert…- 876
-
VALL-E – 微软最强AI声音克隆工具,免训练,免安装,本地整合包,三秒偷走你的声音~
该模型支持多种语言(英语、中文和日语)和零样本语音克隆,你只需要提供一个人短短几秒钟的录音(3-10秒),就能模仿出那个人的声音。此外,它还具有语音情感控制和口音控制等高级功能。同时相对于其他模型,它更轻量、更快速… 一、VALL-E是什么? Vall-E AI是微软开发的一款基于人工智能的文本到语音转换器。该工具将文本输入转换为音频,并将其与人的情绪和房间的声学效果相匹配。它可以使用三秒的短音频…- 2.2k
-
SOME – 高质量音乐MIDI提取AI工具
一、SOME是什么? SOME(Singing-Oriented MIDI Extractor)是一个旨在将人声音频文件自动转换为MIDI序列的项目。这个工具对于音乐制作人和爱好者来说是一个创新的解决方案,因为它可以自动化音乐制作过程中的一个关键步骤,即将人声转换为可以编辑和进一步处理的数字格式。 在i5 12400 CPU上,它可以以9倍于实时的速度运行,而在3080Ti GPU上,速度更是达到…- 1.6k
-
Fish Speech – 低显存高效语音克隆生成AI工具,免训练,免安装,本地整合包,复制声音如此轻松~
高效的低显存语音克隆工具,媲美GPT-SoVITS! 一、Fish Speech是什么? Fish Speech 是一个全新的文本转语音(TTS)解决方案。作为一个前沿的技术,它提供了高度的自定义和灵活性,允许用户按照他们的个性化需求和期望进行设置。适应多元化环境,可无缝兼容 Linux 和 Windows 操作系统,一站式满足不同用户群体的需求。为了运行此程序,您需要至少 4GB 的 GPU 内…- 671
-
VOICEVOX – 专业日语AI配音文本语音合成工具
日语文字转语音软件「VOICEVOX」,提供了很多种不同的语音角色,每个角色都有独特的声音特征,适用于不同的场景和需求。VOICEVOX提供了直观易用的用户界面,使用户能够轻松地输入文本、选择语音角色、调整语音参数,并生成语音。 同时支持CPU,GPU,提供超过30 种不同声音的角色让你选择,效果如下: 一、VOICEVOX的官网地址: https://voicevox.hiroshiba.jp/…- 1.7k
-
TTSMAKER PRO – 人工智能AI语音在线生成工具
TTSMaker Pro是一款专为专业人士设计的顶级人工智能语音生成工作室。支持 50 多种语言和 300 多种语音风格,为您提供 20 多种无限语音和高级语音合成功能,包括语音情感和说话风格,进一步增强用户体验。此外,您还可以方便地下载和共享音频文件。 一、TTSMAKER PRO的官网地址: https://pro.ttsmaker.com/ 二、TTSMAKER的产品优势: 为专业人士提供强…- 660
-
Bert-VITS 2 – 爆杀原版?原神&星穹铁道全角色文本转语音AI工具,栩栩如生,声色克隆,原神启动!
为游戏爱好者们带来一款新的体验工具,原神&星穹铁道全角色文本转语音AI工具。该工具基于先进的BERT-VITS模型,这是一种结合了Transformer架构的语音合成技术。BERT-VITS模型通过深度学习,能捕捉到不同音色的独特属性,并能够实现高度个性化的语音合成效果。这款整合包特别支持多角色对话模式,让用户能够体验到更加丰富和真实的交互对话。 一、Bert-VITS 2是什么? BER…- 1.9k
-
MeloTTS – 高质量实时文本转语音AI工具,支持多国语言,同时兼容GPU/CPU
一、MeloTTS是什么? MeloTTS 是一个强大的多语言文本转语音库,特别设计以支持CPU环境下的实时语音合成,无需依赖GPU。该库能够输出自然流畅的语音,提供了一种高效便捷的方式,将文本信息转换为听觉内容。 MeloTTS不仅支持多种语言,包括英语、西班牙语、法语、中文、日语和韩语,还能处理混合语言文本,如含有英语单词的中文文本。此外,用户还可以根据需求调整语速,选择不同的发音口音,如美式…- 1.7k
-
SONOTELLER – 快速音乐歌词分析风格AI在线工具,音乐人必备神器
无论是音乐爱好者还是专业从业者,他们都能借助SONOTELLER更好地管理自己的音乐库和数据,并进行受众分析。 使用SONOTELLER非常简单,只需前往YouTube,搜索所需歌曲,复制其URL,然后将URL粘贴到SONOTELLER.AI的搜索框中即可获取详细分析结果。 一、SONOTELLER是什么: SONOTELLER是一个在线AI音乐分析工具,专门用于分析YouTube上的音乐和歌词。…- 1.4k
-
EmotiVoice易魔声 – 爆火国产文本转语音AI工具,支持中英文,具有情绪控制功能~
网易有道AI算法团队也开源了一款国产TTS语音合成引擎EmotiVoice,刚上线仅一周时间就暴涨4200颗星,问鼎当周GitHub trending流行榜第一。而如今已冲到了 4.5k Star。 一、EmotiVoice是什么? EmotiVoice是一款功能强大且现代的开源文本转语音引擎,您可以免费使用。EmotiVoice 提供中英文两种语言,超过 2000 种不同的语音。最突出的功能是情…- 2.1k
-
SuperTone Shift – 前沿实时人声变声AI工具,低延迟,无需GPU,目前免费公测,赶紧白嫖~
最近被韩国Hybe公司收购的SuperTone,推出了一款实时人声变声器:Shift,这是一款采用人工智能技术的实时声音处理工具,软件现处于公测阶段,即将于六月份结束公测。 一、SuperTone Shift 是什么? Supertone Shift是由韩国Supertone公司推出的实时语音变换桌面客户端软件,它允许用户选择并立即使用多种高品质声音。Supertone Shift具备个性化定制、…- 1.1k
-
Replay – 智能视频音乐伴奏提取AI工具
Replay是什么? 在音乐制作和卡拉OK爱好者中,伴奏的提取一直是个技术活。传统软件操作复杂,而且对于冷门歌曲往往难以找到满意的伴奏版本。好在现在有了人工智能的加持,提取伴奏变得简单而高效。Replay正是这样一款利用AI技术自动提取伴奏的软件,它能够无损地还原最真实的音色,即使是新手也能轻松上手。 Replay的官方网址? https://www.tryreplay.io/ Replay的设备…- 1.8k
-
Bark – 高度逼真的开源文本转语音AI工具,最强TTS本地整合包
Bark是一个开源的文本转语音的AI模型。Bark 可以生成高度逼真的多语言语音以及其他音频 - 包括音乐、背景噪音和简单的音效。该模型可以模拟正常说话口气的语音,如笑、叹息和哭泣。支持多语言,包括中文。 一、Bark的项目地址: 1、论文地址: https://arxiv.org/abs/2209.03143 2、Github仓库: https://github.com/suno-ai/bark…- 2.2k
-
UVR5 – 最强人声伴奏分离AI工具,最新版v5.6
UVR5是什么? 全称Ultimate Vocal Remover GUI,目前已更新到5.6版本,是一款完全免费的伴奏制作/人声提取工具,比RX9,RipX和SpectraLayers 9都要好,UVR5提取出来的伴奏已经无限接近原版立体声了! 对于音乐爱好者来说,找到一款既简单易用又能提供专业效果的音频处理软件是非常重要的。无论是因为专业软件的操作难度让人望而却步,还是冷门歌曲难以找到合适的伴…- 1.7k
-
AudioCraft – 顶级音乐生成AI工具,来自Meta AI免费开源,音乐效果媲美音乐家作品~
一、AudioCraft是什么? AudioCraft是Meta AI免费开源的一款深度学习进行音频处理和生成的库。可满足您所有的生成音频需求:音乐、音效以及原始音频信号训练后的压缩。 它具有最先进的EnCodec音频压缩器/标记器,沿着MusicGen,一个简单可控的音乐生成LM,具有文本和旋律调节。 素材训练使用2万小时的授权音乐来训练MusicGen。 二、AudioCraft的项目地址: …- 1.9k
-
Vocal Separate – 极简音乐人声分离AI工具,本地部署,无需网络,支持CPU
将一首歌曲或者含有背景音乐的音视频文件,拖拽到本地网页中,即可将其中的人声和音乐声分离为单独的音频wav文件,可选单独分离“钢琴声”、“贝斯声”、“鼓声”等 一、Vocal Separate是什么? 这是一个极简的人声和背景音乐分离工具,本地化网页操作,无需连接外网,使用 2stems/4stems/5stems 模型。 二、Vocal Separate的开源地址: https://github.…- 1.8k
-
Suno AI – 重量级颠覆传统认知的AI音乐制作平台,一键制作你的专属音乐,轻松实现文本转歌曲,媲美真实歌手!
一、Suno AI是什么? Suno AI是一款强大的人工智能音乐生成器,由 Anthropic 公司开发完成。 可以将文本转化为高度逼真的音乐和语音。该系统包括多种音乐风格,如电影、RAP、翻唱等,并提供了多语言和不同性别的播音员选择。用户可以使用命令来生成音频并进行个性化设置。它支持英文、中文等 50 种语言,可以在网站和 Discord 双平台上使用。 新用户有 250 个免费积分,可以生成…- 4.7k
-
OpenVoice – 专业即时语音克隆复制AI工具,免训练,免部署,一键使用
多功能的即时语音克隆AI工具,只需要参考说话者的一个简短的音频剪辑即可复制他们的声音并生成多种语言的语音。除了复制参考说话者的音色之外,OpenVoice 还可以对语音风格进行精细控制,包括情感、口音、节奏、停顿和语调。OpenVoice还可以针对海量说话人训练集中未包含的语言实现零样本跨语言语音克隆。OpenVoice 的计算效率也很高,其成本比性能较差的商用 API 低数十倍。 一、OpenV…- 1.8k
-
Stable Audio – 革命性AI音乐/音效生成工具,Stability AI旗下又一重磅产品,音乐人的噩梦~
在Stable Audio 我们可以免费体验其文生音乐功能。只需先填写提示词,然后设置时长,点击 Generate 后等待 30 秒左右就完成了,拿来做视频的背景音乐完全没有问题。写提示词时记得要详细描述你想要的风格流派、乐器以及相关的情绪和氛围细节,可以多用描述性的短语。 一、Stable Audio是什么? Stable Audio是Stability AI 推出的AI生成音乐平台,你只需要输…- 739
-
NeuCo AI – 全新声音克隆AI工具,无需训练,一键翻唱任意歌手任意歌曲~
🥳💕🎶 NeuCo AI歌手,无需训练、一键翻唱,🌟 只需10秒音频,一键翻唱任意歌手的任意歌曲!相较于传统的ASVC,NeuCoSVC只需要上传一个角色的声音,然后就能模拟这个角色的声音唱歌 NeuCo AI的特色亮点: 🎤 NeuCoSVC是一个虚拟项目,可用于模拟角色的声音唱歌 🎧 建议上传你喜欢的参考音频,然后选择时间长度以及声音去除等操作 🎶 可选择上传B站视频或本地音频,并在上传后选择…- 1.8k
-
Soundraw – 专为音乐人打造的在线AI音乐平台,停止搜索您需要的歌曲,自己创造吧~
Soundraw为视频编辑、音乐制作人和自由职业者等提供了一个强大的平台,以创造丰富的AI音乐。 一、Soundraw是什么? Soundraw是一款由Tago公司于2020年2月推出的在线AI音乐生成器。 Soundraw 是一个非常容易上手的 AI 音乐生成工具,即使你完全是音乐小白,也能用它创作出高质量的视频。登录后只需要设置音乐时长、速度,再选择流派、情绪和主题,5 步内就能轻松生成音乐…- 1.6k