山鲸AI

无数可心AI Tool，
助你总有新发现。

🔥热门工具

Suno AI – 重量级颠覆传统认知的AI音乐制作平台，一键制作你的专属音乐，轻松实现文本转歌曲，媲美真实歌手！

一、Suno AI是什么？ Suno AI是一款强大的人工智能音乐生成器，由 Anthropic 公司开发完成。可以将文本转化为高度逼真的音乐和语音。该系统包括多种音乐风格，如电影、RAP、翻唱等，并提供了多语言和不同性别的播音员选择。用户可以使用命令来生成音频并进行个性化设置。它支持英文、中文等 50 种语言，可以在网站和 Discord 双平台上使用。新用户有 250 个免费积分，可以生成…
文生语音
- 4.2k
Carey3月25日
下载1个资源
SDXL-Light – 目前最快文生图AI模型，让AI出图速度提升 10 倍！

生成式人工智能技术已成为业界的焦点，它能够根据文本提示创造出图像或视频。目前的先进模型依赖于一个耗时的扩散过程来生成单一图像，可能需要5秒钟，并且要多次调用庞大的神经网络。因此，研究的热点是如何在保证图像质量的同时，加快图像的生成速度。一、SDXL-Lightning是什么？ SDXL-Lightning 模型是从 Stability AI 的 stable-diffusion-xl-base-…
AI绘画
- 3.2k
Po3月1日
下载1个资源
MuseV – 数字虚拟人视频生成AI工具，一键整合包，开箱即用，腾讯天琴实验室开源

一、MuseV是什么？ MuseV是一个由腾讯音乐娱乐的天琴实验室开源的虚拟人视频生成框架，专注于生成高质量的虚拟人视频和口型同步。它利用先进的算法，能够制作出具有高度一致性和自然表情的长视频内容。MuseV支持自定义动作和风格，视频时长理论上无限，且生成速度快。这一技术在AI创作领域中表现出色，为虚拟人视频制作提供了新的可能性。二、MuseV的网站地址： 1、Github开源地址： https…
AI数字人
- 3.2k
Po4月5日
下载1个资源
TripoSR – 快速单图生成3D模型，1秒完成，本地部署包，Stability AI与华人团队联合开源

TripoSR 的开发灵感来源于LRM（Large Reconstruction Models）的最新研究成果，即通过单一图像实现复杂三维结构的重建。这一突破性的图像到3D模型转换技术，旨在满足娱乐、游戏、工业设计以及建筑行业专业人士对高效3D建模工具的需求，通过快速响应输出，实现3D模型细节的精确可视化。在性能测试中，TripoSR 在Nvidia A100硬件平台上运行仅需约0.5秒即可生成…
AI 3D
- 2.9k
Po3月6日
下载1个资源
OOTDiffusion – 本地整合包，一键完美AI换装，虚拟换衣服不再困难，效果超神，支持半身，全身！！！

OOTDiffusion 支持上半身、全身的换装，如果你想要自定义模特或者衣服，需要自己提供背景干净的模特或者衣服模型。对于从事服装销售的行业来说，完全可以依赖AI 虚拟换装的方式生成营销宣传海报，无需聘请高昂的模特和拍摄费用，这是一个低成本的试装方案。一、OOTDiffusion是什么？ OOTDiffusion是一种基于潜在扩散的虚拟试穿技术，其主要目的是通过实现控制性的换装融合，让用户能够…
AI换装
- 2.9k
Po3月4日
下载1个资源
ComflowySpace – 开箱即用的ComfyUI客户端，MacOS用户的福音~

有在使用 Mac 电脑又想使用 ComfyUI，但因为安装困难而放弃的朋友吗？开源AI图像和视频生成工具值得更好的交互设计体验，而不仅仅是WebUI和ComfyUI的原生外观。很多人不愿意学习或参与AI生成浪潮，因为工具门槛太高。这正是我们想要解决的问题。因此，我们认为应该创建一个更加用户友好和有用的AI图像和视频生成工具，ComflowySpace。 ComflowySpace的目标是做出人人…
AI绘画
- 2.8k
Po3月6日

🥕最新收录

PurePhotos – 超强在线抠图工具，内置图像校正，可输出PSD，每月100张免费额度！推荐五颗星⭐️⭐️⭐️⭐️⭐️

说到抠图，我想，每个人第一个想到的就是PS！（谁敢说不是） PS的强大功能，真的一骑绝尘，不可否认，PS中可以用来作为抠图的工具也是很多，套索，魔棒，快速选择，调整边缘（选择并遮住），色彩范围，钢笔，等等。那么，除了PS，还有没有什么好用的？一、PurePhotos 是什么？ Purephotos是一个图片去背景线上网站，你只需要通过浏览器上传你想要处理的图片，可以自动删除相片上的背景，而且有…
背景移除
- 83
Carey4月24日
remove.bg – 专业图片背景移除在线工具，自动抠图，3秒完成！可免费使用~

近几年remove.bg一度刷屏互联网行业，其号称只需要上传一张带有人像的照片，它就会帮你自动抠掉背景，全自动、5秒完成。可以起到辅助作用，节省了大量人工操作。一、remove.bg 是什么？ Remove.bg 是一款功能强大的在线抠图工具，将想要抠去背景的图片上传，网站就会自动抠去背景，整个过程完全不需要手动操作，简单易上手，可以弥补 Midjourney 和 Stable diffusio…
背景移除
- 93
Carey4月24日
InsightFaceSwap – 超快速精准换脸AI工具，效果恐怖如斯，实现你的一切童年幻想！Midjourney最强伴侣插件~

对于很多小伙伴来说，都使用 Midjourney 制作过个人头像，这也是目前变现方式之一。但在生成头像的时候往往难以控制，做到和照片“很像”。InsightFaceSwap 这款插件，它支持精准替换人物面貌，而不改变图片中的其他内容，可以更好地帮助你解决这个问题。一、InsightFaceSwap 是什么？ InsightFaceSwap 是一款基于深度学习的人脸交换工具，它可以将两张人脸图片进…
AI换脸
- 158
Carey4月23日
D-ID – 全球最专业最全面的数字人视频生成AI工具，真人口播，三分钟打造超炫虚拟数字人，开启逼真数字人新时代~

随着人工智能技术的不断发展，我们逐渐迈入了一个全新的数字时代。在这个时代，人们可以通过创造性的方式与虚拟现实相结合，创造出惊人的数字人物。其中，Creative Reality Studio (D-ID) 是一家提供 AI 拟真人视频产品服务和开发的公司，其独特的技术让用户能够以惊人逼真的方式与数字人物进行互动。本文将介绍D-ID的技术原理和使用技巧，带您领略数字时代的无限可能性。一、D-ID …
AI数字人
- 444
Carey4月23日
GitLab Duo Chat – 人工智能编程助理，GitLab旗下最新产品，开发者新宠儿，AI时代利器，助力程序员提高开发效率

一、GitLab Duo Chat是什么？ Duo Chat 是源代码管理平台 GitLab 推出的一款集成了人工智能（AI）的对话式编程助手，旨在通过自然语言交互为工程和非工程用户提供实时指导。该AI编程工具支持整个软件开发生命周期，帮助团队提高代码理解速度、增强协作能力，并快速掌握 GitLab 的使用。Duo Chat 能够解释代码、重构代码、生成测试，以及提供代码建议，从而提升开发效率和代…
AI编程
- 74
Carey4月23日
LeiaPix – 专业2D图片转3D裸眼动画特效AI工具，让您的图片栩栩如生，打破视觉界限！

随着科技的发展，人工智能在图像处理方面展现了强大的能力。LeiaPix Converter就是一个使用AI技术，可以非常容易地将普通2D图片转换成3D动画的免费在线工具。在本文中，我将为您详细介绍如何使用LeiaPix Converter的各项功能，将静态图片转换成栩栩如生的3D动画。一、LeiaPix 是什么？ LeiaPix是一个基于网络的创新人工智能平台，能够将2D照片转3D效果的实用AI…
动画生成
- 346
Carey4月22日

🎨AI绘画工具

全部 AI绘画图像修复图像分析无损放大更多

下载1个资源
AnyText – 精准控制中文汉字的AI绘图工具，动动嘴皮子，就能出电商大促海报，一键整合包，开箱即用，阿里开源

随着人工智能技术的不断发展，视觉文字生成与编辑成为了一个备受关注的领域。AnyText作为一款多语言视觉文字生成与编辑工具，具有强大的功能和广泛的应用场景。一、AnyText是什么？ AnyText是阿里巴巴智能计算研究院的团队推出的一个基于扩散的多语言视觉文本生成和编辑模型，专注于在图像中渲染准确和连贯的文本。AnyText包括两个主要元素的扩散管线：辅助潜在模块和文本嵌入模块。前者使用文本字…
AI绘画
- 1.9k
Po4月7日
Dreamina – 字节旗下AIGC创作工具，首个中文生成视频的AI工具，用简单的文案，创作精彩的作品

居然才发现！字节跳动旗下国产AI绘画工具Dreamina，这么好用居然还免费！（强烈推荐）一、Dreamina是什么？ Dreamina是由字节跳动抖音旗下的剪映推出的一款AI图片创作和绘画工具，专门设计用于激发艺术创意和提升绘画体验。我们提供多样化的功能，包括文字绘图、扩图、局部重绘和图片灵感生成，让您的艺术创作更加多元和精准。在Dreamina，您可以使用自然语言描述您想要的图片，让先进…
AI绘画
- 849
Carey3月28日
下载1个资源
Osprey – 首个像素级别的区域图像分析多模态AI工具

A part of Along the River During the Qingming Festival (清明上河图) Spirited Away (千与千寻) Osprey 是一款创新图像分析AI工具，旨在提升大型语言模型（LLM）对图像的理解能力，精确到像素级别。它使用户能够在图像上选择特定区域，并对这些区域进行深入分析和识别。一、什么是Osprey？ Osprey 是一种掩码文本指令…
图像分析
- 1.6k
Po2月27日
NovelAI – 专注二次元漫画AI绘画工具，本地部署，一键免费使用

大家近几个月应该都听说过了，大批画师感叹要失业了，当然，就目前来看，这一言论还不太符合实际，但是究竟为什么让画师们这么震惊呢？一、NovelAI是什么？ NovelAI 是一项在线云端的订阅服务，它使用人工智能算法来协助作者、讲故事和虚拟陪伴。它提供了诸如文本到图像AI艺术生成器和生成新概念和情节线等功能。该服务于2021年6月在beta版中推出，并在2022年10月添加了图像生成功能。它由位于…
AI绘画
- 1.8k
Po4月1日
下载1个资源
APISR – 专注二次元动漫图像分辨率增强，无损放大AI神器，让漫画焕然一新，动漫爱好者的福音~

APISR：动漫制作启发现实世界动漫超分辨率 APISR旨在恢复和增强低质量、低分辨率的动漫图像和视频源，这些图像和视频源与现实世界场景相比存在各种退化。一、APISR是什么？ APISR 是一个新的放大算法，专门用于恢复和增强各种低质量、低分辨率的动漫图像和视频，其模型代码已经开源，并且有免费的在线 Demo 可以体验。试了一下效果的确非常不错，可以有效提升线条细节的清晰度，并且色彩的还原度也…
图像修复
- 1.8k
Po4月2日
PurePhotos – 超强在线抠图工具，内置图像校正，可输出PSD，每月100张免费额度！推荐五颗星⭐️⭐️⭐️⭐️⭐️

说到抠图，我想，每个人第一个想到的就是PS！（谁敢说不是） PS的强大功能，真的一骑绝尘，不可否认，PS中可以用来作为抠图的工具也是很多，套索，魔棒，快速选择，调整边缘（选择并遮住），色彩范围，钢笔，等等。那么，除了PS，还有没有什么好用的？一、PurePhotos 是什么？ Purephotos是一个图片去背景线上网站，你只需要通过浏览器上传你想要处理的图片，可以自动删除相片上的背景，而且有…
背景移除
- 83
Carey4月24日
下载1个资源
ComflowySpace – 开箱即用的ComfyUI客户端，MacOS用户的福音~

有在使用 Mac 电脑又想使用 ComfyUI，但因为安装困难而放弃的朋友吗？开源AI图像和视频生成工具值得更好的交互设计体验，而不仅仅是WebUI和ComfyUI的原生外观。很多人不愿意学习或参与AI生成浪潮，因为工具门槛太高。这正是我们想要解决的问题。因此，我们认为应该创建一个更加用户友好和有用的AI图像和视频生成工具，ComflowySpace。 ComflowySpace的目标是做出人人…
AI绘画
- 2.8k
Po3月6日
remove.bg – 专业图片背景移除在线工具，自动抠图，3秒完成！可免费使用~

近几年remove.bg一度刷屏互联网行业，其号称只需要上传一张带有人像的照片，它就会帮你自动抠掉背景，全自动、5秒完成。可以起到辅助作用，节省了大量人工操作。一、remove.bg 是什么？ Remove.bg 是一款功能强大的在线抠图工具，将想要抠去背景的图片上传，网站就会自动抠去背景，整个过程完全不需要手动操作，简单易上手，可以弥补 Midjourney 和 Stable diffusio…
背景移除
- 93
Carey4月24日

🎞️AI视频工具

全部 AI视频 AI字幕 AI数字人 AI直播更多

下载1个资源
MuseV – 数字虚拟人视频生成AI工具，一键整合包，开箱即用，腾讯天琴实验室开源

一、MuseV是什么？ MuseV是一个由腾讯音乐娱乐的天琴实验室开源的虚拟人视频生成框架，专注于生成高质量的虚拟人视频和口型同步。它利用先进的算法，能够制作出具有高度一致性和自然表情的长视频内容。MuseV支持自定义动作和风格，视频时长理论上无限，且生成速度快。这一技术在AI创作领域中表现出色，为虚拟人视频制作提供了新的可能性。二、MuseV的网站地址： 1、Github开源地址： https…
AI数字人
- 3.2k
Po4月5日
下载1个资源
ProPainter – 专业视频修复去水印AI工具，可以抹除视频中的静态水印、动态物体/人物，效果出色~

ProPainter是一个基于E2FGVI实现的AI视频编辑工具，它可以一键移除视频内的移动物体和水印。这个开源项目提供了一个简单而强大的解决方案，帮助用户轻松编辑和改善视频内容。一、ProPainter是什么？ ProPainter 是一个用于视频修复的先进模型。它结合了增强的传播和 Transformer 机制，能够快速高效地进行视频修复、对象去除、水印去除等任务。ProPainter 通过…
视频修复
- 2.3k
Po3月8日
下载1个资源
DiffSynth Studio – 专业视频“三渲二”风格转绘/换衣，递进式AI绘图工具，最佳DomoAI本地平替，国内B站大神开源~

在数字内容创作的领域，扩散模型已经崭露头角，成为图像合成技术中的一股不可忽视的力量。然而，当这些模型被应用到视频合成时，它们往往面临着一系列挑战，比如内容闪烁等问题。针对这一问题，最新研发的 DiffSynth 方法便应运而生，它将图像合成技术巧妙地延伸至视频领域，取得了令人瞩目的成果。一、DiffSynth Studio是什么？ DiffSynth Studio 不仅仅是一个工具，它融合了多项…
动画生成
- 2.2k
Po4月1日
下载1个资源
Wav2Lip – 使用AI听音同步人物面部口型，AI虚拟主播数字人工具整合包

Wav2Lip适用于任何人脸、任何语言，对任意视频都能达到很高都准确率，可以无缝地与原始视频融合，还可以用于转换动画人脸。一、Wav2Lip是什么？ Wav2Lip实现的是视频人物根据输入音频生成与语音同步的人物唇形，使得生成的视频人物口型与输入语音同步。Wav2Lip不仅可以基于静态图像来输出与目标语音匹配的唇形同步视频，还可以直接将动态的视频进行唇形转换，输出与目标语音匹配的视频。Wav2L…
AI数字人
- 2.2k
Po3月7日
下载1个资源
Video Subtitle Remover – 前沿VSR视频硬字幕去除AI工具，影视剪辑爱好者有福了~

引领科技前沿的Video-subtitle-remover（VSR）工具，专为那些希望清除视频中硬编码字幕的用户设计。借助尖端AI技术，VSR不仅仅是移除字幕那么简单，它还能够：无损分辨率将视频中的硬字幕去除，生成去除字幕后的文件通过超强AI算法模型，对去除字幕文本的区域进行填充（非相邻像素填充与马赛克去除）支持自定义字幕位置，仅去除定义位置中的字幕（传入位置）支持全视频自动去除所有文本（…
AI字幕
- 2.1k
Po3月6日
下载1个资源
VideoReTalking – 虚拟数字人视频AI工具整合包，同步音频嘴型/面部表情，腾讯出品~

你只需要输入任意一个视频和一个音频文件，它能给你生成一个新的视频，在这个视频里，人物的嘴型会与音频同步。VideoReTalking不仅可以让嘴型与声音同步，还可以根据声音改变视频中人物的表情。整个过程不需要用户干预，都是自动完成的。一、什么是VideoReTalking？ VideoReTalking，这是一种新的AI系统，可以根据输入音频编辑现实世界中头部说话视频的面孔，即使具有不同的情绪，…
AI数字人
- 2k
Po3月7日
下载1个资源
Luna AI – 国内本土顶尖全自动数字人AI虚拟直播系统

一、Luna AI是什么？ Luna AI 是一款结合了最先进技术的虚拟AI主播。它的核心是一系列高效的人工智能模型，包括 ChatterBot、GPT、Claude、langchain、chatglm、text-generation-webui、讯飞星火、智谱AI、谷歌Bard、文心一言、通义星尘、千帆大模型、Gemini、Kimi Chat、QAnything、kobold…
AI直播
- 2k
Po2月26日
下载1个资源
DynamiCrafter – 图片转动画视频AI工具，腾讯出品

一、DynamiCrafter是什么？ DynamiCrafter是一款由腾讯、北大等人开发的图像动画工具。通过利用预训练的视频扩散先验，可以基于文本提示为开放域的静止图像添加动画效果。该工具支持高分辨率模型，提供更好的动态效果、更高的分辨率和更强的一致性。二、DynamiCrafter开源地址： 1、Github仓库： https://github.com/Doubiiu/DynamiCraf…
动画生成
- 1.9k
Po2月23日

🎵AI声音工具

Suno AI – 重量级颠覆传统认知的AI音乐制作平台，一键制作你的专属音乐，轻松实现文本转歌曲，媲美真实歌手！

一、Suno AI是什么？ Suno AI是一款强大的人工智能音乐生成器，由 Anthropic 公司开发完成。可以将文本转化为高度逼真的音乐和语音。该系统包括多种音乐风格，如电影、RAP、翻唱等，并提供了多语言和不同性别的播音员选择。用户可以使用命令来生成音频并进行个性化设置。它支持英文、中文等 50 种语言，可以在网站和 Discord 双平台上使用。新用户有 250 个免费积分，可以生成…
文生语音
- 4.2k
Carey3月25日
下载1个资源
VALL-E – 微软最强AI声音克隆工具，免训练，免安装，本地整合包，三秒偷走你的声音~

该模型支持多种语言（英语、中文和日语）和零样本语音克隆，你只需要提供一个人短短几秒钟的录音（3-10秒），就能模仿出那个人的声音。此外，它还具有语音情感控制和口音控制等高级功能。同时相对于其他模型，它更轻量、更快速… 一、VALL-E是什么？ Vall-E AI是微软开发的一款基于人工智能的文本到语音转换器。该工具将文本输入转换为音频，并将其与人的情绪和房间的声学效果相匹配。它可以使用三秒的短音频…
声音克隆
- 2k
Po3月8日
下载1个资源
Bark – 高度逼真的开源文本转语音AI工具，最强TTS本地整合包

Bark是一个开源的文本转语音的AI模型。Bark 可以生成高度逼真的多语言语音以及其他音频 - 包括音乐、背景噪音和简单的音效。该模型可以模拟正常说话口气的语音，如笑、叹息和哭泣。支持多语言，包括中文。一、Bark的项目地址： 1、论文地址： https://arxiv.org/abs/2209.03143 2、Github仓库： https://github.com/suno-ai/bark…
文生语音
- 1.9k
Po3月6日
下载1个资源
GPT SoVITS WebUI – 快速声音AI克隆工具，完美复刻任何角色的语音、语调、语气！

语音技术在人工智能的驱动下，正在以前所未有的速度推进。GPT-SoVITS-WebUI正是这一变革的先驱它利用少量的声音源，可以快速地训练出一个语音合成（Text-to-Speech，简称TTS）模型。这个强大的Web界面工具不仅提供了零次学习和少量次学习的文本到语音（TTS）功能，还支持跨语言的语音转换，为语音技术的爱好者和开发者打开了一扇新的大门。一、GPT SoVITS WebUI的功能…
声音克隆
- 1.9k
Po3月4日
下载1个资源
EmotiVoice易魔声 – 爆火国产文本转语音AI工具，支持中英文，具有情绪控制功能~

网易有道AI算法团队也开源了一款国产TTS语音合成引擎EmotiVoice，刚上线仅一周时间就暴涨4200颗星，问鼎当周GitHub trending流行榜第一。而如今已冲到了 4.5k Star。一、EmotiVoice是什么？ EmotiVoice是一款功能强大且现代的开源文本转语音引擎，您可以免费使用。EmotiVoice 提供中英文两种语言，超过 2000 种不同的语音。最突出的功能是情…
文生语音
- 1.9k
Po3月6日
下载1个资源
Bert-VITS 2 – 爆杀原版？原神&星穹铁道全角色文本转语音AI工具，栩栩如生，声色克隆，原神启动！

为游戏爱好者们带来一款新的体验工具，原神&星穹铁道全角色文本转语音AI工具。该工具基于先进的BERT-VITS模型，这是一种结合了Transformer架构的语音合成技术。BERT-VITS模型通过深度学习，能捕捉到不同音色的独特属性，并能够实现高度个性化的语音合成效果。这款整合包特别支持多角色对话模式，让用户能够体验到更加丰富和真实的交互对话。一、Bert-VITS 2是什么？ BER…
AI配音
- 1.8k
Po3月19日
下载1个资源
AudioCraft – 顶级音乐生成AI工具，来自Meta AI免费开源，音乐效果媲美音乐家作品~

一、AudioCraft是什么？ AudioCraft是Meta AI免费开源的一款深度学习进行音频处理和生成的库。可满足您所有的生成音频需求：音乐、音效以及原始音频信号训练后的压缩。它具有最先进的EnCodec音频压缩器/标记器，沿着MusicGen，一个简单可控的音乐生成LM，具有文本和旋律调节。素材训练使用2万小时的授权音乐来训练MusicGen。二、AudioCraft的项目地址： …
文生语音
- 1.8k
Po3月13日
下载1个资源
MeloTTS – 高质量实时文本转语音AI工具，支持多国语言，同时兼容GPU/CPU

一、MeloTTS是什么？ MeloTTS 是一个强大的多语言文本转语音库，特别设计以支持CPU环境下的实时语音合成，无需依赖GPU。该库能够输出自然流畅的语音，提供了一种高效便捷的方式，将文本信息转换为听觉内容。 MeloTTS不仅支持多种语言，包括英语、西班牙语、法语、中文、日语和韩语，还能处理混合语言文本，如含有英语单词的中文文本。此外，用户还可以根据需求调整语速，选择不同的发音口音，如美式…
文生语音
- 1.7k
Po3月4日

🎉发现更多

全部 AI绘画 AI写作 AI声音 AI图像更多

下载1个资源
MeloTTS – 高质量实时文本转语音AI工具，支持多国语言，同时兼容GPU/CPU

一、MeloTTS是什么？ MeloTTS 是一个强大的多语言文本转语音库，特别设计以支持CPU环境下的实时语音合成，无需依赖GPU。该库能够输出自然流畅的语音，提供了一种高效便捷的方式，将文本信息转换为听觉内容。 MeloTTS不仅支持多种语言，包括英语、西班牙语、法语、中文、日语和韩语，还能处理混合语言文本，如含有英语单词的中文文本。此外，用户还可以根据需求调整语速，选择不同的发音口音，如美式…
文生语音
- 1.7k
Po3月4日
Runway – 新一代视频内容制作生成AI工具，人人都能成为神笔马良

一、Runway是什么？ Runway AI成立于 2018 年，是一家美国纽约的图片和视频AI编辑软件提供商，为设计师、艺术家和开发人员提供一系列的工具和平台，帮助他们利用人工智能技术创建作品。二、Runway的网页地址是什么？ https://runwayml.com/ 三、Runway可以做什么？人类想象力的工具。一套新的创意工具，旨在将您头脑中的想法变成现实。通过能够理解和生成世界的人…
视频生成
- 613
Carey23年3月14日
下载1个资源
MuseTalk – 数字虚拟人唇形同步视频生成AI工具，一键整合包，开箱即用，腾讯天琴实验室开源

一、MuseTalk是什么？ MuseTalk 是由腾讯团队开发的先进技术，它是一个实时的音频驱动唇部同步模型。该模型能够根据输入的音频信号，自动调整数字人物的面部图像，使其唇形与音频内容高度同步。这样，观众就能看到数字人物口型与声音完美匹配的效果。MuseTalk 特别适用于256 x 256像素的面部区域，且支持中文、英文和日文等多种语言输入。在NVIDIA Tesla V100显卡上，Mus…
AI数字人
- 562
Po4月17日
下载1个资源
CharacterGLM-6B – 角色扮演AI大模型，本地整合包，你会和佟掌柜来一场恋爱，还是跟张起灵一起去古墓探险呢？

为了满足不同用户的需求，CharacterGLM设计并定制了多种角色，覆盖了名人类、生活类、游戏影音类和虚拟恋爱类等多个领域。一、CharacterGLM-6B模型介绍： CharacterGLM-6B 是聆心智能和清华大学 CoAI 实验室联合发布的新一代对话预训练模型。CharacterGLM-6B 是基于 ChatGLM2 系列中的开源模型，在保留了前两代模型对话流畅、部署门槛低等众多…
AI对话
- 1.6k
Po3月20日
下载1个资源
LaTeX OCR – 数学公式图像识别AI工具，完美替代坑爹MathPix，本地整合包，无需环境，一键安装，开源免费~

由于mathpix开始收费了，于是我们将开源免费的LaTeX-OCR工具制作成本地整合包，点击即可使用，避免大家配置Python环境出现各种问题。一、LaTeX OCR是什么？ LaTeX-OCR 是一个开源的光学字符识别（OCR）软件，专为LaTeX 文档提供支持。其主要目的是帮助用户将扫描的文档转换为LaTeX 编辑器可以使用的可编辑文本，从而方便进行修改、编辑和排版。 LaTeX广泛用于…
PDF
- 1.7k
Po3月18日
Pika- 火爆出圈的视频生成AI工具，海外独角兽项目，一度刷屏国内外社交平台

每个人都能成为多模态梦想的导演，就像《盗梦空间》中的建筑师一样。一、Pika是什么？ Pika是热门的人工智能初创公司Pika Labs推出的AI视频生成和编辑工具，该工具可以将任何创意转化为视频，用户只需输入文字或图像，即可快速生成3D动画、动漫、卡通、电影等风格的视频。该AI视频生成工具最早于2023年4月下旬推出测试版，累计已经超过50万名早期用户使用，每周都在生成数百万个视频。不过，目前…
视频生成
- 906
Carey4月15日
下载1个资源
🧠Awesome ChatGPT Prompts – AI对话角色提示语生成器，让你更高效的使用ChatGPT~

在人工智能技术的星空中，ChatGPT无疑是一颗璀璨的明星。这款由OpenAI研发的人工智能聊天机器人，以其强大的对话能力，赢得了广泛的关注和好评。ChatGPT能够流畅地与用户进行交流，并且在多种场景下提供帮助。一、Awesome ChatGPT Prompts是什么？ Awesome ChatGPT Prompts专门服务于ChatGPT，众所周知ChatGPT要充分发挥其潜力，合理的提示词…
AI咒语
- 619
Carey3月21日
川虎GPT🐯 – 本地开源AI对话客户端，速度优于ChatGPT，支持联网~

川虎GPT🐯为ChatGPT等多种LLM提供了一个轻快好用的Web图形界面和众多附加功能一、川虎GPT的最近更新：全新的用户界面！精致得不像 Gradio，甚至有毛玻璃效果！适配了移动端（包括全面屏手机的挖孔/刘海），层级更加清晰。历史记录移到左侧，使用更加方便。并且支持搜索（支持正则）、删除、重命名。现在可以让大模型自动命名历史记录（需在设置或配置文件中开启）。现在可以将…
AI对话
- 608
Carey3月6日
下载1个资源
OMS-Diffusion – AI换装升级版来了，虚拟试衣间，本地整合包，免训练，免安装

OMS-Diffusion 是OOTDiffusion的分支版本，与原来的 OOTDiffusion 训练两个 Unet 不同，OMS-Diffusion 只训练一个 Unet，这意味着一台 24GB 内存的机器（3090 或 4090）就足够了。如今已有很多关于虚拟试穿的项目，如谷歌的Tryon Diffusion, 阿里的Outfit Anyone, 亚马的Diffuse to Choose…
AI换装
- 2.1k
Po3月18日
下载1个资源
ASR – 视频/语音自动生成字幕工具，本地整合包，AI视频剪辑必备神器~

一、ASR是什么？ ASR全称Automatic Speech Recognition，自动语音识别也称为语音转文本 (STT)，是将给定音频转录为文本的任务。它有很多应用，例如语音用户界面。二、ASR的项目地址： https://huggingface.co/tasks/automatic-speech-recognition 三、ASR的使用场景： 1、虚拟语音助手许多边缘设备都有嵌入式虚…
AI字幕
- 1.6k
Po3月18日
InsightFaceSwap – 超快速精准换脸AI工具，效果恐怖如斯，实现你的一切童年幻想！Midjourney最强伴侣插件~

对于很多小伙伴来说，都使用 Midjourney 制作过个人头像，这也是目前变现方式之一。但在生成头像的时候往往难以控制，做到和照片“很像”。InsightFaceSwap 这款插件，它支持精准替换人物面貌，而不改变图片中的其他内容，可以更好地帮助你解决这个问题。一、InsightFaceSwap 是什么？ InsightFaceSwap 是一款基于深度学习的人脸交换工具，它可以将两张人脸图片进…
AI换脸
- 158
Carey4月23日
Heygen – 全球爆火的顶尖虚拟数字人视频AI工具，一键生成

HeyGen 原名 Movio，是一个在线的数字人视频制作平台。一、Heygen是什么？ HeyGen是一个基于AI数字人技术的视频制作工具。它的特点在于将数字人技术融入到一般的视频制作流程中，也就是除了提供丰富的数字人素材，HeyGen 还提供了 100 多种不同的数字人视频模板，包括广告、电商、新闻、教育、科普、以及抖音、YouTube 视频等多个方面，让用户省去剪辑排版的环节，直接用模板就…
AI数字人
- 709
Carey3月29日
下载1个资源
FRESCO – 一键视频风格转换AI工具，告别复杂工作流，北京大学开源，本地整合包，一键运行~

北京大学近日发布了一项全新的视频风格转换工具——FRESCO。这一工具旨在简化视频转视频的处理流程，使之更加便捷、高效。FRESCO支持将视频转换为多种不同的风格，并且独特之处在于，它可以选择性地转换视频中特定的部分。值得一提的是，该项目的代码已经开源，供广大研究人员和爱好者使用和探索。一、FRESCO是什么？ FRESCO在设计时考虑了帧间对应关系，并引入了帧内对应概念，从而构建了一个更加稳定…
风格转绘
- 1.8k
Po4月3日
Findsd.art – 专业AI模型在线以图搜索神器，再也不需要一个一个去翻啦~

一、Findsd.art是什么？ Findsd.art 是一个通过图像搜索 Stable Diffusion 模型在线工具。上传一张图像后，网站会为你找出多张相似的图像，并按相似度进行排序。这些图片下方都有一个链接，点击后会直接跳转到 C 站，里面可以看到该图像用到的 SD 模型、提示词和生成参数等信息。有了它寻找需要的模型将变得非常轻松，不用再去 C 站一个个去翻了。二、Findsd.art的…
模型查找
- 866
Carey3月11日
下载1个资源
零一万物 – 首款开源中英双语大模型，本地部署包，免训练，免安装，李开复最快AI独角兽开源项目~

支持输入30万汉字，看不懂《百年孤独》的人有救了一、零一万物是什么？知名投资人、创新工场董事长兼CEO李开复博士带队创办 AI 2.0大模型公司“零一万物”（01.AI），正式发布首款研发的最强开源人工智能（AI）大模型系列，名为“Yi”。此次 Yi 系列基础模型的首个公开版本包括两款：Yi-6B（数据参数量为60亿）、Yi-34B（340亿），均是双语（英文/中文）、支持开源。其中，Yi-…
AI对话
- 2k
Po4月3日
Become Image – 图片风格化迁移AI工具，1:1复刻大师风骨

AI工具为用户提供了一种全新的图像处理体验，让人们可以通过简单的操作实现复杂的图像转换功能。随着人工智能技术的不断发展，相信类似的创新工具将会越来越多，为用户带来更多惊喜和乐趣。一、Become Image是什么？ Become image 是Github上面一款开源免费的图片风格化迁移AI工具，上传一张人物头像，然后再上传一张风格参考图像，就能得到一张与原图人物高度相似的风格化头像了。网站内还…
风格迁移
- 1k
Carey4月9日