-
VisoMaster v0.1.6 中文版 - 重磅更新,最新图片视频 AI 换脸美颜软件,本地整合包,自动脸部识别,一键换脸美颜,支持无人在线直播
VisoMaster 是一款功能强大且易于使用的AI换脸软件。它采用先进的人工智能技术,能够在图片和视频中实现自然逼真的换脸效果,适合普通用户和专业人士使用。 一、VisoMaster 是什么? VisoMaster可以说是Rope的升级版,如果你熟悉Rope,上手VisoMaster将毫无难度。它是一款功能强大且简单易用的工具,专为图片和视频中的换脸与编辑设计。借助人工智能技术,VisoMast…- 1.5k
-
Stable Diffusion 秋叶整合包v4.6 - 解压即用,防爆显存,快速入门AI绘画
Stable Diffusion秋叶整合包,超简单一键安装Stable Diffusion,无任何使用门槛,完全免费使用,支持Nvdia全系列显卡 来自B站up@秋葉aaaki,近期发布了Stable Diffusion整合包v4版本,一键在本地部署Stable Diffusion!! 适用于零基础想要使用AI绘画的小伙伴~ Stable Diffusion(SD)是什么? Stable Diff…- 7.8k
-
-
MotionShop - 一键替换视频人物AI工具,阿里开源,把视频人物秒变3D角色,平替Wonder Studio
这款AI工具替换成的3D人物能复制原视频中人物的动作,就像镜子一样!这可太强大了,想想都觉得好神奇呀!能想象到,未来某些综艺节目明星塌房的问题,直接换个可爱的吉祥物可能比打马赛克更有看头了对吧。 一、MotionShop 是什么? Motionshop是阿里巴巴智能计算研究院(XR实验室和TIDE三维渲染团队)推出的一个AI角色动画框架,可将视频中的人物角色替换为3D化身,同时不改变视频中的其他场…- 13.2k
-
Easy-Wav2Lip - 数字人口播视频制作AI工具,高度口型同步,本地整合包,支持图片和视频~
一、Easy-Wav2Lip是什么? Easy-Wav2Lip是Wav2Lip的改进版本,在设计上更为简洁,执行速度更快,同时生成的视频效果更加逼真。Wav2Lip技术可以让视频中的人物根据输入的音频生成匹配的唇形动作,从而实现口型与语音同步的效果。这项技术不仅适用于静态图像,还能够对动态视频进行处理,生成与目标语音同步的视频输出。 二、Easy-Wav2Lip的项目地址: 1、Github仓库:…- 8k
-
川虎GPT🐯 - 本地开源AI对话客户端,速度优于ChatGPT,支持联网~
川虎GPT🐯为ChatGPT等多种LLM提供了一个轻快好用的Web图形界面和众多附加功能 一、川虎GPT的最近更新: 全新的用户界面!精致得不像 Gradio,甚至有毛玻璃效果! 适配了移动端(包括全面屏手机的挖孔/刘海),层级更加清晰。 历史记录移到左侧,使用更加方便。并且支持搜索(支持正则)、删除、重命名。 现在可以让大模型自动命名历史记录(需在设置或配置文件中开启)。 现在可以将…- 6.4k
-
DeepFaceLab - 官方原生AI换脸软件,开箱即用,可支持A卡和N卡~
DeepFaceLab(后面简称DFL)是一个GitHub上的一个开源项目,用于视频换脸,使用Python编写,基于Tensorflow框架。DFL是目前开源软件中最好用的AI换脸软件之一,现在还在不断更新,同时作者也在开发DeepFaceLive,用于实时换脸。哔哩哔哩上很多换脸视频都是基于此框架,包括著名的肌肉金轮。 一、DeepFaceLab是什么? Deepfacelab是一款基于深度学习…- 9k
-
Luna AI - 国内本土顶尖全自动数字人AI虚拟直播系统
一、Luna AI是什么? Luna AI 是一款结合了最先进技术的虚拟AI主播。它的核心是一系列高效的人工智能模型,包括 ChatterBot、GPT、Claude、langchain、chatglm、text-generation-webui、讯飞星火、智谱AI、谷歌Bard、文心一言、通义星尘、千帆大模型、Gemini、Kimi Chat、QAnything、kobold…- 6.4k
-
-
Osprey - 首个像素级别的区域图像分析多模态AI工具
A part of Along the River During the Qingming Festival (清明上河图) Spirited Away (千与千寻) Osprey 是一款创新图像分析AI工具,旨在提升大型语言模型(LLM)对图像的理解能力,精确到像素级别。它使用户能够在图像上选择特定区域,并对这些区域进行深入分析和识别。 一、什么是Osprey? Osprey 是一种掩码文本指令…- 3.2k
-
ELLA - 腾讯开源文生图扩散模型,利用LLM增强语义对齐,本地整合包,免训练,一键运行,效果赶超DALL-E~
一、ELLA是什么? ELLA(Efficient Large Language Model Adapter,高效大型语言模型适配器)由腾讯研究人员开发。该技术旨在提高文本到图像生成模型在处理复杂文本提示时的语义对齐能力。通过整合大型语言模型(LLM),ELLA极大增强了模型的文本对齐性能,而这一切无需对U-Net或LLM进行额外的训练。. BigBootythickkbitch312 abell…- 2.3k
-
零一万物 - 首款开源中英双语大模型,本地部署包,免训练,免安装,李开复最快AI独角兽开源项目~
支持输入30万汉字,看不懂《百年孤独》的人有救了 一、零一万物是什么? 知名投资人、创新工场董事长兼CEO李开复博士带队创办 AI 2.0大模型公司“零一万物”(01.AI),正式发布首款研发的最强开源人工智能(AI)大模型系列,名为“Yi”。 此次 Yi 系列基础模型的首个公开版本包括两款:Yi-6B(数据参数量为60亿)、Yi-34B(340亿),均是双语(英文/中文)、支持开源。其中,Yi-…- 6k
-
GFPGAN - 老照片人脸修复AI工具本地整合包,腾讯团队出品~
在数字时代,老照片的修复和保存成为了一项挑战性的任务。幸运的是,随着人工智能技术的发展,我们现在能够以前所未有的方式恢复这些珍贵的回忆。GFPGAN,由腾讯开源,代表了这一技术进步的前沿。这款先进的人脸修复算法不仅仅是一个工具,它集成了一系列的先验知识,以支持对老旧照片中的人脸进行高效、自动化的修复。 通过使用预训练的模型,GFPGAN能够处理所谓的“盲脸”(blind face)修复任务,即在没…- 4.5k
-
NeuCo AI - 全新声音克隆AI工具,无需训练,一键翻唱任意歌手任意歌曲~
🥳💕🎶 NeuCo AI歌手,无需训练、一键翻唱,🌟 只需10秒音频,一键翻唱任意歌手的任意歌曲!相较于传统的ASVC,NeuCoSVC只需要上传一个角色的声音,然后就能模拟这个角色的声音唱歌 NeuCo AI的特色亮点: 🎤 NeuCoSVC是一个虚拟项目,可用于模拟角色的声音唱歌 🎧 建议上传你喜欢的参考音频,然后选择时间长度以及声音去除等操作 🎶 可选择上传B站视频或本地音频,并在上传后选择…- 10.8k
-
SeaArt-Furry-XL-1.0 - 高质量毛绒绒卡通动漫人物插画生成AI绘画工具,海艺AI旗下开源项目,本地部署,一键生成~
一、SeaArt-Furry-XL-1.0 是什么? SeaArt-Furry-XL-1.0是基于先进的SDXL框架开发的,专门用于创造高品质的毛茸茸艺术图像。这个工具通过分析超过数百万张毛茸茸的图片,设定了毛茸茸艺术图像创作的新标准。它不仅深入了解各种毛茸茸角色,还细致考量了多种哺乳动物和鸟类的特征,使得生成的图像既精确又具有艺术家的风格。SeaArt-Furry-XL-1.0的目标是为毛茸茸艺…- 4.8k
-
LaVie - 高质量文生视频AI大模型,本地整合包,免安装,免训练,免费使用。
一、LaVie是什么? LaVie是一个高质量视频生成项目,使用级联潜在扩散模型。这个项目是由Vchitect开发的官方PyTorch实现。LaVie是一个文本到视频(T2V)生成框架,是视频生成系统Vchitect的主要部分。它还包括一个针对图像到视频(I2V)模型SEINE的微调版本。. Sebby_RawTV onlyfans angie 二、LaVie的网站地址: 1、论文地址: http…- 4.1k
-
MuseV - 数字虚拟人视频生成AI工具,一键整合包,开箱即用,腾讯天琴实验室开源
一、MuseV是什么? MuseV是一个由腾讯音乐娱乐的天琴实验室开源的虚拟人视频生成框架,专注于生成高质量的虚拟人视频和口型同步。它利用先进的算法,能够制作出具有高度一致性和自然表情的长视频内容。MuseV支持自定义动作和风格,视频时长理论上无限,且生成速度快。这一技术在AI创作领域中表现出色,为虚拟人视频制作提供了新的可能性。 二、MuseV的网站地址: 1、Github开源地址: https…- 9.6k
-
Fish Speech - 低显存高效语音克隆生成AI工具,免训练,免安装,本地整合包,复制声音如此轻松~
高效的低显存语音克隆工具,媲美GPT-SoVITS! 一、Fish Speech是什么? Fish Speech 是一个全新的文本转语音(TTS)解决方案。作为一个前沿的技术,它提供了高度的自定义和灵活性,允许用户按照他们的个性化需求和期望进行设置。适应多元化环境,可无缝兼容 Linux 和 Windows 操作系统,一站式满足不同用户群体的需求。为了运行此程序,您需要至少 4GB 的 GPU 内…- 11k
-
FRESCO - 一键视频风格转换AI工具,告别复杂工作流,北京大学开源,本地整合包,一键运行~
北京大学近日发布了一项全新的视频风格转换工具——FRESCO。这一工具旨在简化视频转视频的处理流程,使之更加便捷、高效。FRESCO支持将视频转换为多种不同的风格,并且独特之处在于,它可以选择性地转换视频中特定的部分。值得一提的是,该项目的代码已经开源,供广大研究人员和爱好者使用和探索。 一、FRESCO是什么? FRESCO在设计时考虑了帧间对应关系,并引入了帧内对应概念,从而构建了一个更加稳定…- 5.3k
-
DDColor - 阿里AI老照片上色一键修复工具
一、什么是DDColor? 🎨DDColor 是最新的 SOTA 图像上色算法,能够对输入的黑白图像生成自然生动的彩色结果,使用 UNet 结构的骨干网络和图像解码器分别实现图像特征提取和特征图上采样,并利用 Transformer 结构的颜色解码器完成基于视觉语义的颜色查询,最终聚合输出彩色通道预测结果。 🪄 DDColor 可以为历史黑白老照片提供生动自然的着色。 🎲 它甚至可以对动漫游戏中的…- 4.7k
-
FaceFusion - 重磅更新,最强AI换脸汉化软化,去遮挡,高清化,卡通脸一键替换,本地整合包,无需部署,无需训练,免费使用!
一个替代Roop的开源软件,通过AI换脸技术实现简单的面部替换操作。Roop项目由于团队成员不当使用而停更,但其中一位作者开源了新项目FaceFusion,在GitHub上已经获得超过5000星的关注。 一、FaceFusion是什么? Facefusion是一款最新的开源AI视频/图片换脸项目。项目官方介绍只有一句话,下一代换脸器和增强器。采用了全新的界面设计,可以像Stable Diffuis…- 15.6k
-
SadTalker - 图片配合音频秒变声音视频,头部、嘴型超自然,中英双语全能,还会唱歌~
单个肖像图像 🙎♂️ + 音频 🎤 = 头部说话视频🎞 一、SadTalker是什么? SadTalker模型是一个使用图片与音频文件自动合成人物说话动画的开源模型,我们自己给模型一张图片以及一段音频文件,模型会根据音频文件把传递的图片进行人脸的相应动作,比如张嘴,眨眼,移动头部等动作。SadTalker,它从音频中生成 3DMM 的 3D 运动系数(头部姿势、表情),并隐式调制一种新颖的 3D…- 7.8k
-
👕👔👚IDM-VTON - 超真实的一键虚拟换装AI工具,支持户外模特,虚拟试衣间,在线免费使用
一、IDM-VTON 是什么? IDM-VTON(Improved Diffusion Models for Virtual Try-ON)是由韩国科学技术院和OMNIOUS.AI的研究人员提出的一种先进的AI虚拟试穿技术,通过改进扩散模型来生成逼真的人物穿戴图像,实现更真实的虚拟试穿效果。该技术包含两个关键组件:一是视觉编码器,用于提取服装图像的高级语义信息;二是GarmentNet,一个并行U…- 6.1k
-
EasyPhoto - 您的AI艺术写真AI工具,快速创建自己的AI数字分身,中文本地整合包
🦜 EasyPhoto 是一个 Webui UI 插件,用于生成 AI 肖像,可用于训练与您相关的数字分身。 一、EasyPhoto是什么? EasyPhoto 是一个 Webui UI 插件,用于生成 AI 肖像,可用于训练与您相关的数字分身。训练建议用5到20张人像图片进行,最好是半身照片,并且不要戴眼镜(几张图中的人物戴眼镜也没关系)。训练完成后,我们可以在推理部分生成它。我们支持使用预设的…- 3.8k




























