-
AnyDoor任意门 – 完美服装替换,一键换装,实现图片上任意元素的挪移变幻,效果出色!!!
AnyDoor的命名灵感来源于其功能与神奇的“任意门”相似,能够实现物体的即时移动。 一、AnyDoor是什么? AnyDoor 是一款创新的AI工具,能够将任何对象(如人物、动物或物品)无缝集成到新的图像或视频场景中。这款扩散的图像生成器,借助先进的算法,实现了在用户指定的位置,以自然和谐的方式将目标对象“传送”到新的场景中,自动调整光线和角度以适应新环境。 由阿里巴巴与香港大学共同研…- 8.9k
-
ChatGPT Academic – 中科院学术专业版ChatGPT,一键搞定所有论文!助力科研创新,开启智能学术之旅~
自ChatGPT Academic在Github推出已有一段时间,已收获无数网友点赞。那什么是ChatGPT Academic,如何在自己电脑上部署呢?今天,就让小编带着大家一探究竟! 一、ChatGPT Academic是什么? ChatGPT Academic也被称为「中科院学术专业版 ChatGPT」,是中科院计算机科学与技术研究所研发的一款人工智能学术助手,旨在为科研人员提供高效、便捷的学…- 7.3k
-
Rope – 强大的一键换脸AI,本地部署,可消除脸部遮挡,飞一般的处理速度~
随着人工智能的发展,现在有着越来越多的ai换脸软件,可以一键将影视片段里的角色换成自己的脸,与喜欢的明星同框,那么免费的Ai换脸软件有哪些呢? 今天给大家推荐一个叫ROPE的换脸软件,ROPE是本地离线安装的换脸软件,无任何功能限制。可以这样说,ROPE目前是PC端最好的换脸软件,没有之一。 如果说目前pc端AI视频换脸软件哪个最好,可以这样说,rope当之无愧可以得到第一名,可以同时替换多个人脸…- 6.4k
-
OOTDiffusion – 本地整合包,一键完美AI换装,虚拟换衣服不再困难,效果超神,支持半身,全身!!!
OOTDiffusion 支持上半身、全身的换装,如果你想要自定义模特或者衣服,需要自己提供背景干净的模特或者衣服模型。对于从事服装销售的行业来说,完全可以依赖AI 虚拟换装的方式生成营销宣传海报,无需聘请高昂的模特和拍摄费用,这是一个低成本的试装方案。 一、OOTDiffusion是什么? OOTDiffusion是一种基于潜在扩散的虚拟试穿技术,其主要目的是通过实现控制性的换装融合,让用户能够…- 5.5k
-
MuseV – 数字虚拟人视频生成AI工具,一键整合包,开箱即用,腾讯天琴实验室开源
一、MuseV是什么? MuseV是一个由腾讯音乐娱乐的天琴实验室开源的虚拟人视频生成框架,专注于生成高质量的虚拟人视频和口型同步。它利用先进的算法,能够制作出具有高度一致性和自然表情的长视频内容。MuseV支持自定义动作和风格,视频时长理论上无限,且生成速度快。这一技术在AI创作领域中表现出色,为虚拟人视频制作提供了新的可能性。 二、MuseV的网站地址: 1、Github开源地址: https…- 4.8k
-
DiffSynth Studio – 专业视频“三渲二”风格转绘/换衣,递进式AI绘图工具,最佳DomoAI本地平替,国内B站大神开源~
在数字内容创作的领域,扩散模型已经崭露头角,成为图像合成技术中的一股不可忽视的力量。然而,当这些模型被应用到视频合成时,它们往往面临着一系列挑战,比如内容闪烁等问题。针对这一问题,最新研发的 DiffSynth 方法便应运而生,它将图像合成技术巧妙地延伸至视频领域,取得了令人瞩目的成果。 一、DiffSynth Studio是什么? DiffSynth Studio 不仅仅是一个工具,它融合了多项…- 4.8k
-
ComfyUI 秋叶整合包 – 工作流界面,超多节点,解压即用,一键启动,快速入门AI绘画
上周赛博佛祖秋葉 Aki 发布了针对 ComfyUI 的整合安装包,让这款原本偏专业的 AI 绘画工具对初学者来说更容易上手使用了,我也安装试用了一下,的确非常方便,今天就为大家详细介绍一下整合包的用法 ~ 来自B站up@秋葉aaaki,近期发布了Stable Diffusion整合包v4版本,一键在本地部署Stable Diffusion!! 适用于零基础想要使用AI绘画的小伙伴~ 一、Comf…- 4.7k
-
FaceFusion – 重磅更新,最强AI换脸汉化软化,去遮挡,高清化,卡通脸一键替换,本地整合包,无需部署,无需训练,免费使用!
一个替代Roop的开源软件,通过AI换脸技术实现简单的面部替换操作。Roop项目由于团队成员不当使用而停更,但其中一位作者开源了新项目FaceFusion,在GitHub上已经获得超过5000星的关注。 一、FaceFusion是什么? Facefusion是一款最新的开源AI视频/图片换脸项目。项目官方介绍只有一句话,下一代换脸器和增强器。采用了全新的界面设计,可以像Stable Diffuis…- 4.7k
-
SDXL-Light – 目前最快文生图AI模型,让AI出图速度提升 10 倍!
生成式人工智能技术已成为业界的焦点,它能够根据文本提示创造出图像或视频。目前的先进模型依赖于一个耗时的扩散过程来生成单一图像,可能需要5秒钟,并且要多次调用庞大的神经网络。因此,研究的热点是如何在保证图像质量的同时,加快图像的生成速度。 一、SDXL-Lightning是什么? SDXL-Lightning 模型是从 Stability AI 的 stable-diffusion-xl-base-…- 4.6k
-
TripoSR – 快速单图生成3D模型,1秒完成,本地部署包,Stability AI与华人团队联合开源
TripoSR 的开发灵感来源于LRM(Large Reconstruction Models)的最新研究成果,即通过单一图像实现复杂三维结构的重建。这一突破性的图像到3D模型转换技术,旨在满足娱乐、游戏、工业设计以及建筑行业专业人士对高效3D建模工具的需求,通过快速响应输出,实现3D模型细节的精确可视化。 在性能测试中,TripoSR 在Nvidia A100硬件平台上运行仅需约0.5秒即可生成…- 4.6k
-
ProPainter – 专业视频修复去水印AI工具,可以抹除视频中的静态水印、动态物体/人物,效果出色~
ProPainter是一个基于E2FGVI实现的AI视频编辑工具,它可以一键移除视频内的移动物体和水印。这个开源项目提供了一个简单而强大的解决方案,帮助用户轻松编辑和改善视频内容。 一、ProPainter是什么? ProPainter 是一个用于视频修复的先进模型。它结合了增强的传播和 Transformer 机制,能够快速高效地进行视频修复、对象去除、水印去除等任务。ProPainter 通过…- 4.5k
-
VideoReTalking – 虚拟数字人视频AI工具整合包,同步音频嘴型/面部表情,腾讯出品~
你只需要输入任意一个视频和一个音频文件,它能给你生成一个新的视频,在这个视频里,人物的嘴型会与音频同步。VideoReTalking不仅可以让嘴型与声音同步,还可以根据声音改变视频中人物的表情。整个过程不需要用户干预,都是自动完成的。 一、什么是VideoReTalking? VideoReTalking,这是一种新的AI系统,可以根据输入音频编辑现实世界中头部说话视频的面孔,即使具有不同的情绪,…- 4k
-
Fooocus 2.0 中文版 – 傻瓜式AI绘画神器,超180种预置风格,体验直追Midjourney,三天登顶GitHub热榜!
玩AI画画,现在终于不用担心被老黄刀法“背刺”了! 只需要一块4年前的GTX 1650(显存4GB),AI出图效果堪比当前最好的开源模型SDXL。 一、Fooocus是什么? Fooocus是一款离线、开源且免费的AI绘画软件,仅需4G显存即可使用SDXL模型。通过重新思考Stable Diffusion和Midjourney的设计理念,Fooocus简化了安装过程,降低了使用门槛,让更多人能够体…- 4k
-
IC-Light – 智能打光/换场景AI工具,Github开源,本地部署,一键启动,ControlNet之父张吕敏再降神迹!!!Clipdrop Relight最佳平替,遥遥领先~
IC-Light 是Controlnet的作者张吕敏刚刚放出来的项目。代码上传时间还在几个小时之前,这一消息却已经引爆AI圈,大家纷纷惊呼:神作!! 一、IC-Light 是什么? ControlNet 之父张吕敏推出了名为 IC-Light 的控制图像照明光影融合模型。这一模型能够基于文本条件和背景条件重新照明图像,为图像编辑和增强提供了全新的视角和工具。 IC-Light项目旨在通过先进的机器…- 3.7k
-
Roop Unleashed – 一键单图换脸AI工具,中文整合包,无需训练LoRA,已更新至3.6.5
ROOP-Unleashed是一款基于ROOP的换脸web UI,界面简单易用。 一、Roop Unleashed的主要特征: 独立于平台的浏览器 GUI 一次性选择多个输入/输出面 许多不同的交换模式,首先检测到,面部选择,按性别 图像/视频的批量处理 使用文本提示遮盖面部遮挡物 使用不同增强剂的可选面部修复 预览不同视频帧的交换 使用您的网络摄像头进行实时假摄像头 用于剪切视频等的附加选项卡。…- 3.5k
-
InpaintAnything- 一键智能局部重绘变装/换发型AI工具
一、InpaintAnything是什么? AI换装换发型局部重绘软件,可以用来重绘图片、换装、换发型等。它的独立版不需要依赖其他软件,而整合版则更为方便。 二、InpaintAnything的开源地址: https://github.com/Uminosachi/inpaint-anything 三、InpaintAnything的操作界面: 四、InpaintAnything的主要特点: 🎨 …- 3.4k
-
DiffBIR – 新一代高质量图像修复技术AI工具(支持Google Colab)
在人工智能照片修复方面,我们通常会想到像SD(StyleGAN等)这类的生成式对抗网络。然而,这些模型有时候会在图像修复过程中“发挥过头”,导致生成的图片与原始内容大相径庭。 本次我们要分享的AI照片修复工具,有效解决了上述问题。这个工具不仅能够有效去除图片噪声、模糊等问题,还能复原老照片中褪色或缺失的细节,使其看起来更加鲜活和真实。同时,保证修复后的图片忠实于原图内容。这一突破性的算法模型被称为…- 3.1k
-
Easy-Wav2Lip – 数字人口播视频制作AI工具,高度口型同步,本地整合包,支持图片和视频~
一、Easy-Wav2Lip是什么? Easy-Wav2Lip是Wav2Lip的改进版本,在设计上更为简洁,执行速度更快,同时生成的视频效果更加逼真。Wav2Lip技术可以让视频中的人物根据输入的音频生成匹配的唇形动作,从而实现口型与语音同步的效果。这项技术不仅适用于静态图像,还能够对动态视频进行处理,生成与目标语音同步的视频输出。 二、Easy-Wav2Lip的项目地址: 1、Github仓库:…- 3k
-
OMS-Diffusion – AI换装升级版来了,虚拟试衣间,本地整合包,免训练,免安装
OMS-Diffusion 是OOTDiffusion的分支版本,与原来的 OOTDiffusion 训练两个 Unet 不同,OMS-Diffusion 只训练一个 Unet,这意味着一台 24GB 内存的机器(3090 或 4090)就足够了。 如今已有很多关于虚拟试穿的项目,如谷歌的Tryon Diffusion, 阿里的Outfit Anyone, 亚马的Diffuse to Choose…- 3k
-
Wav2Lip – 使用AI听音同步人物面部口型,AI虚拟主播数字人工具整合包
Wav2Lip适用于任何人脸、任何语言,对任意视频都能达到很高都准确率,可以无缝地与原始视频融合,还可以用于转换动画人脸。 一、Wav2Lip是什么? Wav2Lip实现的是视频人物根据输入音频生成与语音同步的人物唇形,使得生成的视频人物口型与输入语音同步。Wav2Lip不仅可以基于静态图像来输出与目标语音匹配的唇形同步视频,还可以直接将动态的视频进行唇形转换,输出与目标语音匹配的视频。Wav2L…- 3k
-
VALL-E – 微软最强AI声音克隆工具,免训练,免安装,本地整合包,三秒偷走你的声音~
该模型支持多种语言(英语、中文和日语)和零样本语音克隆,你只需要提供一个人短短几秒钟的录音(3-10秒),就能模仿出那个人的声音。此外,它还具有语音情感控制和口音控制等高级功能。同时相对于其他模型,它更轻量、更快速… 一、VALL-E是什么? Vall-E AI是微软开发的一款基于人工智能的文本到语音转换器。该工具将文本输入转换为音频,并将其与人的情绪和房间的声学效果相匹配。它可以使用三秒的短音频…- 2.9k
-
Luna AI – 国内本土顶尖全自动数字人AI虚拟直播系统
一、Luna AI是什么? Luna AI 是一款结合了最先进技术的虚拟AI主播。它的核心是一系列高效的人工智能模型,包括 ChatterBot、GPT、Claude、langchain、chatglm、text-generation-webui、讯飞星火、智谱AI、谷歌Bard、文心一言、通义星尘、千帆大模型、Gemini、Kimi Chat、QAnything、kobold…- 2.7k
-
DynamiCrafter – 图片转动画视频AI工具,腾讯出品
一、DynamiCrafter是什么? DynamiCrafter是一款由腾讯、北大等人开发的图像动画工具。通过利用预训练的视频扩散先验,可以基于文本提示为开放域的静止图像添加动画效果。该工具支持高分辨率模型,提供更好的动态效果、更高的分辨率和更强的一致性。 二、DynamiCrafter开源地址: 1、Github仓库: https://github.com/Doubiiu/DynamiCraf…- 2.6k
-
CodeFormer – 本地整合包,顶尖人脸补全修复技术,支持黑白照片上色
CodeFormer被誉为“业界顶尖AI去马赛克工具”,它能有效清除学习和研究道路上的障碍。这款工具运用了尖端的神经网络AI技术,能够精确地修复各种破损、模糊、不完整以及黑白的照片和视频,效果令人瞩目! 一、CodeFormer的技术剖析: CodeFormer 的天才在于其变革性方法:将人脸恢复设想为代码预测挑战。该算法利用简化的代理空间中精心学习的离散密码本的力量,极大地减少了与恢复过程相关的…- 2.6k