-
IC-Light – 智能打光/换场景AI工具,Github开源,本地部署,一键启动,ControlNet之父张吕敏再降神迹!!!Clipdrop Relight最佳平替,遥遥领先~
IC-Light 是Controlnet的作者张吕敏刚刚放出来的项目。代码上传时间还在几个小时之前,这一消息却已经引爆AI圈,大家纷纷惊呼:神作!! 一、IC-Light 是什么? ControlNet 之父张吕敏推出了名为 IC-Light 的控制图像照明光影融合模型。这一模型能够基于文本条件和背景条件重新照明图像,为图像编辑和增强提供了全新的视角和工具。 IC-Light项目旨在通过先进的机器…- 409
-
MoneyPrinterTurbo – 短视频快速生成AI工具,俗称“AI印钞机”?本地部署,无需训练,输入文字即可生成~
只需提供一个视频 主题 或 关键词 ,就可以全自动生成视频文案、视频素材、视频字幕、视频背景音乐,然后合成一个高清的短视频。 一、MoneyPrinterTurbo 是什么? MoneyPrinterTurbo 是一个强大的AI视频生成工具,它能根据给定的视频主题或关键词自动生成包含文案、素材、字幕和背景音乐的高清短视频。这个工具特别适合需要快速生成视频内容的创作者、营销人员或是任何对视频制作感兴…- 437
-
WinkStudio – 美图旗下专业视频人像精修AI工具,像修图一样修视频,操作如此简单,支持Windows/MacOS
像修图一样修视频,操作如此简单~ 一、WinkStudio 是什么? 专业的视频人像精修工具,让你的视频创作更高效。全面的美颜美妆等视频人像精修功能,可自由定制美容参数,批量处理视频。搭载强大的AI工具箱,提供画质修复、AI动漫、水印消除等常用功能支持。 “Winkstudio”类似“开拍”,但功能更丰富,定制性更高,添加了“瑕疵消除”、“一键抠像”、“AI 美颜调色”等功能,还具有一些滤镜,例如…- 308
-
Captions AI – 迄今为止最智能的视频剪辑AI工具,没有之一!
一、Captions AI 是什么? Captions AI 是一款集成了人工智能技术的视频剪辑和创作工具,通过AI简化了视频制作的复杂流程,使得用户能够轻松制作出高质量的视频内容。该平台的核心功能包括AI视频脚本撰写、数字人生成、自动剪辑填充词、语音增强、眼神校正、语音校正、唇形同步、自动添加视频效果等。Captions借助AI的强大能力,为用户提供了从视频灵感到后期编辑的一站式解决方案,极大地…- 373
-
👕👔👚IDM-VTON – 超真实的一键虚拟换装AI工具,支持户外模特,虚拟试衣间,在线免费使用
一、IDM-VTON 是什么? IDM-VTON(Improved Diffusion Models for Virtual Try-ON)是由韩国科学技术院和OMNIOUS.AI的研究人员提出的一种先进的AI虚拟试穿技术,通过改进扩散模型来生成逼真的人物穿戴图像,实现更真实的虚拟试穿效果。该技术包含两个关键组件:一是视觉编码器,用于提取服装图像的高级语义信息;二是GarmentNet,一个并行U…- 305
-
MotionShop – 一键替换视频人物AI工具,阿里开源,把视频人物秒变3D角色,平替Wonder Studio
这款AI工具替换成的3D人物能复制原视频中人物的动作,就像镜子一样!这可太强大了,想想都觉得好神奇呀!能想象到,未来某些综艺节目明星塌房的问题,直接换个可爱的吉祥物可能比打马赛克更有看头了对吧。 一、MotionShop 是什么? Motionshop是阿里巴巴智能计算研究院(XR实验室和TIDE三维渲染团队)推出的一个AI角色动画框架,可将视频中的人物角色替换为3D化身,同时不改变视频中的其他场…- 425
-
SuperTone Shift – 前沿实时人声变声AI工具,低延迟,无需GPU,目前免费公测,赶紧白嫖~
最近被韩国Hybe公司收购的SuperTone,推出了一款实时人声变声器:Shift,这是一款采用人工智能技术的实时声音处理工具,软件现处于公测阶段,即将于六月份结束公测。 一、SuperTone Shift 是什么? Supertone Shift是由韩国Supertone公司推出的实时语音变换桌面客户端软件,它允许用户选择并立即使用多种高品质声音。Supertone Shift具备个性化定制、…- 1.1k
-
MagicTime – 高质量延时视频生成AI工具,本地整合包,一键制作生长动画,北大开源
马斯克克星,又一开源Sora模型火了,已开源! 一、MagicTime 是什么? 由北京大学团队研发的MagicTime是一个创新性的框架,旨在生成具有可变时间特性的延时视频(又称为Metamorphic Videos)。这意味着用户能够仅通过输入文本提示,就能创造出展示物体随时间变化过程的延时摄影视频。比如花朵开放,冰块融化等,能够学习并应用现实世界的物理规律。 这个项目通过分析大量的时间延迟视…- 613
-
Fish Speech – 低显存高效语音克隆生成AI工具,免训练,免安装,本地整合包,复制声音如此轻松~
高效的低显存语音克隆工具,媲美GPT-SoVITS! 一、Fish Speech是什么? Fish Speech 是一个全新的文本转语音(TTS)解决方案。作为一个前沿的技术,它提供了高度的自定义和灵活性,允许用户按照他们的个性化需求和期望进行设置。适应多元化环境,可无缝兼容 Linux 和 Windows 操作系统,一站式满足不同用户群体的需求。为了运行此程序,您需要至少 4GB 的 GPU 内…- 657
-
StoryDiffusion – 专业漫画绘本生成AI工具,保持风格角色一致性,连贯性视觉故事,本地整合包,输入文字一键生成~
这个Story Diffusion很强大,输入你的照片,然后再写一些 prompt ,就可以生成和你模样一致的漫画故事书,而且还可以生成视频,太强大了! 一、StoryDiffusion是什么? StoryDiffusion 是由南开大学HVision团队开发的创新人工智能工具。它的核心功能是生成连贯的图像和视频故事,尤其擅长于漫画创作。该工具采用了先进的一致性自注意力(Consistent Se…- 725
-
Vector Magic – 超级好用的位图转矢量AI工具,中文破解版,轻松驾驭Mac与Win双平台~
@你丫才美工 :推荐一个超好用的软件,位图秒转矢量图!真的是秒转哦!软件的名字叫:Vector Magic,转矢量最强软件!试用之后真的超级厉害的!转出来的文件,锚点少,曲线平滑 还原度高,简直设计师必备!以后素材不够大都靠它啦!已打包,赶紧来拿! 在数字化时代,图像已经成为我们生活和工作中不可或缺的一部分。无论是设计师、艺术家,还是普通用户,都对图像质量有着极高的要求。而矢量图像,以其清晰度高、…- 748
-
MuseTalk – 数字虚拟人唇形同步视频生成AI工具,一键整合包,开箱即用,腾讯天琴实验室开源
一、MuseTalk是什么? MuseTalk 是由腾讯团队开发的先进技术,它是一个实时的音频驱动唇部同步模型。该模型能够根据输入的音频信号,自动调整数字人物的面部图像,使其唇形与音频内容高度同步。这样,观众就能看到数字人物口型与声音完美匹配的效果。MuseTalk 特别适用于256 x 256像素的面部区域,且支持中文、英文和日文等多种语言输入。在NVIDIA Tesla V100显卡上,Mus…- 1.1k
-
ELLA – 腾讯开源文生图扩散模型,利用LLM增强语义对齐,本地整合包,免训练,一键运行,效果赶超DALL-E~
一、ELLA是什么? ELLA(Efficient Large Language Model Adapter,高效大型语言模型适配器)由腾讯研究人员开发。该技术旨在提高文本到图像生成模型在处理复杂文本提示时的语义对齐能力。通过整合大型语言模型(LLM),ELLA极大增强了模型的文本对齐性能,而这一切无需对U-Net或LLM进行额外的训练。 二、ELLA的网站地址: 1、Github开源地址: ht…- 397
-
Adobe Premiere Pro 将支持 AI 视频编辑功能! 可接入 Sora、Runwa 等模型
Adobe 也宣布将为其旗下的专业视频编辑软件 Premiere Pro 接入一系列生成式 AI 功能,包括添加对象、删除对象、视频内容延长以及根据文本生成视频,为用户提供更便捷精准地视频编辑服务。 Adobe Premiere Pro的AI功能: 1、视频生成Video Generate: AI 技术目前在视频生成领域有广泛应用,出现了很多成熟的工具,比如 Sora、Runway、Pi…- 328
-
Gigapixel 7 – 世界顶尖图像无损放大AI工具,支持Win/MacOS,完美激活,中文汉化,推荐指数五颗星⭐️⭐️⭐️⭐️⭐️
Topaz Gigapixel AI 7 这是一个更新大规模的版本,软件介面与 Topaz Photo AI 一样了,模型也与 Topaz Photo AI 一样相同类,包括一些全新的增强功能,以及对应用程序的几乎每个部分的许多改进! 全新界面。 600% 升级。 世界一流的人工智能模型。 一、Gigapixel 7 是什么? Gigapixel AI 可以帮助您很好地完成一件事:以自然的方式提高…- 1.8k
-
DeNoise AI – 完美图像智能降噪锐化AI工具,支持Win/MacOS,中文汉化,一键解决图片噪点问题,重拾图片纯净之美~
在数字摄影时代,我们常常会遇到图片噪点过多的问题,这不仅影响了图片的清晰度,还使得照片的艺术性和观赏性大打折扣。然而,借助Topaz DeNoise AI这一革命性的图片降噪软件,您将能够轻松解决这一问题,重拾图片纯净之美。 一、DeNoise AI 是什么? DeNoise AI 是 Topaz Labs 旗下一款基于人工智能技术的图片降噪软件。相较于传统降噪工具,DeNoise AI…- 1.8k
-
AnyText – 精准控制中文汉字的AI绘图工具,动动嘴皮子,就能出电商大促海报,一键整合包,开箱即用,阿里开源
随着人工智能技术的不断发展,视觉文字生成与编辑成为了一个备受关注的领域。AnyText作为一款多语言视觉文字生成与编辑工具,具有强大的功能和广泛的应用场景。 一、AnyText是什么? AnyText是阿里巴巴智能计算研究院的团队推出的一个基于扩散的多语言视觉文本生成和编辑模型,专注于在图像中渲染准确和连贯的文本。AnyText包括两个主要元素的扩散管线:辅助潜在模块和文本嵌入模块。前者使用文本字…- 2.1k
-
MuseV – 数字虚拟人视频生成AI工具,一键整合包,开箱即用,腾讯天琴实验室开源
一、MuseV是什么? MuseV是一个由腾讯音乐娱乐的天琴实验室开源的虚拟人视频生成框架,专注于生成高质量的虚拟人视频和口型同步。它利用先进的算法,能够制作出具有高度一致性和自然表情的长视频内容。MuseV支持自定义动作和风格,视频时长理论上无限,且生成速度快。这一技术在AI创作领域中表现出色,为虚拟人视频制作提供了新的可能性。 二、MuseV的网站地址: 1、Github开源地址: https…- 3.5k
-
天机(来事儿AI)- 专业中国式传统人情世故语言训练AI大模型,化解一切尴尬场合和矛盾冲突,本地整合包,一键开启使用,你也是社牛达人!
江湖不是打打杀杀,江湖是人情世故~ 一、天机(来事儿AI)是什么? 天机是 SocialAI(来事儿AI)制作的一款免费使用、非商业用途的人工智能系统。您可以利用它进行涉及传统人情世故的任务,如如何敬酒、如何说好话、如何会来事儿等,以提升您的情商和核心竞争能力。我们坚信,只有人情世故才是未来AI的核心技术,只有会来事儿的AI才有机会走向AGI,让我们携手见证通用人工智能的来临。 —— "…- 1.8k
-
零一万物 – 首款开源中英双语大模型,本地部署包,免训练,免安装,李开复最快AI独角兽开源项目~
支持输入30万汉字,看不懂《百年孤独》的人有救了 一、零一万物是什么? 知名投资人、创新工场董事长兼CEO李开复博士带队创办 AI 2.0大模型公司“零一万物”(01.AI),正式发布首款研发的最强开源人工智能(AI)大模型系列,名为“Yi”。 此次 Yi 系列基础模型的首个公开版本包括两款:Yi-6B(数据参数量为60亿)、Yi-34B(340亿),均是双语(英文/中文)、支持开源。其中,Yi-…- 2.1k
-
FRESCO – 一键视频风格转换AI工具,告别复杂工作流,北京大学开源,本地整合包,一键运行~
北京大学近日发布了一项全新的视频风格转换工具——FRESCO。这一工具旨在简化视频转视频的处理流程,使之更加便捷、高效。FRESCO支持将视频转换为多种不同的风格,并且独特之处在于,它可以选择性地转换视频中特定的部分。值得一提的是,该项目的代码已经开源,供广大研究人员和爱好者使用和探索。 一、FRESCO是什么? FRESCO在设计时考虑了帧间对应关系,并引入了帧内对应概念,从而构建了一个更加稳定…- 1.9k
-
APISR – 专注二次元动漫图像分辨率增强,无损放大AI神器,让漫画焕然一新,动漫爱好者的福音~
APISR:动漫制作启发现实世界动漫超分辨率 APISR旨在恢复和增强低质量、低分辨率的动漫图像和视频源,这些图像和视频源与现实世界场景相比存在各种退化。 一、APISR是什么? APISR 是一个新的放大算法,专门用于恢复和增强各种低质量、低分辨率的动漫图像和视频,其模型代码已经开源,并且有免费的在线 Demo 可以体验。试了一下效果的确非常不错,可以有效提升线条细节的清晰度,并且色彩的还原度也…- 2k
-
DiffSynth Studio – 专业视频“三渲二”风格转绘/换衣,递进式AI绘图工具,最佳DomoAI本地平替,国内B站大神开源~
在数字内容创作的领域,扩散模型已经崭露头角,成为图像合成技术中的一股不可忽视的力量。然而,当这些模型被应用到视频合成时,它们往往面临着一系列挑战,比如内容闪烁等问题。针对这一问题,最新研发的 DiffSynth 方法便应运而生,它将图像合成技术巧妙地延伸至视频领域,取得了令人瞩目的成果。 一、DiffSynth Studio是什么? DiffSynth Studio 不仅仅是一个工具,它融合了多项…- 2.8k
-
Vocal Separate – 极简音乐人声分离AI工具,本地部署,无需网络,支持CPU
将一首歌曲或者含有背景音乐的音视频文件,拖拽到本地网页中,即可将其中的人声和音乐声分离为单独的音频wav文件,可选单独分离“钢琴声”、“贝斯声”、“鼓声”等 一、Vocal Separate是什么? 这是一个极简的人声和背景音乐分离工具,本地化网页操作,无需连接外网,使用 2stems/4stems/5stems 模型。 二、Vocal Separate的开源地址: https://github.…- 1.8k