-
D-ID – 全球最专业最全面的数字人视频生成AI工具,真人口播,三分钟打造超炫虚拟数字人,开启逼真数字人新时代~
随着人工智能技术的不断发展,我们逐渐迈入了一个全新的数字时代。在这个时代,人们可以通过创造性的方式与虚拟现实相结合,创造出惊人的数字人物。其中,Creative Reality Studio (D-ID) 是一家提供 AI 拟真人视频产品服务和开发的公司,其独特的技术让用户能够以惊人逼真的方式与数字人物进行互动。本文将介绍D-ID的技术原理和使用技巧,带您领略数字时代的无限可能性。 一、D-ID …- 478
-
LeiaPix – 专业2D图片转3D裸眼动画特效AI工具,让您的图片栩栩如生,打破视觉界限!
随着科技的发展,人工智能在图像处理方面展现了强大的能力。LeiaPix Converter就是一个使用AI技术,可以非常容易地将普通2D图片转换成3D动画的免费在线工具。在本文中,我将为您详细介绍如何使用LeiaPix Converter的各项功能,将静态图片转换成栩栩如生的3D动画。 一、LeiaPix 是什么? LeiaPix是一个基于网络的创新人工智能平台,能够将2D照片转3D效果的实用AI…- 376
-
MuseTalk – 数字虚拟人唇形同步视频生成AI工具,一键整合包,开箱即用,腾讯天琴实验室开源
一、MuseTalk是什么? MuseTalk 是由腾讯团队开发的先进技术,它是一个实时的音频驱动唇部同步模型。该模型能够根据输入的音频信号,自动调整数字人物的面部图像,使其唇形与音频内容高度同步。这样,观众就能看到数字人物口型与声音完美匹配的效果。MuseTalk 特别适用于256 x 256像素的面部区域,且支持中文、英文和日文等多种语言输入。在NVIDIA Tesla V100显卡上,Mus…- 671
-
Adobe Premiere Pro 将支持 AI 视频编辑功能! 可接入 Sora、Runwa 等模型
Adobe 也宣布将为其旗下的专业视频编辑软件 Premiere Pro 接入一系列生成式 AI 功能,包括添加对象、删除对象、视频内容延长以及根据文本生成视频,为用户提供更便捷精准地视频编辑服务。 Adobe Premiere Pro的AI功能: 1、视频生成Video Generate: AI 技术目前在视频生成领域有广泛应用,出现了很多成熟的工具,比如 Sora、Runway、Pi…- 254
-
Pika- 火爆出圈的视频生成AI工具,海外独角兽项目,一度刷屏国内外社交平台
每个人都能成为多模态梦想的导演,就像《盗梦空间》中的建筑师一样。 一、Pika是什么? Pika是热门的人工智能初创公司Pika Labs推出的AI视频生成和编辑工具,该工具可以将任何创意转化为视频,用户只需输入文字或图像,即可快速生成3D动画、动漫、卡通、电影等风格的视频。该AI视频生成工具最早于2023年4月下旬推出测试版,累计已经超过50万名早期用户使用,每周都在生成数百万个视频。不过,目前…- 939
-
SunoMV – 音乐动态封面视频生成AI工具,SunoAI最佳伴侣
这段时间 AI 神器 Suno 爆火,想必很多小伙伴都体验过它强大的歌曲生成能力了。 一、SunoMV 是什么? SunoMV 则是一个专门针对 Suno 推出的 MV 免费生成平台,用户只需提供自己的 Suno 歌曲链接,就能在几分钟内生成一个歌词同步,并且具有精美视觉效果的歌曲短片,非常方便我们在社交平台上展示推广自己的作品。 SunoMV 支持横屏(1920*1080)和竖屏 (1080*2…- 699
-
MuseV – 数字虚拟人视频生成AI工具,一键整合包,开箱即用,腾讯天琴实验室开源
一、MuseV是什么? MuseV是一个由腾讯音乐娱乐的天琴实验室开源的虚拟人视频生成框架,专注于生成高质量的虚拟人视频和口型同步。它利用先进的算法,能够制作出具有高度一致性和自然表情的长视频内容。MuseV支持自定义动作和风格,视频时长理论上无限,且生成速度快。这一技术在AI创作领域中表现出色,为虚拟人视频制作提供了新的可能性。 二、MuseV的网站地址: 1、Github开源地址: https…- 3.2k
-
VIGGLE – 可控的3D人物角色视频生成AI工具,科目三蹦迪多种舞姿根本停不下来,可精准控制人物姿势了~
Sora漫步街头的女人可以跳舞啦!科目三蹦迪多种舞姿停不下来,可精准控制动作。 目前VIGGLE在Discord可免费使用,赶紧去体验吧~ 一、VIGGLE是什么? VIGGLE是一款基于JST-1技术的可控视频生成平台,使用户能够创建和控制3D角色的动作。用户可以根据自己的意愿让任何角色进行移动和动作,而不仅仅是局限于预设的动画或动作。这种技术的应用可能会在游戏开发、动画制作、虚拟现实(VR)和…- 1.4k
-
FRESCO – 一键视频风格转换AI工具,告别复杂工作流,北京大学开源,本地整合包,一键运行~
北京大学近日发布了一项全新的视频风格转换工具——FRESCO。这一工具旨在简化视频转视频的处理流程,使之更加便捷、高效。FRESCO支持将视频转换为多种不同的风格,并且独特之处在于,它可以选择性地转换视频中特定的部分。值得一提的是,该项目的代码已经开源,供广大研究人员和爱好者使用和探索。 一、FRESCO是什么? FRESCO在设计时考虑了帧间对应关系,并引入了帧内对应概念,从而构建了一个更加稳定…- 1.8k
-
DiffSynth Studio – 专业视频“三渲二”风格转绘/换衣,递进式AI绘图工具,最佳DomoAI本地平替,国内B站大神开源~
在数字内容创作的领域,扩散模型已经崭露头角,成为图像合成技术中的一股不可忽视的力量。然而,当这些模型被应用到视频合成时,它们往往面临着一系列挑战,比如内容闪烁等问题。针对这一问题,最新研发的 DiffSynth 方法便应运而生,它将图像合成技术巧妙地延伸至视频领域,取得了令人瞩目的成果。 一、DiffSynth Studio是什么? DiffSynth Studio 不仅仅是一个工具,它融合了多项…- 2.2k
-
Cutie – 高质量视频一键精准抠像分离AI工具,短视频剪辑利器,视频换背景、去人物原来如此简单!
Cutie用于自动识别和追踪视频里的特定物体,比如一个人或一辆车。假设你有一段视频,里面有很多人和物体在移动,Cutie可以自动找出其中一个特定的人并一直追踪他。 一、Cutie是什么? Cutie 是一个视频对象分割框架,是XMem的后续作品,具有更好的一致性、鲁棒性和速度。该存储库包含用于标准视频对象分割的代码和用于交互式视频分割的 GUI 工具。 GUI 工具还包含“永久内存”(来自XMem…- 1.7k
-
v2vt – 视频自动翻译AI工具,本地整合包,HeyGen最佳平替,B站大神免费开源~
大家最近肯定刷到很多名人说英文的视频,今天分享一个能够将任意语言视频自动翻译成中文的小工具,可以解决语言障碍问题,轻松英文语音转中文。 一、v2vt是什么? 带有口型同步功能的视频翻译的开源项目,可以完成转录视频语音并翻译、语音克隆、口型同步、压制字幕、支持中英视频互相转换等工作。 二、v2vt的开源地址: https://github.com/halfzm/v2vt 三、v2vt的功能亮点: ⚙…- 1.6k
-
Heygen – 全球爆火的顶尖虚拟数字人视频AI工具,一键生成
HeyGen 原名 Movio,是一个在线的数字人视频制作平台。 一、Heygen是什么? HeyGen是一个基于AI数字人技术的视频制作工具。它的特点在于将数字人技术融入到一般的视频制作流程中,也就是除了提供丰富的数字人素材,HeyGen 还提供了 100 多种不同的数字人视频模板,包括广告、电商、新闻、教育、科普、以及抖音、YouTube 视频等多个方面,让用户省去剪辑排版的环节,直接用模板就…- 725
-
Stable Video – Stability AI推出的AI视频生成平台,卷爆Sora!一句话生成视频,图片也转成视频
Sora 虽然是造势很大,但是个人猜测想要公开使用大概率是卡在了算力方面,所以迟迟没有动静,网上申请了红客应用的人们也没有收到邀请内测,奥特曼也在靠几个 demo 想拉 7 万亿美元的投资实属有点异想天开了,种种不正常的表现引人遐想。 而就在这个是时候 Stability.ai 最新发布了 stable video 的官网,它是一个 AI 视频生成平台,用户可以通过文本或图像,将自己的想象转化为精…- 730
-
Dreamina – 字节旗下AIGC创作工具,首个中文生成视频的AI工具,用简单的文案,创作精彩的作品
居然才发现!字节跳动旗下国产AI绘画工具Dreamina,这么好用居然还免费!(强烈推荐) 一、Dreamina是什么? Dreamina是由字节跳动抖音旗下的剪映推出的一款AI图片创作和绘画工具,专门设计用于激发艺术创意和提升绘画体验。 我们提供多样化的功能,包括文字绘图、扩图、局部重绘和图片灵感生成,让您的艺术创作更加多元和精准。 在Dreamina,您可以使用自然语言描述您想要的图片,让先进…- 876
-
LaVie – 高质量文生视频AI大模型,本地整合包,免安装,免训练,免费使用。
一、LaVie是什么? LaVie是一个高质量视频生成项目,使用级联潜在扩散模型。这个项目是由Vchitect开发的官方PyTorch实现。LaVie是一个文本到视频(T2V)生成框架,是视频生成系统Vchitect的主要部分。它还包括一个针对图像到视频(I2V)模型SEINE的微调版本。 二、LaVie的网站地址: 1、论文地址: https://arxiv.org/abs/2309.15103…- 1.7k
-
ASR – 视频/语音自动生成字幕工具,本地整合包,AI视频剪辑必备神器~
一、ASR是什么? ASR全称Automatic Speech Recognition,自动语音识别也称为语音转文本 (STT),是将给定音频转录为文本的任务。它有很多应用,例如语音用户界面。 二、ASR的项目地址: https://huggingface.co/tasks/automatic-speech-recognition 三、ASR的使用场景: 1、虚拟语音助手 许多边缘设备都有嵌入式虚…- 1.6k
-
Krea AI – 超级强大的实时图像AI生成工具,颠覆传统工作流,为创意提供无限可能!
Krea AI 是一个 AI 智能设计工具,功能包括文生图、AI pattern、Logo Illustration 以及 AI 模型训练等,它最近因为实时生成(Real-time Generation)功能而备受瞩目。 一、Krea AI是什么? Krea AI是一种全新的创意工具,它利用人工智能生成高质量的视觉效果,同时了解你的风格、概念或产品。你可以上传图像并训练AI引擎,然后在画布上生成图…- 1.2k
-
DomoAI – 一键照片和视频转换风格,支持文生图,图生图,可以对科目三的小姐姐们下手了~
2023年出现 Runway、Pika 等 AI 视频生成工具,今天我们继续了解一款 AI 视频工具 Domo AI。如果说 Runway 的特色是动态笔刷、Pika 的特色是视频局部重绘,那么 DomoAI 最厉害的就是它的视频转绘功能,可以把真人视频转为效果稳定的风格化视频,最近网上很多热门 AI 视频也都是用它生成的。 一、DomoAI是什么? DomoAI是由…- 856
-
Easy-Wav2Lip – 数字人口播视频制作AI工具,高度口型同步,本地整合包,支持图片和视频~
一、Easy-Wav2Lip是什么? Easy-Wav2Lip是Wav2Lip的改进版本,在设计上更为简洁,执行速度更快,同时生成的视频效果更加逼真。Wav2Lip技术可以让视频中的人物根据输入的音频生成匹配的唇形动作,从而实现口型与语音同步的效果。这项技术不仅适用于静态图像,还能够对动态视频进行处理,生成与目标语音同步的视频输出。 二、Easy-Wav2Lip的项目地址: 1、Github仓库:…- 1.9k
-
ProPainter – 专业视频修复去水印AI工具,可以抹除视频中的静态水印、动态物体/人物,效果出色~
ProPainter是一个基于E2FGVI实现的AI视频编辑工具,它可以一键移除视频内的移动物体和水印。这个开源项目提供了一个简单而强大的解决方案,帮助用户轻松编辑和改善视频内容。 一、ProPainter是什么? ProPainter 是一个用于视频修复的先进模型。它结合了增强的传播和 Transformer 机制,能够快速高效地进行视频修复、对象去除、水印去除等任务。ProPainter 通过…- 2.4k
-
Wav2Lip – 使用AI听音同步人物面部口型,AI虚拟主播数字人工具整合包
Wav2Lip适用于任何人脸、任何语言,对任意视频都能达到很高都准确率,可以无缝地与原始视频融合,还可以用于转换动画人脸。 一、Wav2Lip是什么? Wav2Lip实现的是视频人物根据输入音频生成与语音同步的人物唇形,使得生成的视频人物口型与输入语音同步。Wav2Lip不仅可以基于静态图像来输出与目标语音匹配的唇形同步视频,还可以直接将动态的视频进行唇形转换,输出与目标语音匹配的视频。Wav2L…- 2.2k
-
SadTalker – 图片配合音频秒变声音视频,头部、嘴型超自然,中英双语全能,还会唱歌~
单个肖像图像 🙎♂️ + 音频 🎤 = 头部说话视频🎞 一、SadTalker是什么? SadTalker模型是一个使用图片与音频文件自动合成人物说话动画的开源模型,我们自己给模型一张图片以及一段音频文件,模型会根据音频文件把传递的图片进行人脸的相应动作,比如张嘴,眨眼,移动头部等动作。SadTalker,它从音频中生成 3DMM 的 3D 运动系数(头部姿势、表情),并隐式调制一种新颖的 3D…- 1.8k
-
VideoReTalking – 虚拟数字人视频AI工具整合包,同步音频嘴型/面部表情,腾讯出品~
你只需要输入任意一个视频和一个音频文件,它能给你生成一个新的视频,在这个视频里,人物的嘴型会与音频同步。VideoReTalking不仅可以让嘴型与声音同步,还可以根据声音改变视频中人物的表情。整个过程不需要用户干预,都是自动完成的。 一、什么是VideoReTalking? VideoReTalking,这是一种新的AI系统,可以根据输入音频编辑现实世界中头部说话视频的面孔,即使具有不同的情绪,…- 2.1k