全部标签

AI视频

最新随机最多浏览最多喜欢最多评论

下载1个资源
WinkStudio – 美图旗下专业视频人像精修AI工具，像修图一样修视频，操作如此简单，支持Windows/MacOS

像修图一样修视频，操作如此简单~ 一、WinkStudio 是什么？专业的视频人像精修工具，让你的视频创作更高效。全面的美颜美妆等视频人像精修功能，可自由定制美容参数，批量处理视频。搭载强大的AI工具箱，提供画质修复、AI动漫、水印消除等常用功能支持。 “Winkstudio”类似“开拍”，但功能更丰富，定制性更高，添加了“瑕疵消除”、“一键抠像”、“AI 美颜调色”等功能，还具有一些滤镜，例如…
视频修复
- 300
Carey5月9日
Captions AI – 迄今为止最智能的视频剪辑AI工具，没有之一！

一、Captions AI 是什么？ Captions AI 是一款集成了人工智能技术的视频剪辑和创作工具，通过AI简化了视频制作的复杂流程，使得用户能够轻松制作出高质量的视频内容。该平台的核心功能包括AI视频脚本撰写、数字人生成、自动剪辑填充词、语音增强、眼神校正、语音校正、唇形同步、自动添加视频效果等。Captions借助AI的强大能力，为用户提供了从视频灵感到后期编辑的一站式解决方案，极大地…
AI字幕
- 343
Carey5月9日
下载1个资源
MuseTalk – 数字虚拟人唇形同步视频生成AI工具，一键整合包，开箱即用，腾讯天琴实验室开源

一、MuseTalk是什么？ MuseTalk 是由腾讯团队开发的先进技术，它是一个实时的音频驱动唇部同步模型。该模型能够根据输入的音频信号，自动调整数字人物的面部图像，使其唇形与音频内容高度同步。这样，观众就能看到数字人物口型与声音完美匹配的效果。MuseTalk 特别适用于256 x 256像素的面部区域，且支持中文、英文和日文等多种语言输入。在NVIDIA Tesla V100显卡上，Mus…
AI数字人
- 1.1k
Po4月17日
Adobe Premiere Pro 将支持 AI 视频编辑功能! 可接入 Sora、Runwa 等模型

Adobe 也宣布将为其旗下的专业视频编辑软件 Premiere Pro 接入一系列生成式 AI 功能，包括添加对象、删除对象、视频内容延长以及根据文本生成视频，为用户提供更便捷精准地视频编辑服务。 Adobe Premiere Pro的AI功能： 1、视频生成Video Generate： AI 技术目前在视频生成领域有广泛应用，出现了很多成熟的工具，比如 Sora、Runway、Pi…
视频剪辑
- 328
Carey4月17日
下载1个资源
MuseV – 数字虚拟人视频生成AI工具，一键整合包，开箱即用，腾讯天琴实验室开源

一、MuseV是什么？ MuseV是一个由腾讯音乐娱乐的天琴实验室开源的虚拟人视频生成框架，专注于生成高质量的虚拟人视频和口型同步。它利用先进的算法，能够制作出具有高度一致性和自然表情的长视频内容。MuseV支持自定义动作和风格，视频时长理论上无限，且生成速度快。这一技术在AI创作领域中表现出色，为虚拟人视频制作提供了新的可能性。二、MuseV的网站地址： 1、Github开源地址： https…
AI数字人
- 3.5k
Po4月5日
下载1个资源
FRESCO – 一键视频风格转换AI工具，告别复杂工作流，北京大学开源，本地整合包，一键运行~

北京大学近日发布了一项全新的视频风格转换工具——FRESCO。这一工具旨在简化视频转视频的处理流程，使之更加便捷、高效。FRESCO支持将视频转换为多种不同的风格，并且独特之处在于，它可以选择性地转换视频中特定的部分。值得一提的是，该项目的代码已经开源，供广大研究人员和爱好者使用和探索。一、FRESCO是什么？ FRESCO在设计时考虑了帧间对应关系，并引入了帧内对应概念，从而构建了一个更加稳定…
风格转绘
- 1.9k
Po4月3日
下载1个资源
DiffSynth Studio – 专业视频“三渲二”风格转绘/换衣，递进式AI绘图工具，最佳DomoAI本地平替，国内B站大神开源~

在数字内容创作的领域，扩散模型已经崭露头角，成为图像合成技术中的一股不可忽视的力量。然而，当这些模型被应用到视频合成时，它们往往面临着一系列挑战，比如内容闪烁等问题。针对这一问题，最新研发的 DiffSynth 方法便应运而生，它将图像合成技术巧妙地延伸至视频领域，取得了令人瞩目的成果。一、DiffSynth Studio是什么？ DiffSynth Studio 不仅仅是一个工具，它融合了多项…
动画生成
- 2.8k
Po4月1日
下载1个资源
Cutie – 高质量视频一键精准抠像分离AI工具，短视频剪辑利器，视频换背景、去人物原来如此简单！

Cutie用于自动识别和追踪视频里的特定物体，比如一个人或一辆车。假设你有一段视频，里面有很多人和物体在移动，Cutie可以自动找出其中一个特定的人并一直追踪他。一、Cutie是什么？ Cutie 是一个视频对象分割框架，是XMem的后续作品，具有更好的一致性、鲁棒性和速度。该存储库包含用于标准视频对象分割的代码和用于交互式视频分割的 GUI 工具。 GUI 工具还包含“永久内存”（来自XMem…
视频抠像
- 1.9k
Po3月29日
下载1个资源
v2vt – 视频自动翻译AI工具，本地整合包，HeyGen最佳平替，B站大神免费开源~

大家最近肯定刷到很多名人说英文的视频，今天分享一个能够将任意语言视频自动翻译成中文的小工具，可以解决语言障碍问题，轻松英文语音转中文。一、v2vt是什么？带有口型同步功能的视频翻译的开源项目，可以完成转录视频语音并翻译、语音克隆、口型同步、压制字幕、支持中英视频互相转换等工作。二、v2vt的开源地址： https://github.com/halfzm/v2vt 三、v2vt的功能亮点： ⚙…
字幕翻译
- 1.7k
Po3月29日
下载1个资源
LaVie – 高质量文生视频AI大模型，本地整合包，免安装，免训练，免费使用。

一、LaVie是什么？ LaVie是一个高质量视频生成项目，使用级联潜在扩散模型。这个项目是由Vchitect开发的官方PyTorch实现。LaVie是一个文本到视频（T2V）生成框架，是视频生成系统Vchitect的主要部分。它还包括一个针对图像到视频（I2V）模型SEINE的微调版本。二、LaVie的网站地址： 1、论文地址： https://arxiv.org/abs/2309.15103…
动画生成
- 1.7k
Po3月20日
下载1个资源
ASR – 视频/语音自动生成字幕工具，本地整合包，AI视频剪辑必备神器~

一、ASR是什么？ ASR全称Automatic Speech Recognition，自动语音识别也称为语音转文本 (STT)，是将给定音频转录为文本的任务。它有很多应用，例如语音用户界面。二、ASR的项目地址： https://huggingface.co/tasks/automatic-speech-recognition 三、ASR的使用场景： 1、虚拟语音助手许多边缘设备都有嵌入式虚…
AI字幕
- 1.6k
Po3月18日
下载1个资源
Easy-Wav2Lip – 数字人口播视频制作AI工具，高度口型同步，本地整合包，支持图片和视频~

一、Easy-Wav2Lip是什么？ Easy-Wav2Lip是Wav2Lip的改进版本，在设计上更为简洁，执行速度更快，同时生成的视频效果更加逼真。Wav2Lip技术可以让视频中的人物根据输入的音频生成匹配的唇形动作，从而实现口型与语音同步的效果。这项技术不仅适用于静态图像，还能够对动态视频进行处理，生成与目标语音同步的视频输出。二、Easy-Wav2Lip的项目地址： 1、Github仓库：…
AI数字人
- 2.2k
Po3月13日
下载1个资源
ProPainter – 专业视频修复去水印AI工具，可以抹除视频中的静态水印、动态物体/人物，效果出色~

ProPainter是一个基于E2FGVI实现的AI视频编辑工具，它可以一键移除视频内的移动物体和水印。这个开源项目提供了一个简单而强大的解决方案，帮助用户轻松编辑和改善视频内容。一、ProPainter是什么？ ProPainter 是一个用于视频修复的先进模型。它结合了增强的传播和 Transformer 机制，能够快速高效地进行视频修复、对象去除、水印去除等任务。ProPainter 通过…
视频修复
- 2.6k
Po3月8日
下载1个资源
Wav2Lip – 使用AI听音同步人物面部口型，AI虚拟主播数字人工具整合包

Wav2Lip适用于任何人脸、任何语言，对任意视频都能达到很高都准确率，可以无缝地与原始视频融合，还可以用于转换动画人脸。一、Wav2Lip是什么？ Wav2Lip实现的是视频人物根据输入音频生成与语音同步的人物唇形，使得生成的视频人物口型与输入语音同步。Wav2Lip不仅可以基于静态图像来输出与目标语音匹配的唇形同步视频，还可以直接将动态的视频进行唇形转换，输出与目标语音匹配的视频。Wav2L…
AI数字人
- 2.4k
Po3月7日
下载1个资源
SadTalker – 图片配合音频秒变声音视频，头部、嘴型超自然，中英双语全能，还会唱歌~

单个肖像图像 🙎‍♂️ + 音频 🎤 = 头部说话视频🎞 一、SadTalker是什么？ SadTalker模型是一个使用图片与音频文件自动合成人物说话动画的开源模型，我们自己给模型一张图片以及一段音频文件，模型会根据音频文件把传递的图片进行人脸的相应动作，比如张嘴，眨眼，移动头部等动作。SadTalker，它从音频中生成 3DMM 的 3D 运动系数（头部姿势、表情），并隐式调制一种新颖的 3D…
AI数字人
- 1.8k
Po3月7日
下载1个资源
VideoReTalking – 虚拟数字人视频AI工具整合包，同步音频嘴型/面部表情，腾讯出品~

你只需要输入任意一个视频和一个音频文件，它能给你生成一个新的视频，在这个视频里，人物的嘴型会与音频同步。VideoReTalking不仅可以让嘴型与声音同步，还可以根据声音改变视频中人物的表情。整个过程不需要用户干预，都是自动完成的。一、什么是VideoReTalking？ VideoReTalking，这是一种新的AI系统，可以根据输入音频编辑现实世界中头部说话视频的面孔，即使具有不同的情绪，…
AI数字人
- 2.4k
Po3月7日
下载1个资源
Video Subtitle Remover – 前沿VSR视频硬字幕去除AI工具，影视剪辑爱好者有福了~

引领科技前沿的Video-subtitle-remover（VSR）工具，专为那些希望清除视频中硬编码字幕的用户设计。借助尖端AI技术，VSR不仅仅是移除字幕那么简单，它还能够：无损分辨率将视频中的硬字幕去除，生成去除字幕后的文件通过超强AI算法模型，对去除字幕文本的区域进行填充（非相邻像素填充与马赛克去除）支持自定义字幕位置，仅去除定义位置中的字幕（传入位置）支持全视频自动去除所有文本（…
AI字幕
- 2.5k
Po3月6日
下载1个资源
Vid2Densepose + MagicAnimate – 一键AI本地整合包，视频生成骨骼动画，一张照片就能生成跳舞视频，抖音小姐姐要失业？

Vid2DensePose 将你的视频转换为 Densepose 序列，并在 MagicAnimate 上使用它，MagicAnimate目前依赖DensePose作为约束，如果想尝试转换自己的视频，需要先生成DensePose序列。我们将Vid2Densepose + MagicAnimate 制作成一键启动包，点击即可使用，一、Vid2Densepose 1、Vid2Densepose是什么…
动画生成
- 1.9k
Po3月4日
Sora – OpenAI即将发布的AI视频模型

一、Sora是什么？ Sora 是 OpenAI 开发的AI视频生成模型，它能够根据用户的文本描述生成长达 60 秒、1080P 高质量视频，其中包含精细复杂的场景、生动的角色表情以及复杂的镜头运动。 Sora能够创造出包含多个角色、特定动作类型以及与主题和背景相符的详细场景。这款模型不仅能理解用户的指令，还能洞察这些元素在现实世界中的表现。 Sora对语言有着深刻的理解，能够精准地捕捉到用户的需…
视频生成
- 663
Carey3月4日
下载1个资源
DiffMorpher – AI实现图像间平滑过渡视频工具，一键制作抖音爆火的小女孩的一生~

一、DiffMorpher是什么？ DiffMorpher是一项人工智能技术，它利用先进的扩散模型，能够在两张图像之间实现平滑且自然的形变，生成过渡视频。这一技术在图像生成领域展现了突破性的进展，大幅提升了生成视频的质量，使其超越了以往的生成模型。扩散模型在图像生成质量方面已经取得了令人瞩目的成就，但与生成对抗网络（GAN）相比，扩散模型在进行两个图像样本之间的平滑插值方面存在一些挑战。这是因为…
动画生成
- 1.6k
Po2月27日
下载1个资源
Whisper-WebUI – 音视频字幕AI生成翻译工具，免部署，免安装，一键使用

Whisper-WebUI是一个基于Whisper模型的Gradio 的浏览器界面，可以轻松地将其用作字幕生成器！一、Whisper-WebUI的开源地址： https://github.com/jhj0517/Whisper-WebUI 二、Whisper-WebUI的功能特点：从多种来源生成字幕，包括：从音视频文件自动识别字幕从Youtube链接自动识别字幕从麦克风输入实时识别字幕 …
AI字幕
- 1.9k
Po2月27日
下载1个资源
Luna AI – 国内本土顶尖全自动数字人AI虚拟直播系统

一、Luna AI是什么？ Luna AI 是一款结合了最先进技术的虚拟AI主播。它的核心是一系列高效的人工智能模型，包括 ChatterBot、GPT、Claude、langchain、chatglm、text-generation-webui、讯飞星火、智谱AI、谷歌Bard、文心一言、通义星尘、千帆大模型、Gemini、Kimi Chat、QAnything、kobold…
AI直播
- 2.1k
Po2月26日
下载1个资源
DynamiCrafter – 图片转动画视频AI工具，腾讯出品

一、DynamiCrafter是什么？ DynamiCrafter是一款由腾讯、北大等人开发的图像动画工具。通过利用预训练的视频扩散先验，可以基于文本提示为开放域的静止图像添加动画效果。该工具支持高分辨率模型，提供更好的动态效果、更高的分辨率和更强的一致性。二、DynamiCrafter开源地址： 1、Github仓库： https://github.com/Doubiiu/DynamiCraf…
动画生成
- 2.1k
Po2月23日