-
WinkStudio – 美图旗下专业视频人像精修AI工具,像修图一样修视频,操作如此简单,支持Windows/MacOS
像修图一样修视频,操作如此简单~ 一、WinkStudio 是什么? 专业的视频人像精修工具,让你的视频创作更高效。全面的美颜美妆等视频人像精修功能,可自由定制美容参数,批量处理视频。搭载强大的AI工具箱,提供画质修复、AI动漫、水印消除等常用功能支持。 “Winkstudio”类似“开拍”,但功能更丰富,定制性更高,添加了“瑕疵消除”、“一键抠像”、“AI 美颜调色”等功能,还具有一些滤镜,例如…- 1.2k
-
Captions AI – 迄今为止最智能的视频剪辑AI工具,没有之一!
一、Captions AI 是什么? Captions AI 是一款集成了人工智能技术的视频剪辑和创作工具,通过AI简化了视频制作的复杂流程,使得用户能够轻松制作出高质量的视频内容。该平台的核心功能包括AI视频脚本撰写、数字人生成、自动剪辑填充词、语音增强、眼神校正、语音校正、唇形同步、自动添加视频效果等。Captions借助AI的强大能力,为用户提供了从视频灵感到后期编辑的一站式解决方案,极大地…- 2.1k
-
👕👔👚IDM-VTON – 超真实的一键虚拟换装AI工具,支持户外模特,虚拟试衣间,在线免费使用
一、IDM-VTON 是什么? IDM-VTON(Improved Diffusion Models for Virtual Try-ON)是由韩国科学技术院和OMNIOUS.AI的研究人员提出的一种先进的AI虚拟试穿技术,通过改进扩散模型来生成逼真的人物穿戴图像,实现更真实的虚拟试穿效果。该技术包含两个关键组件:一是视觉编码器,用于提取服装图像的高级语义信息;二是GarmentNet,一个并行U…- 1.4k
-
Fish Speech – 低显存高效语音克隆生成AI工具,免训练,免安装,本地整合包,复制声音如此轻松~
高效的低显存语音克隆工具,媲美GPT-SoVITS! 一、Fish Speech是什么? Fish Speech 是一个全新的文本转语音(TTS)解决方案。作为一个前沿的技术,它提供了高度的自定义和灵活性,允许用户按照他们的个性化需求和期望进行设置。适应多元化环境,可无缝兼容 Linux 和 Windows 操作系统,一站式满足不同用户群体的需求。为了运行此程序,您需要至少 4GB 的 GPU 内…- 1.7k
-
Vector Magic – 超级好用的位图转矢量AI工具,中文破解版,轻松驾驭Mac与Win双平台~
@你丫才美工 :推荐一个超好用的软件,位图秒转矢量图!真的是秒转哦!软件的名字叫:Vector Magic,转矢量最强软件!试用之后真的超级厉害的!转出来的文件,锚点少,曲线平滑 还原度高,简直设计师必备!以后素材不够大都靠它啦!已打包,赶紧来拿! 在数字化时代,图像已经成为我们生活和工作中不可或缺的一部分。无论是设计师、艺术家,还是普通用户,都对图像质量有着极高的要求。而矢量图像,以其清晰度高、…- 2.4k
-
Jasper – 新媒体内容创作者必备AI写作工具,AI助力高效内容创作
您可能听说过 ChatGPT 或其他自然语言处理 (NLP) 工具,但 Jasper 在简化工作流程方面优于它们。 它被设计为内容创建和管理的一站式商店:您可以使用它来创建博客文章、网页、电子邮件、社交媒体帖子、 YouTube 脚本、Facebook 广告等等。 一、Jasper 是什么? Jasper(原Jarvis)是国外最受欢迎的AI写作软件工具之一,因其丰富的的模板和强大的智能…- 636
-
Vectorizer AI – 位图转矢量在线AI神器,让你的图片像素无限放大的秘密武器,可无限放大。支持最大 2 万像素、30MB 图片大小
一、Vectorizer AI 是什么? Vectorizer AI 是一个位图转矢量图在线工具,能够帮助我们快速将JEPG和PNG格式的位图转换为SVG格式的矢量图。打开https://vectorizer.ai/,点击「PICK IMAGE TO VECTORIZE」按钮上传需要转换的位图,也可以直接将图片粘贴至上传区域,上传完成后后自动进行矢量图转换,在预览区左边为位图原图,右边为转换好的s…- 412
-
Rytr – 逆天的人工智能写作AI工具,帮你轻松丢掉写作发恼
无论您是个人写作者、企业营销人员还是社交媒体运营者,Rytr 都能够为您节省大量时间和精力,让写作变得更加轻松愉快。不再为寻找灵感而烦恼,不再为内容质量而担忧,Rytr 将成为您不可或缺的得力助手。 一、Rytr是什么? Rytr是一个AI写作助手,帮助用户快速、经济高效地创建高质量的内容。它利用最先进的语言AI技术为各种写作需求生成独特、原创的内容。从电子邮件到博客文章到广告文案,Rytr可以自…- 604
-
ELLA – 腾讯开源文生图扩散模型,利用LLM增强语义对齐,本地整合包,免训练,一键运行,效果赶超DALL-E~
一、ELLA是什么? ELLA(Efficient Large Language Model Adapter,高效大型语言模型适配器)由腾讯研究人员开发。该技术旨在提高文本到图像生成模型在处理复杂文本提示时的语义对齐能力。通过整合大型语言模型(LLM),ELLA极大增强了模型的文本对齐性能,而这一切无需对U-Net或LLM进行额外的训练。 二、ELLA的网站地址: 1、Github开源地址: ht…- 709
-
Writesonic – 专为内容创作者设计的AI写作助手,具备搜索引擎优化功能,是少数可以生成博客文章的工具,AI写作在线平台新星!
您是否曾经面对过令人畏惧的空白页、迫在眉睫的截止日期和一长串的内容需求? Writesonic 可能正是您一直在寻找的魔杖。在当今快节奏的数字世界中,快速生成引人入胜的高质量内容是必要的。 Writesonic 成为该领域的游戏规则改变者,提供人工智能驱动的写作助手,保证在几秒钟内提供高质量的内容。 一、Writesonic是什么? Writesonic 是一款强大的AI写作助手,专为内容创作者设…- 1k
-
SudoWrite – 全能型小说剧本写作AI工具,用AI让写作变得如此简单,几天完成一部小说不是梦~
无论您是作家、小说作家还是博主,Sudowrite 都可以提供人工智能的实际用途来增强您的写作过程。让我们看看谁从使用它中受益最大! 一、SudoWrite是什么? Sudowrite是一款基于GPT-3和GPT-4的人工智能写作工具,可以帮助用户生成故事内容,或者将现有的文章改写润色成新的内容。Sudowrite具有多种写作风格和创作方式,可以为用户提供非判断性的、随时可用的AI写作伙伴,帮助用…- 1.2k
-
零一万物 – 首款开源中英双语大模型,本地部署包,免训练,免安装,李开复最快AI独角兽开源项目~
支持输入30万汉字,看不懂《百年孤独》的人有救了 一、零一万物是什么? 知名投资人、创新工场董事长兼CEO李开复博士带队创办 AI 2.0大模型公司“零一万物”(01.AI),正式发布首款研发的最强开源人工智能(AI)大模型系列,名为“Yi”。 此次 Yi 系列基础模型的首个公开版本包括两款:Yi-6B(数据参数量为60亿)、Yi-34B(340亿),均是双语(英文/中文)、支持开源。其中,Yi-…- 2.7k
-
FRESCO – 一键视频风格转换AI工具,告别复杂工作流,北京大学开源,本地整合包,一键运行~
北京大学近日发布了一项全新的视频风格转换工具——FRESCO。这一工具旨在简化视频转视频的处理流程,使之更加便捷、高效。FRESCO支持将视频转换为多种不同的风格,并且独特之处在于,它可以选择性地转换视频中特定的部分。值得一提的是,该项目的代码已经开源,供广大研究人员和爱好者使用和探索。 一、FRESCO是什么? FRESCO在设计时考虑了帧间对应关系,并引入了帧内对应概念,从而构建了一个更加稳定…- 2.4k
-
APISR – 专注二次元动漫图像分辨率增强,无损放大AI神器,让漫画焕然一新,动漫爱好者的福音~
APISR:动漫制作启发现实世界动漫超分辨率 APISR旨在恢复和增强低质量、低分辨率的动漫图像和视频源,这些图像和视频源与现实世界场景相比存在各种退化。 一、APISR是什么? APISR 是一个新的放大算法,专门用于恢复和增强各种低质量、低分辨率的动漫图像和视频,其模型代码已经开源,并且有免费的在线 Demo 可以体验。试了一下效果的确非常不错,可以有效提升线条细节的清晰度,并且色彩的还原度也…- 2.4k
-
DiffSynth Studio – 专业视频“三渲二”风格转绘/换衣,递进式AI绘图工具,最佳DomoAI本地平替,国内B站大神开源~
在数字内容创作的领域,扩散模型已经崭露头角,成为图像合成技术中的一股不可忽视的力量。然而,当这些模型被应用到视频合成时,它们往往面临着一系列挑战,比如内容闪烁等问题。针对这一问题,最新研发的 DiffSynth 方法便应运而生,它将图像合成技术巧妙地延伸至视频领域,取得了令人瞩目的成果。 一、DiffSynth Studio是什么? DiffSynth Studio 不仅仅是一个工具,它融合了多项…- 4.9k
-
Cutie – 高质量视频一键精准抠像分离AI工具,短视频剪辑利器,视频换背景、去人物原来如此简单!
Cutie用于自动识别和追踪视频里的特定物体,比如一个人或一辆车。假设你有一段视频,里面有很多人和物体在移动,Cutie可以自动找出其中一个特定的人并一直追踪他。 一、Cutie是什么? Cutie 是一个视频对象分割框架,是XMem的后续作品,具有更好的一致性、鲁棒性和速度。该存储库包含用于标准视频对象分割的代码和用于交互式视频分割的 GUI 工具。 GUI 工具还包含“永久内存”(来自XMem…- 2.4k
-
v2vt – 视频自动翻译AI工具,本地整合包,HeyGen最佳平替,B站大神免费开源~
大家最近肯定刷到很多名人说英文的视频,今天分享一个能够将任意语言视频自动翻译成中文的小工具,可以解决语言障碍问题,轻松英文语音转中文。 一、v2vt是什么? 带有口型同步功能的视频翻译的开源项目,可以完成转录视频语音并翻译、语音克隆、口型同步、压制字幕、支持中英视频互相转换等工作。 二、v2vt的开源地址: https://github.com/halfzm/v2vt 三、v2vt的功能亮点: ⚙…- 1.9k
-
Soundraw – 专为音乐人打造的在线AI音乐平台,停止搜索您需要的歌曲,自己创造吧~
Soundraw为视频编辑、音乐制作人和自由职业者等提供了一个强大的平台,以创造丰富的AI音乐。 一、Soundraw是什么? Soundraw是一款由Tago公司于2020年2月推出的在线AI音乐生成器。 Soundraw 是一个非常容易上手的 AI 音乐生成工具,即使你完全是音乐小白,也能用它创作出高质量的视频。登录后只需要设置音乐时长、速度,再选择流派、情绪和主题,5 步内就能轻松生成音乐…- 2.4k
-
Logo Diffusion – 全球顶尖LOGO商标生成AI工具,在线一键生成,LOGO生成式AI天花板产品~
今年一月份,官方迎来V3的版本更新,借助从头开始构建的新徽标设计 AI 模型,这是官方迄今为止最雄心勃勃的版本。 一、Logo Diffusion是什么? Logo Diffusion是一个利用生成式AI技术帮助用户快速生成和创建独特Logo标志的工具。只需要输入简单的文本提示,AI会在几秒钟内创建出原创设计。 此外,Logo Diffusion还提供将生成的标志转换成清晰的行业标准矢量文件的功能…- 1.1k
-
Lobe Chat – 广受欢迎的在线AI对话聊天机器人,一键部署,免费开源
开源、现代化设计的 ChatGPT/LLMs 聊天应用与开发框架支持语音合成、多模态、可扩展的(function call)插件系统一键免费拥有你自己的 ChatGPT/Gemini/Ollama 应用 一、Lobe Chat是什么? Lobe Chat是一个免费开源的高性能AI聊天机器人框架,提供了高颜值的聊天界面程序和丰富灵活的功能,支持语音合成、多模态、可扩展的插件系统,可一键免费部署私人 …- 828
-
LaVie – 高质量文生视频AI大模型,本地整合包,免安装,免训练,免费使用。
一、LaVie是什么? LaVie是一个高质量视频生成项目,使用级联潜在扩散模型。这个项目是由Vchitect开发的官方PyTorch实现。LaVie是一个文本到视频(T2V)生成框架,是视频生成系统Vchitect的主要部分。它还包括一个针对图像到视频(I2V)模型SEINE的微调版本。 二、LaVie的网站地址: 1、论文地址: https://arxiv.org/abs/2309.15103…- 1.9k
-
FaceFusion – 重磅更新,最强AI换脸汉化软化,去遮挡,高清化,卡通脸一键替换,本地整合包,无需部署,无需训练,免费使用!
一个替代Roop的开源软件,通过AI换脸技术实现简单的面部替换操作。Roop项目由于团队成员不当使用而停更,但其中一位作者开源了新项目FaceFusion,在GitHub上已经获得超过5000星的关注。 一、FaceFusion是什么? Facefusion是一款最新的开源AI视频/图片换脸项目。项目官方介绍只有一句话,下一代换脸器和增强器。采用了全新的界面设计,可以像Stable Diffuis…- 4.8k
-
Stable Doodle – 零门槛AI绘画神器,手残党福音,Stability AI 推出素描转图像工具,让你的涂鸦变成艺术品~
Stability AI 推出的 Stable Doodle 是一款颠覆性的素描转图像工具,它能够将简易的手绘素描转化为栩栩如生的动态图像。这款工具不仅适用于专业人士,同样适合业余爱好者,为用户开启无限的图像创作可能性。 一、Stable Doodle是什么? Stable Doodle是由Stability AI推出的一款零门槛AI绘画神器,可以将简单的草图转化为精美的图像。它可以将随手的涂鸦草…- 1.9k
-
OMS-Diffusion – AI换装升级版来了,虚拟试衣间,本地整合包,免训练,免安装
OMS-Diffusion 是OOTDiffusion的分支版本,与原来的 OOTDiffusion 训练两个 Unet 不同,OMS-Diffusion 只训练一个 Unet,这意味着一台 24GB 内存的机器(3090 或 4090)就足够了。 如今已有很多关于虚拟试穿的项目,如谷歌的Tryon Diffusion, 阿里的Outfit Anyone, 亚马的Diffuse to Choose…- 3k