山鲸AI
无数可心AI Tool,
助你总有新发现。
🔥热门工具
-
ChatGPT Academic – 中科院学术专业版ChatGPT,一键搞定所有论文!助力科研创新,开启智能学术之旅~
自ChatGPT Academic在Github推出已有一段时间,已收获无数网友点赞。那什么是ChatGPT Academic,如何在自己电脑上部署呢?今天,就让小编带着大家一探究竟! 一、ChatGPT Academic是什么? ChatGPT Academic也被称为「中科院学术专业版 ChatGPT」,是中科院计算机科学与技术研究所研发的一款人工智能学术助手,旨在为科研人员提供高效、便捷的学… -
AI Comic Factory – 免费开源,基于LLM的漫画创作AI在线工具
不会画漫画?没问题! 通过 AI Comic Factory 释放您的创造力,艺术无国界,讲故事变得毫不费力。潜入漫画制作领域! 一、AI Comic Factory是什么? AI Comic Factory 是一个强大的数字漫画创作工具,无需绘画技能,通过AI助手和自然语言描述,轻松生成原创漫画。选择多种风格,灵活布局,添加引人入胜的文字说明,通过反复修改优化漫画。适用于有限绘画技能的用户,提供… -
Suno AI – 重量级颠覆传统认知的AI音乐制作平台,一键制作你的专属音乐,轻松实现文本转歌曲,媲美真实歌手!
一、Suno AI是什么? Suno AI是一款强大的人工智能音乐生成器,由 Anthropic 公司开发完成。 可以将文本转化为高度逼真的音乐和语音。该系统包括多种音乐风格,如电影、RAP、翻唱等,并提供了多语言和不同性别的播音员选择。用户可以使用命令来生成音频并进行个性化设置。它支持英文、中文等 50 种语言,可以在网站和 Discord 双平台上使用。 新用户有 250 个免费积分,可以生成… -
AnyDoor任意门 – 完美服装替换,一键换装,实现图片上任意元素的挪移变幻,效果出色!!!
AnyDoor的命名灵感来源于其功能与神奇的“任意门”相似,能够实现物体的即时移动。 一、AnyDoor是什么? AnyDoor 是一款创新的AI工具,能够将任何对象(如人物、动物或物品)无缝集成到新的图像或视频场景中。这款扩散的图像生成器,借助先进的算法,实现了在用户指定的位置,以自然和谐的方式将目标对象“传送”到新的场景中,自动调整光线和角度以适应新环境。 由阿里巴巴与香港大学共同研… -
Rope – 强大的一键换脸AI,本地部署,可消除脸部遮挡,飞一般的处理速度~
随着人工智能的发展,现在有着越来越多的ai换脸软件,可以一键将影视片段里的角色换成自己的脸,与喜欢的明星同框,那么免费的Ai换脸软件有哪些呢? 今天给大家推荐一个叫ROPE的换脸软件,ROPE是本地离线安装的换脸软件,无任何功能限制。可以这样说,ROPE目前是PC端最好的换脸软件,没有之一。 如果说目前pc端AI视频换脸软件哪个最好,可以这样说,rope当之无愧可以得到第一名,可以同时替换多个人脸… -
SDXL-Light – 目前最快文生图AI模型,让AI出图速度提升 10 倍!
生成式人工智能技术已成为业界的焦点,它能够根据文本提示创造出图像或视频。目前的先进模型依赖于一个耗时的扩散过程来生成单一图像,可能需要5秒钟,并且要多次调用庞大的神经网络。因此,研究的热点是如何在保证图像质量的同时,加快图像的生成速度。 一、SDXL-Lightning是什么? SDXL-Lightning 模型是从 Stability AI 的 stable-diffusion-xl-base-…
🥕最新收录
-
IC-Light – 智能打光/换场景AI工具,Github开源,本地部署,一键启动,ControlNet之父张吕敏再降神迹!!!Clipdrop Relight最佳平替,遥遥领先~
IC-Light 是Controlnet的作者张吕敏刚刚放出来的项目。代码上传时间还在几个小时之前,这一消息却已经引爆AI圈,大家纷纷惊呼:神作!! 一、IC-Light 是什么? ControlNet 之父张吕敏推出了名为 IC-Light 的控制图像照明光影融合模型。这一模型能够基于文本条件和背景条件重新照明图像,为图像编辑和增强提供了全新的视角和工具。 IC-Light项目旨在通过先进的机器… -
MoneyPrinterTurbo – 短视频快速生成AI工具,俗称“AI印钞机”?本地部署,无需训练,输入文字即可生成~
只需提供一个视频 主题 或 关键词 ,就可以全自动生成视频文案、视频素材、视频字幕、视频背景音乐,然后合成一个高清的短视频。 一、MoneyPrinterTurbo 是什么? MoneyPrinterTurbo 是一个强大的AI视频生成工具,它能根据给定的视频主题或关键词自动生成包含文案、素材、字幕和背景音乐的高清短视频。这个工具特别适合需要快速生成视频内容的创作者、营销人员或是任何对视频制作感兴… -
WinkStudio – 美图旗下专业视频人像精修AI工具,像修图一样修视频,操作如此简单,支持Windows/MacOS
像修图一样修视频,操作如此简单~ 一、WinkStudio 是什么? 专业的视频人像精修工具,让你的视频创作更高效。全面的美颜美妆等视频人像精修功能,可自由定制美容参数,批量处理视频。搭载强大的AI工具箱,提供画质修复、AI动漫、水印消除等常用功能支持。 “Winkstudio”类似“开拍”,但功能更丰富,定制性更高,添加了“瑕疵消除”、“一键抠像”、“AI 美颜调色”等功能,还具有一些滤镜,例如… -
Captions AI – 迄今为止最智能的视频剪辑AI工具,没有之一!
一、Captions AI 是什么? Captions AI 是一款集成了人工智能技术的视频剪辑和创作工具,通过AI简化了视频制作的复杂流程,使得用户能够轻松制作出高质量的视频内容。该平台的核心功能包括AI视频脚本撰写、数字人生成、自动剪辑填充词、语音增强、眼神校正、语音校正、唇形同步、自动添加视频效果等。Captions借助AI的强大能力,为用户提供了从视频灵感到后期编辑的一站式解决方案,极大地… -
火爆全网的Remini粘土 – ComfyUI 工作流分享
不管怎么样,AI黏土风就是火了!!!你别说你都不知道,你也别说你都没刷到,IOS商店下载量一度超越抖音,并且还是非永久免费使用的,AI修图软件Remini在五一假期走红,提供黏土滤镜风格图像生成,广受用户喜爱。除了生成滤镜图像,还催生了如何使用Remini赚钱服务。 AI修图软件Remini的走红和黏土滤镜功能的爆火,可以从以下几个方面来理解: 技术创新:Remini的黏土滤镜功能凭借其独特性和创… -
Midjourney 十组特效灯光提示词,教你如何帮你控制光照效果~
镜头光晕:营造氛围或复古感觉的光线条纹 🪄英文咒语:Photo of,a woman,sunglasses,lens flares,fashion ad,kodak portra 800, --style raw --chaos 8 --ar 3:4 光迹:通过长时间曝光捕捉灯光的运动 🪄英文咒语:Photo of,a bus driving fast under the bridge,light…
-
Stable Doodle – 零门槛AI绘画神器,手残党福音,Stability AI 推出素描转图像工具,让你的涂鸦变成艺术品~
Stability AI 推出的 Stable Doodle 是一款颠覆性的素描转图像工具,它能够将简易的手绘素描转化为栩栩如生的动态图像。这款工具不仅适用于专业人士,同样适合业余爱好者,为用户开启无限的图像创作可能性。 一、Stable Doodle是什么? Stable Doodle是由Stability AI推出的一款零门槛AI绘画神器,可以将简单的草图转化为精美的图像。它可以将随手的涂鸦草… -
ELLA – 腾讯开源文生图扩散模型,利用LLM增强语义对齐,本地整合包,免训练,一键运行,效果赶超DALL-E~
一、ELLA是什么? ELLA(Efficient Large Language Model Adapter,高效大型语言模型适配器)由腾讯研究人员开发。该技术旨在提高文本到图像生成模型在处理复杂文本提示时的语义对齐能力。通过整合大型语言模型(LLM),ELLA极大增强了模型的文本对齐性能,而这一切无需对U-Net或LLM进行额外的训练。 二、ELLA的网站地址: 1、Github开源地址: ht… -
Dreamina – 字节旗下AIGC创作工具,首个中文生成视频的AI工具,用简单的文案,创作精彩的作品
居然才发现!字节跳动旗下国产AI绘画工具Dreamina,这么好用居然还免费!(强烈推荐) 一、Dreamina是什么? Dreamina是由字节跳动抖音旗下的剪映推出的一款AI图片创作和绘画工具,专门设计用于激发艺术创意和提升绘画体验。 我们提供多样化的功能,包括文字绘图、扩图、局部重绘和图片灵感生成,让您的艺术创作更加多元和精准。 在Dreamina,您可以使用自然语言描述您想要的图片,让先进… -
AI Comic Factory – 免费开源,基于LLM的漫画创作AI在线工具
不会画漫画?没问题! 通过 AI Comic Factory 释放您的创造力,艺术无国界,讲故事变得毫不费力。潜入漫画制作领域! 一、AI Comic Factory是什么? AI Comic Factory 是一个强大的数字漫画创作工具,无需绘画技能,通过AI助手和自然语言描述,轻松生成原创漫画。选择多种风格,灵活布局,添加引人入胜的文字说明,通过反复修改优化漫画。适用于有限绘画技能的用户,提供… -
Gigapixel 7 – 世界顶尖图像无损放大AI工具,支持Win/MacOS,完美激活,中文汉化,推荐指数五颗星⭐️⭐️⭐️⭐️⭐️
Topaz Gigapixel AI 7 这是一个更新大规模的版本,软件介面与 Topaz Photo AI 一样了,模型也与 Topaz Photo AI 一样相同类,包括一些全新的增强功能,以及对应用程序的几乎每个部分的许多改进! 全新界面。 600% 升级。 世界一流的人工智能模型。 一、Gigapixel 7 是什么? Gigapixel AI 可以帮助您很好地完成一件事:以自然的方式提高… -
DDColor – 阿里AI老照片上色一键修复工具
一、什么是DDColor? 🎨DDColor 是最新的 SOTA 图像上色算法,能够对输入的黑白图像生成自然生动的彩色结果,使用 UNet 结构的骨干网络和图像解码器分别实现图像特征提取和特征图上采样,并利用 Transformer 结构的颜色解码器完成基于视觉语义的颜色查询,最终聚合输出彩色通道预测结果。 🪄 DDColor 可以为历史黑白老照片提供生动自然的着色。 🎲 它甚至可以对动漫游戏中的… -
Waifu2x Extension GUI – 开源图片视频GIF无损放大AI神器,本地整合包,视频不再模糊~
使用机器学习放大 图片/视频/GIF 以及 视频插帧(补帧),支持 AMD / Nvidia / Intel 显卡。下载最新版本的绿色版安装包, 适用于拥有Intel/AMD/Nvidia显卡的Windows 64位系统个人电脑。 Waifu2x Extension GUI是什么? Waifu2x-Extension-GUI 是一款开源、免费、易用的图片、GIF 和视频放大与降噪工具,基于 Wai… -
ComflowySpace – 开箱即用的ComfyUI客户端,MacOS用户的福音~
有在使用 Mac 电脑又想使用 ComfyUI,但因为安装困难而放弃的朋友吗? 开源AI图像和视频生成工具值得更好的交互设计体验,而不仅仅是WebUI和ComfyUI的原生外观。很多人不愿意学习或参与AI生成浪潮,因为工具门槛太高。这正是我们想要解决的问题。因此,我们认为应该创建一个更加用户友好和有用的AI图像和视频生成工具,ComflowySpace。 ComflowySpace的目标是做出人人…
-
MuseV – 数字虚拟人视频生成AI工具,一键整合包,开箱即用,腾讯天琴实验室开源
一、MuseV是什么? MuseV是一个由腾讯音乐娱乐的天琴实验室开源的虚拟人视频生成框架,专注于生成高质量的虚拟人视频和口型同步。它利用先进的算法,能够制作出具有高度一致性和自然表情的长视频内容。MuseV支持自定义动作和风格,视频时长理论上无限,且生成速度快。这一技术在AI创作领域中表现出色,为虚拟人视频制作提供了新的可能性。 二、MuseV的网站地址: 1、Github开源地址: https… -
DiffSynth Studio – 专业视频“三渲二”风格转绘/换衣,递进式AI绘图工具,最佳DomoAI本地平替,国内B站大神开源~
在数字内容创作的领域,扩散模型已经崭露头角,成为图像合成技术中的一股不可忽视的力量。然而,当这些模型被应用到视频合成时,它们往往面临着一系列挑战,比如内容闪烁等问题。针对这一问题,最新研发的 DiffSynth 方法便应运而生,它将图像合成技术巧妙地延伸至视频领域,取得了令人瞩目的成果。 一、DiffSynth Studio是什么? DiffSynth Studio 不仅仅是一个工具,它融合了多项… -
ProPainter – 专业视频修复去水印AI工具,可以抹除视频中的静态水印、动态物体/人物,效果出色~
ProPainter是一个基于E2FGVI实现的AI视频编辑工具,它可以一键移除视频内的移动物体和水印。这个开源项目提供了一个简单而强大的解决方案,帮助用户轻松编辑和改善视频内容。 一、ProPainter是什么? ProPainter 是一个用于视频修复的先进模型。它结合了增强的传播和 Transformer 机制,能够快速高效地进行视频修复、对象去除、水印去除等任务。ProPainter 通过… -
Video Subtitle Remover – 前沿VSR视频硬字幕去除AI工具,影视剪辑爱好者有福了~
引领科技前沿的Video-subtitle-remover(VSR)工具,专为那些希望清除视频中硬编码字幕的用户设计。借助尖端AI技术,VSR不仅仅是移除字幕那么简单,它还能够: 无损分辨率将视频中的硬字幕去除,生成去除字幕后的文件 通过超强AI算法模型,对去除字幕文本的区域进行填充(非相邻像素填充与马赛克去除) 支持自定义字幕位置,仅去除定义位置中的字幕(传入位置) 支持全视频自动去除所有文本(… -
VideoReTalking – 虚拟数字人视频AI工具整合包,同步音频嘴型/面部表情,腾讯出品~
你只需要输入任意一个视频和一个音频文件,它能给你生成一个新的视频,在这个视频里,人物的嘴型会与音频同步。VideoReTalking不仅可以让嘴型与声音同步,还可以根据声音改变视频中人物的表情。整个过程不需要用户干预,都是自动完成的。 一、什么是VideoReTalking? VideoReTalking,这是一种新的AI系统,可以根据输入音频编辑现实世界中头部说话视频的面孔,即使具有不同的情绪,… -
Wav2Lip – 使用AI听音同步人物面部口型,AI虚拟主播数字人工具整合包
Wav2Lip适用于任何人脸、任何语言,对任意视频都能达到很高都准确率,可以无缝地与原始视频融合,还可以用于转换动画人脸。 一、Wav2Lip是什么? Wav2Lip实现的是视频人物根据输入音频生成与语音同步的人物唇形,使得生成的视频人物口型与输入语音同步。Wav2Lip不仅可以基于静态图像来输出与目标语音匹配的唇形同步视频,还可以直接将动态的视频进行唇形转换,输出与目标语音匹配的视频。Wav2L… -
Easy-Wav2Lip – 数字人口播视频制作AI工具,高度口型同步,本地整合包,支持图片和视频~
一、Easy-Wav2Lip是什么? Easy-Wav2Lip是Wav2Lip的改进版本,在设计上更为简洁,执行速度更快,同时生成的视频效果更加逼真。Wav2Lip技术可以让视频中的人物根据输入的音频生成匹配的唇形动作,从而实现口型与语音同步的效果。这项技术不仅适用于静态图像,还能够对动态视频进行处理,生成与目标语音同步的视频输出。 二、Easy-Wav2Lip的项目地址: 1、Github仓库:… -
Luna AI – 国内本土顶尖全自动数字人AI虚拟直播系统
一、Luna AI是什么? Luna AI 是一款结合了最先进技术的虚拟AI主播。它的核心是一系列高效的人工智能模型,包括 ChatterBot、GPT、Claude、langchain、chatglm、text-generation-webui、讯飞星火、智谱AI、谷歌Bard、文心一言、通义星尘、千帆大模型、Gemini、Kimi Chat、QAnything、kobold…
🎵AI声音工具
-
Suno AI – 重量级颠覆传统认知的AI音乐制作平台,一键制作你的专属音乐,轻松实现文本转歌曲,媲美真实歌手!
一、Suno AI是什么? Suno AI是一款强大的人工智能音乐生成器,由 Anthropic 公司开发完成。 可以将文本转化为高度逼真的音乐和语音。该系统包括多种音乐风格,如电影、RAP、翻唱等,并提供了多语言和不同性别的播音员选择。用户可以使用命令来生成音频并进行个性化设置。它支持英文、中文等 50 种语言,可以在网站和 Discord 双平台上使用。 新用户有 250 个免费积分,可以生成… -
VALL-E – 微软最强AI声音克隆工具,免训练,免安装,本地整合包,三秒偷走你的声音~
该模型支持多种语言(英语、中文和日语)和零样本语音克隆,你只需要提供一个人短短几秒钟的录音(3-10秒),就能模仿出那个人的声音。此外,它还具有语音情感控制和口音控制等高级功能。同时相对于其他模型,它更轻量、更快速… 一、VALL-E是什么? Vall-E AI是微软开发的一款基于人工智能的文本到语音转换器。该工具将文本输入转换为音频,并将其与人的情绪和房间的声学效果相匹配。它可以使用三秒的短音频… -
Bark – 高度逼真的开源文本转语音AI工具,最强TTS本地整合包
Bark是一个开源的文本转语音的AI模型。Bark 可以生成高度逼真的多语言语音以及其他音频 - 包括音乐、背景噪音和简单的音效。该模型可以模拟正常说话口气的语音,如笑、叹息和哭泣。支持多语言,包括中文。 一、Bark的项目地址: 1、论文地址: https://arxiv.org/abs/2209.03143 2、Github仓库: https://github.com/suno-ai/bark… -
EmotiVoice易魔声 – 爆火国产文本转语音AI工具,支持中英文,具有情绪控制功能~
网易有道AI算法团队也开源了一款国产TTS语音合成引擎EmotiVoice,刚上线仅一周时间就暴涨4200颗星,问鼎当周GitHub trending流行榜第一。而如今已冲到了 4.5k Star。 一、EmotiVoice是什么? EmotiVoice是一款功能强大且现代的开源文本转语音引擎,您可以免费使用。EmotiVoice 提供中英文两种语言,超过 2000 种不同的语音。最突出的功能是情… -
GPT SoVITS WebUI – 快速声音AI克隆工具,完美复刻任何角色的语音、语调、语气!
语音技术在人工智能的驱动下,正在以前所未有的速度推进。GPT-SoVITS-WebUI正是这一变革的先驱它利用少量的声音源,可以快速地训练出一个语音合成(Text-to-Speech,简称TTS)模型。 这个强大的Web界面工具不仅提供了零次学习和少量次学习的文本到语音(TTS)功能,还支持跨语言的语音转换,为语音技术的爱好者和开发者打开了一扇新的大门。 一、GPT SoVITS WebUI的功能… -
Bert-VITS 2 – 爆杀原版?原神&星穹铁道全角色文本转语音AI工具,栩栩如生,声色克隆,原神启动!
为游戏爱好者们带来一款新的体验工具,原神&星穹铁道全角色文本转语音AI工具。该工具基于先进的BERT-VITS模型,这是一种结合了Transformer架构的语音合成技术。BERT-VITS模型通过深度学习,能捕捉到不同音色的独特属性,并能够实现高度个性化的语音合成效果。这款整合包特别支持多角色对话模式,让用户能够体验到更加丰富和真实的交互对话。 一、Bert-VITS 2是什么? BER… -
AudioCraft – 顶级音乐生成AI工具,来自Meta AI免费开源,音乐效果媲美音乐家作品~
一、AudioCraft是什么? AudioCraft是Meta AI免费开源的一款深度学习进行音频处理和生成的库。可满足您所有的生成音频需求:音乐、音效以及原始音频信号训练后的压缩。 它具有最先进的EnCodec音频压缩器/标记器,沿着MusicGen,一个简单可控的音乐生成LM,具有文本和旋律调节。 素材训练使用2万小时的授权音乐来训练MusicGen。 二、AudioCraft的项目地址: … -
NeuCo AI – 全新声音克隆AI工具,无需训练,一键翻唱任意歌手任意歌曲~
🥳💕🎶 NeuCo AI歌手,无需训练、一键翻唱,🌟 只需10秒音频,一键翻唱任意歌手的任意歌曲!相较于传统的ASVC,NeuCoSVC只需要上传一个角色的声音,然后就能模拟这个角色的声音唱歌 NeuCo AI的特色亮点: 🎤 NeuCoSVC是一个虚拟项目,可用于模拟角色的声音唱歌 🎧 建议上传你喜欢的参考音频,然后选择时间长度以及声音去除等操作 🎶 可选择上传B站视频或本地音频,并在上传后选择…
-
DynamiCrafter – 图片转动画视频AI工具,腾讯出品
一、DynamiCrafter是什么? DynamiCrafter是一款由腾讯、北大等人开发的图像动画工具。通过利用预训练的视频扩散先验,可以基于文本提示为开放域的静止图像添加动画效果。该工具支持高分辨率模型,提供更好的动态效果、更高的分辨率和更强的一致性。 二、DynamiCrafter开源地址: 1、Github仓库: https://github.com/Doubiiu/DynamiCraf… -
SOME – 高质量音乐MIDI提取AI工具
一、SOME是什么? SOME(Singing-Oriented MIDI Extractor)是一个旨在将人声音频文件自动转换为MIDI序列的项目。这个工具对于音乐制作人和爱好者来说是一个创新的解决方案,因为它可以自动化音乐制作过程中的一个关键步骤,即将人声转换为可以编辑和进一步处理的数字格式。 在i5 12400 CPU上,它可以以9倍于实时的速度运行,而在3080Ti GPU上,速度更是达到… -
Krea AI – 超级强大的实时图像AI生成工具,颠覆传统工作流,为创意提供无限可能!
Krea AI 是一个 AI 智能设计工具,功能包括文生图、AI pattern、Logo Illustration 以及 AI 模型训练等,它最近因为实时生成(Real-time Generation)功能而备受瞩目。 一、Krea AI是什么? Krea AI是一种全新的创意工具,它利用人工智能生成高质量的视觉效果,同时了解你的风格、概念或产品。你可以上传图像并训练AI引擎,然后在画布上生成图… -
Tripo – VAST旗下3D模型一键生成AI工具,3D生成迈入「秒级」时代,3D AI生成领域断层式领先产品
在AI领域的持续创新中,3D建模一直是等待着自己的"ChatGPT"时刻。 一、Tripo 是什么? Tripo AI是创企VAST发布的在线3D建模平台,能够利用文本或图像在几秒钟内生成高质量且可立即使用的3D模型。这个平台为用户提供了一个快速、简便的方式来创建3D模型,无需复杂的建模技能或软件。目前支持文生3D和图生3D两种能力,后续将推出纹理贴图功能。 驱动该产品的通用3… -
Luna AI – 国内本土顶尖全自动数字人AI虚拟直播系统
一、Luna AI是什么? Luna AI 是一款结合了最先进技术的虚拟AI主播。它的核心是一系列高效的人工智能模型,包括 ChatterBot、GPT、Claude、langchain、chatglm、text-generation-webui、讯飞星火、智谱AI、谷歌Bard、文心一言、通义星尘、千帆大模型、Gemini、Kimi Chat、QAnything、kobold… -
Suno AI – 重量级颠覆传统认知的AI音乐制作平台,一键制作你的专属音乐,轻松实现文本转歌曲,媲美真实歌手!
一、Suno AI是什么? Suno AI是一款强大的人工智能音乐生成器,由 Anthropic 公司开发完成。 可以将文本转化为高度逼真的音乐和语音。该系统包括多种音乐风格,如电影、RAP、翻唱等,并提供了多语言和不同性别的播音员选择。用户可以使用命令来生成音频并进行个性化设置。它支持英文、中文等 50 种语言,可以在网站和 Discord 双平台上使用。 新用户有 250 个免费积分,可以生成… -
SimpleTex – 方便便捷的公式/文档识别软件,国产之光,无付费入口!兼容Win/MacOS
一、SimpleTex是什么? SimpleTeX 是一个用于创建和编辑LaTeX 公式的简单工具。 它可以识别轻松识别图片中的复杂公式并转换为可编辑的数据格式。 它提供了一个直观的界面, SimpleTeX 的主要功能包括: 实时预览:用户可以在编辑LaTeX 代码的同时立即查看公式的效果,无需额外的编译步骤。 只需轻松截取公式图片或上传本地图像,即可快速获得数学公式的LaTeX表达,支持快速插… -
ProPainter – 专业视频修复去水印AI工具,可以抹除视频中的静态水印、动态物体/人物,效果出色~
ProPainter是一个基于E2FGVI实现的AI视频编辑工具,它可以一键移除视频内的移动物体和水印。这个开源项目提供了一个简单而强大的解决方案,帮助用户轻松编辑和改善视频内容。 一、ProPainter是什么? ProPainter 是一个用于视频修复的先进模型。它结合了增强的传播和 Transformer 机制,能够快速高效地进行视频修复、对象去除、水印去除等任务。ProPainter 通过… -
DeepFaceLab – 官方原生AI换脸软件,开箱即用,可支持A卡和N卡~
DeepFaceLab(后面简称DFL)是一个GitHub上的一个开源项目,用于视频换脸,使用Python编写,基于Tensorflow框架。DFL是目前开源软件中最好用的AI换脸软件之一,现在还在不断更新,同时作者也在开发DeepFaceLive,用于实时换脸。哔哩哔哩上很多换脸视频都是基于此框架,包括著名的肌肉金轮。 一、DeepFaceLab是什么? Deepfacelab是一款基于深度学习… -
Microsoft Copilot – ChatGPT最佳平替AI工具,微软出品,彻底颠覆传统Office,你的日常 AI 助手~
果不其然,3 月 16 日,微软宣布,正式为 Microsoft 365 应用和服务提供人工智能驱动的 Copilot(Microsoft 365 Copilot),旨在协助用户生成文档、电子邮件、演示文稿和更多内容。Copilot 主要由 OpenAI 的 GPT-4 驱动,会与微软 365 应用程序一起,就像一个助手(想想小助手曲别针 Clippy),作为聊天机器人的模式,出现在侧边栏。Off… -
InpaintAnything- 一键智能局部重绘变装/换发型AI工具
一、InpaintAnything是什么? AI换装换发型局部重绘软件,可以用来重绘图片、换装、换发型等。它的独立版不需要依赖其他软件,而整合版则更为方便。 二、InpaintAnything的开源地址: https://github.com/Uminosachi/inpaint-anything 三、InpaintAnything的操作界面: 四、InpaintAnything的主要特点: 🎨 … -
Gamma – 由AI驱动呈现优秀创意的PPT
Gamma: AI for presenting ideas, beautifully 一、Gamma是什么? Gamma是一款由AI驱动呈现优秀的有创意的产品,它是幻灯片的替代品 - 一种快速、简单的方式来分享和展示您的工作。 创建易于实时讨论或异步共享的引人入胜的演示文稿、备忘录、简报和文档。全部在您的浏览器中,无需下载或安装。 开始撰写吧!无需任何格式设置和设计工作,即可创造精美、引人入胜的… -
Vocal Separate – 极简音乐人声分离AI工具,本地部署,无需网络,支持CPU
将一首歌曲或者含有背景音乐的音视频文件,拖拽到本地网页中,即可将其中的人声和音乐声分离为单独的音频wav文件,可选单独分离“钢琴声”、“贝斯声”、“鼓声”等 一、Vocal Separate是什么? 这是一个极简的人声和背景音乐分离工具,本地化网页操作,无需连接外网,使用 2stems/4stems/5stems 模型。 二、Vocal Separate的开源地址: https://github.… -
LaTeX OCR – 数学公式图像识别AI工具,完美替代坑爹MathPix,本地整合包,无需环境,一键安装,开源免费~
由于mathpix开始收费了,于是我们将开源免费的LaTeX-OCR工具制作成本地整合包,点击即可使用,避免大家配置Python环境出现各种问题。 一、LaTeX OCR是什么? LaTeX-OCR 是一个开源的光学字符识别(OCR)软件,专为LaTeX 文档提供支持。 其主要目的是帮助用户将扫描的文档转换为LaTeX 编辑器可以使用的可编辑文本,从而方便进行修改、编辑和排版。 LaTeX广泛用于… -
Image to Line Drawings – 图片一键转素描线稿AI工具
一、Image to Line Drawings是什么? 在传统艺术学习过程中,绘制一幅素描作品往往需要耗费大量时间和精力。然而,在AI的帮助下,这一过程可以被大幅简化。本文介绍的Image to Line Drawings整合包,便是这样一个工具,它能够帮助用户迅速将普通图片转换成素描风格的线条图。 二、Image to Line Drawing如何使用? 为了让更多用户能够轻松体验这一技术,我… -
ELLA – 腾讯开源文生图扩散模型,利用LLM增强语义对齐,本地整合包,免训练,一键运行,效果赶超DALL-E~
一、ELLA是什么? ELLA(Efficient Large Language Model Adapter,高效大型语言模型适配器)由腾讯研究人员开发。该技术旨在提高文本到图像生成模型在处理复杂文本提示时的语义对齐能力。通过整合大型语言模型(LLM),ELLA极大增强了模型的文本对齐性能,而这一切无需对U-Net或LLM进行额外的训练。 二、ELLA的网站地址: 1、Github开源地址: ht…