-
Upscayl – 顶级图像无损智能放大AI工具,最高可放大16倍
Upscayl是什么? 在数字化时代,图像的质量对于视觉体验至关重要。Upscayl 是一款利用 AI 技术无损放大图像的工具,能够将图片放大高达 16 倍,极大地提升了图片的清晰度和细节。它适合于提升老照片清晰度、处理网络素材图片等场景,且完全免费且开源。 Upscayl的官网地址? https://www.upscayl.org/ Upscayl的特点优势? AI 技术支持:采用先进的人工智能…- 2.2k
-
ComfyUI 秋叶整合包 – 工作流界面,超多节点,解压即用,一键启动,快速入门AI绘画
上周赛博佛祖秋葉 Aki 发布了针对 ComfyUI 的整合安装包,让这款原本偏专业的 AI 绘画工具对初学者来说更容易上手使用了,我也安装试用了一下,的确非常方便,今天就为大家详细介绍一下整合包的用法 ~ 来自B站up@秋葉aaaki,近期发布了Stable Diffusion整合包v4版本,一键在本地部署Stable Diffusion!! 适用于零基础想要使用AI绘画的小伙伴~ 一、Comf…- 4.7k
-
Cutie – 高质量视频一键精准抠像分离AI工具,短视频剪辑利器,视频换背景、去人物原来如此简单!
Cutie用于自动识别和追踪视频里的特定物体,比如一个人或一辆车。假设你有一段视频,里面有很多人和物体在移动,Cutie可以自动找出其中一个特定的人并一直追踪他。 一、Cutie是什么? Cutie 是一个视频对象分割框架,是XMem的后续作品,具有更好的一致性、鲁棒性和速度。该存储库包含用于标准视频对象分割的代码和用于交互式视频分割的 GUI 工具。 GUI 工具还包含“永久内存”(来自XMem…- 2.4k
-
DiffBIR – 新一代高质量图像修复技术AI工具(支持Google Colab)
在人工智能照片修复方面,我们通常会想到像SD(StyleGAN等)这类的生成式对抗网络。然而,这些模型有时候会在图像修复过程中“发挥过头”,导致生成的图片与原始内容大相径庭。 本次我们要分享的AI照片修复工具,有效解决了上述问题。这个工具不仅能够有效去除图片噪声、模糊等问题,还能复原老照片中褪色或缺失的细节,使其看起来更加鲜活和真实。同时,保证修复后的图片忠实于原图内容。这一突破性的算法模型被称为…- 3.1k
-
InpaintAnything- 一键智能局部重绘变装/换发型AI工具
一、InpaintAnything是什么? AI换装换发型局部重绘软件,可以用来重绘图片、换装、换发型等。它的独立版不需要依赖其他软件,而整合版则更为方便。 二、InpaintAnything的开源地址: https://github.com/Uminosachi/inpaint-anything 三、InpaintAnything的操作界面: 四、InpaintAnything的主要特点: 🎨 …- 3.4k
-
VALL-E – 微软最强AI声音克隆工具,免训练,免安装,本地整合包,三秒偷走你的声音~
该模型支持多种语言(英语、中文和日语)和零样本语音克隆,你只需要提供一个人短短几秒钟的录音(3-10秒),就能模仿出那个人的声音。此外,它还具有语音情感控制和口音控制等高级功能。同时相对于其他模型,它更轻量、更快速… 一、VALL-E是什么? Vall-E AI是微软开发的一款基于人工智能的文本到语音转换器。该工具将文本输入转换为音频,并将其与人的情绪和房间的声学效果相匹配。它可以使用三秒的短音频…- 2.9k
-
零一万物 – 首款开源中英双语大模型,本地部署包,免训练,免安装,李开复最快AI独角兽开源项目~
支持输入30万汉字,看不懂《百年孤独》的人有救了 一、零一万物是什么? 知名投资人、创新工场董事长兼CEO李开复博士带队创办 AI 2.0大模型公司“零一万物”(01.AI),正式发布首款研发的最强开源人工智能(AI)大模型系列,名为“Yi”。 此次 Yi 系列基础模型的首个公开版本包括两款:Yi-6B(数据参数量为60亿)、Yi-34B(340亿),均是双语(英文/中文)、支持开源。其中,Yi-…- 2.6k
-
VOICEVOX – 专业日语AI配音文本语音合成工具
日语文字转语音软件「VOICEVOX」,提供了很多种不同的语音角色,每个角色都有独特的声音特征,适用于不同的场景和需求。VOICEVOX提供了直观易用的用户界面,使用户能够轻松地输入文本、选择语音角色、调整语音参数,并生成语音。 同时支持CPU,GPU,提供超过30 种不同声音的角色让你选择,效果如下: 一、VOICEVOX的官网地址: https://voicevox.hiroshiba.jp/…- 2.1k
-
AnyText – 精准控制中文汉字的AI绘图工具,动动嘴皮子,就能出电商大促海报,一键整合包,开箱即用,阿里开源
随着人工智能技术的不断发展,视觉文字生成与编辑成为了一个备受关注的领域。AnyText作为一款多语言视觉文字生成与编辑工具,具有强大的功能和广泛的应用场景。 一、AnyText是什么? AnyText是阿里巴巴智能计算研究院的团队推出的一个基于扩散的多语言视觉文本生成和编辑模型,专注于在图像中渲染准确和连贯的文本。AnyText包括两个主要元素的扩散管线:辅助潜在模块和文本嵌入模块。前者使用文本字…- 2.6k
-
SeaArt-Furry-XL-1.0 – 高质量毛绒绒卡通动漫人物插画生成AI绘画工具,海艺AI旗下开源项目,本地部署,一键生成~
一、SeaArt-Furry-XL-1.0 是什么? SeaArt-Furry-XL-1.0是基于先进的SDXL框架开发的,专门用于创造高品质的毛茸茸艺术图像。这个工具通过分析超过数百万张毛茸茸的图片,设定了毛茸茸艺术图像创作的新标准。它不仅深入了解各种毛茸茸角色,还细致考量了多种哺乳动物和鸟类的特征,使得生成的图像既精确又具有艺术家的风格。SeaArt-Furry-XL-1.0的目标是为毛茸茸艺…- 1k
-
CodeFormer – 本地整合包,顶尖人脸补全修复技术,支持黑白照片上色
CodeFormer被誉为“业界顶尖AI去马赛克工具”,它能有效清除学习和研究道路上的障碍。这款工具运用了尖端的神经网络AI技术,能够精确地修复各种破损、模糊、不完整以及黑白的照片和视频,效果令人瞩目! 一、CodeFormer的技术剖析: CodeFormer 的天才在于其变革性方法:将人脸恢复设想为代码预测挑战。该算法利用简化的代理空间中精心学习的离散密码本的力量,极大地减少了与恢复过程相关的…- 2.6k
-
Easy-Wav2Lip – 数字人口播视频制作AI工具,高度口型同步,本地整合包,支持图片和视频~
一、Easy-Wav2Lip是什么? Easy-Wav2Lip是Wav2Lip的改进版本,在设计上更为简洁,执行速度更快,同时生成的视频效果更加逼真。Wav2Lip技术可以让视频中的人物根据输入的音频生成匹配的唇形动作,从而实现口型与语音同步的效果。这项技术不仅适用于静态图像,还能够对动态视频进行处理,生成与目标语音同步的视频输出。 二、Easy-Wav2Lip的项目地址: 1、Github仓库:…- 3k
-
SadTalker – 图片配合音频秒变声音视频,头部、嘴型超自然,中英双语全能,还会唱歌~
单个肖像图像 🙎♂️ + 音频 🎤 = 头部说话视频🎞 一、SadTalker是什么? SadTalker模型是一个使用图片与音频文件自动合成人物说话动画的开源模型,我们自己给模型一张图片以及一段音频文件,模型会根据音频文件把传递的图片进行人脸的相应动作,比如张嘴,眨眼,移动头部等动作。SadTalker,它从音频中生成 3DMM 的 3D 运动系数(头部姿势、表情),并隐式调制一种新颖的 3D…- 2.2k
-
Gigapixel 7 – 世界顶尖图像无损放大AI工具,支持Win/MacOS,完美激活,中文汉化,推荐指数五颗星⭐️⭐️⭐️⭐️⭐️
Topaz Gigapixel AI 7 这是一个更新大规模的版本,软件介面与 Topaz Photo AI 一样了,模型也与 Topaz Photo AI 一样相同类,包括一些全新的增强功能,以及对应用程序的几乎每个部分的许多改进! 全新界面。 600% 升级。 世界一流的人工智能模型。 一、Gigapixel 7 是什么? Gigapixel AI 可以帮助您很好地完成一件事:以自然的方式提高…- 2k
-
DeNoise AI – 完美图像智能降噪锐化AI工具,支持Win/MacOS,中文汉化,一键解决图片噪点问题,重拾图片纯净之美~
在数字摄影时代,我们常常会遇到图片噪点过多的问题,这不仅影响了图片的清晰度,还使得照片的艺术性和观赏性大打折扣。然而,借助Topaz DeNoise AI这一革命性的图片降噪软件,您将能够轻松解决这一问题,重拾图片纯净之美。 一、DeNoise AI 是什么? DeNoise AI 是 Topaz Labs 旗下一款基于人工智能技术的图片降噪软件。相较于传统降噪工具,DeNoise AI…- 2.2k
-
川虎GPT🐯 – 本地开源AI对话客户端,速度优于ChatGPT,支持联网~
川虎GPT🐯为ChatGPT等多种LLM提供了一个轻快好用的Web图形界面和众多附加功能 一、川虎GPT的最近更新: 全新的用户界面!精致得不像 Gradio,甚至有毛玻璃效果! 适配了移动端(包括全面屏手机的挖孔/刘海),层级更加清晰。 历史记录移到左侧,使用更加方便。并且支持搜索(支持正则)、删除、重命名。 现在可以让大模型自动命名历史记录(需在设置或配置文件中开启)。 现在可以将…- 760
-
NVIDIA Chat with RTX 一键部署私密的AI聊天机器人
真香!NVIDIA Chat with RTX,显卡原生加速GPT!一键部署私密的AI聊天机器人! 查看实际演示效果 什么是Chat with RTX? NVIDIA Chat with RTX是NVIDIA推出的一款本地部署的AI聊天机器人,专门为Windows个人电脑设计。它使用了类似ChatGPT的大型语言模型和检索增强生成(RAG)技术,允许用户个性化连接到自己内容的AI聊天机器人。Cha…- 1.7k
-
Fooocus 2.0 中文版 – 傻瓜式AI绘画神器,超180种预置风格,体验直追Midjourney,三天登顶GitHub热榜!
玩AI画画,现在终于不用担心被老黄刀法“背刺”了! 只需要一块4年前的GTX 1650(显存4GB),AI出图效果堪比当前最好的开源模型SDXL。 一、Fooocus是什么? Fooocus是一款离线、开源且免费的AI绘画软件,仅需4G显存即可使用SDXL模型。通过重新思考Stable Diffusion和Midjourney的设计理念,Fooocus简化了安装过程,降低了使用门槛,让更多人能够体…- 4k
-
秋叶Lora炼丹炉 – AI模型训练一键包,人人都可以当炼金术士
一、Lora是什么? LORA是Low-Rank Adaptation的缩写,最早在2021年论文《LoRA: Low-Rank Adaptation of Large Language Models》中提出。是一种大语言模型低秩适配器,简单来说就是它可以降低模型可训练参数,使其尽量不损失模型表现的大模型微调方法,在此之前,StableDiffusion只能通过使用Dreambooth的方法训练大…- 3.4k
-
Wisdom Interrogatory 智海录问 – 本地私人法律顾问, 阿里巴巴大模型,本地整合包
8月21日,由中国工程院院刊《Engineering》、中国人工智能学会、中国工程院院刊信息与电子工程领域分刊《FITEE》联合主办的Engineering大讲堂暨“智行中国”第五期系列论坛在浙江大学举行,论坛围绕基座模型基础理论、AI+X垂直领域赋能应用及基座模型评测体系等问题邀请领域专家展开了深入探讨。在论坛上,由浙江大学联合阿里云、华院计算联合研制面向司法领域开源开放的法律大模型——智海-录…- 1.8k
-
Waifu2x Extension GUI – 开源图片视频GIF无损放大AI神器,本地整合包,视频不再模糊~
使用机器学习放大 图片/视频/GIF 以及 视频插帧(补帧),支持 AMD / Nvidia / Intel 显卡。下载最新版本的绿色版安装包, 适用于拥有Intel/AMD/Nvidia显卡的Windows 64位系统个人电脑。 Waifu2x Extension GUI是什么? Waifu2x-Extension-GUI 是一款开源、免费、易用的图片、GIF 和视频放大与降噪工具,基于 Wai…- 1.8k
-
DemoFusion – 专业优化放大AI图像/细节增强高清神器,无需$$$
DemoFusion 是一款能够显著提高图像分辨率的增强工具。它允许用户将图像的分辨率提升至原来的4倍、16倍甚至更高,不仅增强图片的清晰度,还能够细化图片中的小细节,如纹理和边缘,创造出更为自然和逼真的视觉效果。DemoFusion 与基于潜在扩散模型(LDM)的多种应用无缝集成,例如ControlNet,同时还能放大真实世界中拍摄的图像。 一、DemoFusion的技术剖析: 使用生…- 2.2k
-
PhotoMaker – 几秒钟内生成任何风格的人物照片,腾讯团队出品
一、PhotoMaker是什么? PhotoMaker 是一款强大的图像合成工具,它能够通过分析多张照片中的人物特征,创造出全新的个性化人物图像。不仅如此,PhotoMaker 还能够根据用户的描述生成符合要求的人物照片,或者将多个人物的特征混合,创造出独特的形象。此外,该工具能够调整人物在照片中的性别、年龄,并且能够生成多种不同风格的图像。 二、PhotoMaker的网页地址 1、GIthub仓…- 1.8k
-
ASR – 视频/语音自动生成字幕工具,本地整合包,AI视频剪辑必备神器~
一、ASR是什么? ASR全称Automatic Speech Recognition,自动语音识别也称为语音转文本 (STT),是将给定音频转录为文本的任务。它有很多应用,例如语音用户界面。 二、ASR的项目地址: https://huggingface.co/tasks/automatic-speech-recognition 三、ASR的使用场景: 1、虚拟语音助手 许多边缘设备都有嵌入式虚…- 1.8k