-
WinkStudio – 美图旗下专业视频人像精修AI工具,像修图一样修视频,操作如此简单,支持Windows/MacOS
像修图一样修视频,操作如此简单~ 一、WinkStudio 是什么? 专业的视频人像精修工具,让你的视频创作更高效。全面的美颜美妆等视频人像精修功能,可自由定制美容参数,批量处理视频。搭载强大的AI工具箱,提供画质修复、AI动漫、水印消除等常用功能支持。 “Winkstudio”类似“开拍”,但功能更丰富,定制性更高,添加了“瑕疵消除”、“一键抠像”、“AI 美颜调色”等功能,还具有一些滤镜,例如…- 1.2k
-
MuseTalk – 数字虚拟人唇形同步视频生成AI工具,一键整合包,开箱即用,腾讯天琴实验室开源
一、MuseTalk是什么? MuseTalk 是由腾讯团队开发的先进技术,它是一个实时的音频驱动唇部同步模型。该模型能够根据输入的音频信号,自动调整数字人物的面部图像,使其唇形与音频内容高度同步。这样,观众就能看到数字人物口型与声音完美匹配的效果。MuseTalk 特别适用于256 x 256像素的面部区域,且支持中文、英文和日文等多种语言输入。在NVIDIA Tesla V100显卡上,Mus…- 2.2k
-
Gigapixel 7 – 世界顶尖图像无损放大AI工具,支持Win/MacOS,完美激活,中文汉化,推荐指数五颗星⭐️⭐️⭐️⭐️⭐️
Topaz Gigapixel AI 7 这是一个更新大规模的版本,软件介面与 Topaz Photo AI 一样了,模型也与 Topaz Photo AI 一样相同类,包括一些全新的增强功能,以及对应用程序的几乎每个部分的许多改进! 全新界面。 600% 升级。 世界一流的人工智能模型。 一、Gigapixel 7 是什么? Gigapixel AI 可以帮助您很好地完成一件事:以自然的方式提高…- 2k
-
DeNoise AI – 完美图像智能降噪锐化AI工具,支持Win/MacOS,中文汉化,一键解决图片噪点问题,重拾图片纯净之美~
在数字摄影时代,我们常常会遇到图片噪点过多的问题,这不仅影响了图片的清晰度,还使得照片的艺术性和观赏性大打折扣。然而,借助Topaz DeNoise AI这一革命性的图片降噪软件,您将能够轻松解决这一问题,重拾图片纯净之美。 一、DeNoise AI 是什么? DeNoise AI 是 Topaz Labs 旗下一款基于人工智能技术的图片降噪软件。相较于传统降噪工具,DeNoise AI…- 2.2k
-
AnyText – 精准控制中文汉字的AI绘图工具,动动嘴皮子,就能出电商大促海报,一键整合包,开箱即用,阿里开源
随着人工智能技术的不断发展,视觉文字生成与编辑成为了一个备受关注的领域。AnyText作为一款多语言视觉文字生成与编辑工具,具有强大的功能和广泛的应用场景。 一、AnyText是什么? AnyText是阿里巴巴智能计算研究院的团队推出的一个基于扩散的多语言视觉文本生成和编辑模型,专注于在图像中渲染准确和连贯的文本。AnyText包括两个主要元素的扩散管线:辅助潜在模块和文本嵌入模块。前者使用文本字…- 2.6k
-
MuseV – 数字虚拟人视频生成AI工具,一键整合包,开箱即用,腾讯天琴实验室开源
一、MuseV是什么? MuseV是一个由腾讯音乐娱乐的天琴实验室开源的虚拟人视频生成框架,专注于生成高质量的虚拟人视频和口型同步。它利用先进的算法,能够制作出具有高度一致性和自然表情的长视频内容。MuseV支持自定义动作和风格,视频时长理论上无限,且生成速度快。这一技术在AI创作领域中表现出色,为虚拟人视频制作提供了新的可能性。 二、MuseV的网站地址: 1、Github开源地址: https…- 4.8k
-
天机(来事儿AI)- 专业中国式传统人情世故语言训练AI大模型,化解一切尴尬场合和矛盾冲突,本地整合包,一键开启使用,你也是社牛达人!
江湖不是打打杀杀,江湖是人情世故~ 一、天机(来事儿AI)是什么? 天机是 SocialAI(来事儿AI)制作的一款免费使用、非商业用途的人工智能系统。您可以利用它进行涉及传统人情世故的任务,如如何敬酒、如何说好话、如何会来事儿等,以提升您的情商和核心竞争能力。我们坚信,只有人情世故才是未来AI的核心技术,只有会来事儿的AI才有机会走向AGI,让我们携手见证通用人工智能的来临。 —— "…- 2k
-
Fooocus 2.0 中文版 – 傻瓜式AI绘画神器,超180种预置风格,体验直追Midjourney,三天登顶GitHub热榜!
玩AI画画,现在终于不用担心被老黄刀法“背刺”了! 只需要一块4年前的GTX 1650(显存4GB),AI出图效果堪比当前最好的开源模型SDXL。 一、Fooocus是什么? Fooocus是一款离线、开源且免费的AI绘画软件,仅需4G显存即可使用SDXL模型。通过重新思考Stable Diffusion和Midjourney的设计理念,Fooocus简化了安装过程,降低了使用门槛,让更多人能够体…- 4k
-
Lobe Chat – 广受欢迎的在线AI对话聊天机器人,一键部署,免费开源
开源、现代化设计的 ChatGPT/LLMs 聊天应用与开发框架支持语音合成、多模态、可扩展的(function call)插件系统一键免费拥有你自己的 ChatGPT/Gemini/Ollama 应用 一、Lobe Chat是什么? Lobe Chat是一个免费开源的高性能AI聊天机器人框架,提供了高颜值的聊天界面程序和丰富灵活的功能,支持语音合成、多模态、可扩展的插件系统,可一键免费部署私人 …- 824
-
TeleChat – 星辰语义AI对话大模型,中国电信出品,免费开源
一、TeleChat是什么? 星辰语义大模型TeleChat是由中电信人工智能科技有限公司研发训练的大语言模型,其中7B模型基座采用1.5万亿 Tokens中英文高质量语料进行训练,12B模型基座采用3万亿 Tokens中英文高质量语料进行训练。 我们开源了对话模型TeleChat-7B-bot与TeleChat-12B-bot,以及其huggingface格式的权重文件。此外,我们还开源了7B、…- 744
-
CharacterGLM-6B – 角色扮演AI大模型,本地整合包,你会和佟掌柜来一场恋爱,还是跟张起灵一起去古墓探险呢?
为了满足不同用户的需求,CharacterGLM设计并定制了多种角色,覆盖了名人类、生活类、游戏影音类和虚拟恋爱类等多个领域。 一、CharacterGLM-6B模型介绍: CharacterGLM-6B 是 聆心智能和清华大学 CoAI 实验室联合发布的新一代对话预训练模型。CharacterGLM-6B 是 基于 ChatGLM2 系列中的开源模型,在保留了前两代模型对话流畅、部署门槛低等众多…- 2k
-
Bert-VITS 2 – 爆杀原版?原神&星穹铁道全角色文本转语音AI工具,栩栩如生,声色克隆,原神启动!
为游戏爱好者们带来一款新的体验工具,原神&星穹铁道全角色文本转语音AI工具。该工具基于先进的BERT-VITS模型,这是一种结合了Transformer架构的语音合成技术。BERT-VITS模型通过深度学习,能捕捉到不同音色的独特属性,并能够实现高度个性化的语音合成效果。这款整合包特别支持多角色对话模式,让用户能够体验到更加丰富和真实的交互对话。 一、Bert-VITS 2是什么? BER…- 2.5k
-
SimpleTex – 方便便捷的公式/文档识别软件,国产之光,无付费入口!兼容Win/MacOS
一、SimpleTex是什么? SimpleTeX 是一个用于创建和编辑LaTeX 公式的简单工具。 它可以识别轻松识别图片中的复杂公式并转换为可编辑的数据格式。 它提供了一个直观的界面, SimpleTeX 的主要功能包括: 实时预览:用户可以在编辑LaTeX 代码的同时立即查看公式的效果,无需额外的编译步骤。 只需轻松截取公式图片或上传本地图像,即可快速获得数学公式的LaTeX表达,支持快速插…- 1.7k
-
LightFlow – AI绘画超强作弊神器!一键复用工作流,Stable Diffusion革命性插件,腾讯出品~
一、LightFlow是什么? LightFlow可以将一张图像的生成参数和相关设置保存为文件,这样无论是复用图像生成信息还是分享给别人都非常方便,可以有效提升我们的出图效率。 它可以帮助你一键保存所有工作流数据(包括垫图和其他第三方插件设置),下次使用只需拖入.flow文件,就能快速复现整个工作流,就像使用Photoshop的PSD文件那样方便。 二、LightFlow的网址: 1、Github…- 2k
-
Easy-Wav2Lip – 数字人口播视频制作AI工具,高度口型同步,本地整合包,支持图片和视频~
一、Easy-Wav2Lip是什么? Easy-Wav2Lip是Wav2Lip的改进版本,在设计上更为简洁,执行速度更快,同时生成的视频效果更加逼真。Wav2Lip技术可以让视频中的人物根据输入的音频生成匹配的唇形动作,从而实现口型与语音同步的效果。这项技术不仅适用于静态图像,还能够对动态视频进行处理,生成与目标语音同步的视频输出。 二、Easy-Wav2Lip的项目地址: 1、Github仓库:…- 3k
-
FaceChain – AI写真馆,妙鸭相机最强平替,仅需2张,即可获得专属写真大片~
FaceChain人物写真生成,仅需要某个人物的2张照片,即可训练得到该人物的专属形象,并批量生成各种风格的写真照片。FaceChain基于扩散模型的图像生成能力,结合LoRA训练实现人像和风格融合,并叠加一系列后处理能力,实现兼具相似度、真实感、美观度的写真生成能力。 一、FaceChain是什么? FaceChain是一款可以用于打造个人数字形象的深度学习模型工具。用户只需提供最低一张照片即可…- 2.2k
-
Waifu2x Extension GUI – 开源图片视频GIF无损放大AI神器,本地整合包,视频不再模糊~
使用机器学习放大 图片/视频/GIF 以及 视频插帧(补帧),支持 AMD / Nvidia / Intel 显卡。下载最新版本的绿色版安装包, 适用于拥有Intel/AMD/Nvidia显卡的Windows 64位系统个人电脑。 Waifu2x Extension GUI是什么? Waifu2x-Extension-GUI 是一款开源、免费、易用的图片、GIF 和视频放大与降噪工具,基于 Wai…- 1.8k
-
Wisdom Interrogatory 智海录问 – 本地私人法律顾问, 阿里巴巴大模型,本地整合包
8月21日,由中国工程院院刊《Engineering》、中国人工智能学会、中国工程院院刊信息与电子工程领域分刊《FITEE》联合主办的Engineering大讲堂暨“智行中国”第五期系列论坛在浙江大学举行,论坛围绕基座模型基础理论、AI+X垂直领域赋能应用及基座模型评测体系等问题邀请领域专家展开了深入探讨。在论坛上,由浙江大学联合阿里云、华院计算联合研制面向司法领域开源开放的法律大模型——智海-录…- 1.8k
-
ChatGPT Academic – 中科院学术专业版ChatGPT,一键搞定所有论文!助力科研创新,开启智能学术之旅~
自ChatGPT Academic在Github推出已有一段时间,已收获无数网友点赞。那什么是ChatGPT Academic,如何在自己电脑上部署呢?今天,就让小编带着大家一探究竟! 一、ChatGPT Academic是什么? ChatGPT Academic也被称为「中科院学术专业版 ChatGPT」,是中科院计算机科学与技术研究所研发的一款人工智能学术助手,旨在为科研人员提供高效、便捷的学…- 7.3k
-
启真医学Chat – 私人家庭医生,国内开源中文医疗大模型~
一 、启真医学模型是什么? 启真医学大模型坚持“数据+知识双轮驱动”的技术路线,通过大模型技术和医学知识库的紧密结合,融合医疗应用场景中的实际需求,从医学数据治理、医学推理、医患问答、病历自动生成、临床决策辅助支持系统等方面开展迭代研发,助力大模型技术在医疗行业的落地和应用实践。 目前大多数开源的ChatLLM项目使用的是其他模型(如:ChatGPT)生成的指令数据,其不可避免的存在数据幻想的问题…- 1.9k
-
ProPainter – 专业视频修复去水印AI工具,可以抹除视频中的静态水印、动态物体/人物,效果出色~
ProPainter是一个基于E2FGVI实现的AI视频编辑工具,它可以一键移除视频内的移动物体和水印。这个开源项目提供了一个简单而强大的解决方案,帮助用户轻松编辑和改善视频内容。 一、ProPainter是什么? ProPainter 是一个用于视频修复的先进模型。它结合了增强的传播和 Transformer 机制,能够快速高效地进行视频修复、对象去除、水印去除等任务。ProPainter 通过…- 4.5k
-
EasyPhoto – 您的AI艺术写真AI工具,快速创建自己的AI数字分身,中文本地整合包
🦜 EasyPhoto 是一个 Webui UI 插件,用于生成 AI 肖像,可用于训练与您相关的数字分身。 一、EasyPhoto是什么? EasyPhoto 是一个 Webui UI 插件,用于生成 AI 肖像,可用于训练与您相关的数字分身。训练建议用5到20张人像图片进行,最好是半身照片,并且不要戴眼镜(几张图中的人物戴眼镜也没关系)。训练完成后,我们可以在推理部分生成它。我们支持使用预设的…- 1.8k
-
Roop Unleashed – 一键单图换脸AI工具,中文整合包,无需训练LoRA,已更新至3.6.5
ROOP-Unleashed是一款基于ROOP的换脸web UI,界面简单易用。 一、Roop Unleashed的主要特征: 独立于平台的浏览器 GUI 一次性选择多个输入/输出面 许多不同的交换模式,首先检测到,面部选择,按性别 图像/视频的批量处理 使用文本提示遮盖面部遮挡物 使用不同增强剂的可选面部修复 预览不同视频帧的交换 使用您的网络摄像头进行实时假摄像头 用于剪切视频等的附加选项卡。…- 3.5k
-
Wav2Lip – 使用AI听音同步人物面部口型,AI虚拟主播数字人工具整合包
Wav2Lip适用于任何人脸、任何语言,对任意视频都能达到很高都准确率,可以无缝地与原始视频融合,还可以用于转换动画人脸。 一、Wav2Lip是什么? Wav2Lip实现的是视频人物根据输入音频生成与语音同步的人物唇形,使得生成的视频人物口型与输入语音同步。Wav2Lip不仅可以基于静态图像来输出与目标语音匹配的唇形同步视频,还可以直接将动态的视频进行唇形转换,输出与目标语音匹配的视频。Wav2L…- 3k