-
SeaArt-Furry-XL-1.0 – 高质量毛绒绒卡通动漫人物插画生成AI绘画工具,海艺AI旗下开源项目,本地部署,一键生成~
一、SeaArt-Furry-XL-1.0 是什么? SeaArt-Furry-XL-1.0是基于先进的SDXL框架开发的,专门用于创造高品质的毛茸茸艺术图像。这个工具通过分析超过数百万张毛茸茸的图片,设定了毛茸茸艺术图像创作的新标准。它不仅深入了解各种毛茸茸角色,还细致考量了多种哺乳动物和鸟类的特征,使得生成的图像既精确又具有艺术家的风格。SeaArt-Furry-XL-1.0的目标是为毛茸茸艺…- 1k
-
IC-Light – 智能打光/换场景AI工具,Github开源,本地部署,一键启动,ControlNet之父张吕敏再降神迹!!!Clipdrop Relight最佳平替,遥遥领先~
IC-Light 是Controlnet的作者张吕敏刚刚放出来的项目。代码上传时间还在几个小时之前,这一消息却已经引爆AI圈,大家纷纷惊呼:神作!! 一、IC-Light 是什么? ControlNet 之父张吕敏推出了名为 IC-Light 的控制图像照明光影融合模型。这一模型能够基于文本条件和背景条件重新照明图像,为图像编辑和增强提供了全新的视角和工具。 IC-Light项目旨在通过先进的机器…- 3.7k
-
MoneyPrinterTurbo – 短视频快速生成AI工具,俗称“AI印钞机”?本地部署,无需训练,输入文字即可生成~
只需提供一个视频 主题 或 关键词 ,就可以全自动生成视频文案、视频素材、视频字幕、视频背景音乐,然后合成一个高清的短视频。 一、MoneyPrinterTurbo 是什么? MoneyPrinterTurbo 是一个强大的AI视频生成工具,它能根据给定的视频主题或关键词自动生成包含文案、素材、字幕和背景音乐的高清短视频。这个工具特别适合需要快速生成视频内容的创作者、营销人员或是任何对视频制作感兴…- 2k
-
MotionShop – 一键替换视频人物AI工具,阿里开源,把视频人物秒变3D角色,平替Wonder Studio
这款AI工具替换成的3D人物能复制原视频中人物的动作,就像镜子一样!这可太强大了,想想都觉得好神奇呀!能想象到,未来某些综艺节目明星塌房的问题,直接换个可爱的吉祥物可能比打马赛克更有看头了对吧。 一、MotionShop 是什么? Motionshop是阿里巴巴智能计算研究院(XR实验室和TIDE三维渲染团队)推出的一个AI角色动画框架,可将视频中的人物角色替换为3D化身,同时不改变视频中的其他场…- 2.3k
-
MuseTalk – 数字虚拟人唇形同步视频生成AI工具,一键整合包,开箱即用,腾讯天琴实验室开源
一、MuseTalk是什么? MuseTalk 是由腾讯团队开发的先进技术,它是一个实时的音频驱动唇部同步模型。该模型能够根据输入的音频信号,自动调整数字人物的面部图像,使其唇形与音频内容高度同步。这样,观众就能看到数字人物口型与声音完美匹配的效果。MuseTalk 特别适用于256 x 256像素的面部区域,且支持中文、英文和日文等多种语言输入。在NVIDIA Tesla V100显卡上,Mus…- 2.2k
-
AnyText – 精准控制中文汉字的AI绘图工具,动动嘴皮子,就能出电商大促海报,一键整合包,开箱即用,阿里开源
随着人工智能技术的不断发展,视觉文字生成与编辑成为了一个备受关注的领域。AnyText作为一款多语言视觉文字生成与编辑工具,具有强大的功能和广泛的应用场景。 一、AnyText是什么? AnyText是阿里巴巴智能计算研究院的团队推出的一个基于扩散的多语言视觉文本生成和编辑模型,专注于在图像中渲染准确和连贯的文本。AnyText包括两个主要元素的扩散管线:辅助潜在模块和文本嵌入模块。前者使用文本字…- 2.6k
-
MuseV – 数字虚拟人视频生成AI工具,一键整合包,开箱即用,腾讯天琴实验室开源
一、MuseV是什么? MuseV是一个由腾讯音乐娱乐的天琴实验室开源的虚拟人视频生成框架,专注于生成高质量的虚拟人视频和口型同步。它利用先进的算法,能够制作出具有高度一致性和自然表情的长视频内容。MuseV支持自定义动作和风格,视频时长理论上无限,且生成速度快。这一技术在AI创作领域中表现出色,为虚拟人视频制作提供了新的可能性。 二、MuseV的网站地址: 1、Github开源地址: https…- 4.8k
-
天机(来事儿AI)- 专业中国式传统人情世故语言训练AI大模型,化解一切尴尬场合和矛盾冲突,本地整合包,一键开启使用,你也是社牛达人!
江湖不是打打杀杀,江湖是人情世故~ 一、天机(来事儿AI)是什么? 天机是 SocialAI(来事儿AI)制作的一款免费使用、非商业用途的人工智能系统。您可以利用它进行涉及传统人情世故的任务,如如何敬酒、如何说好话、如何会来事儿等,以提升您的情商和核心竞争能力。我们坚信,只有人情世故才是未来AI的核心技术,只有会来事儿的AI才有机会走向AGI,让我们携手见证通用人工智能的来临。 —— "…- 2k
-
Fooocus 2.0 中文版 – 傻瓜式AI绘画神器,超180种预置风格,体验直追Midjourney,三天登顶GitHub热榜!
玩AI画画,现在终于不用担心被老黄刀法“背刺”了! 只需要一块4年前的GTX 1650(显存4GB),AI出图效果堪比当前最好的开源模型SDXL。 一、Fooocus是什么? Fooocus是一款离线、开源且免费的AI绘画软件,仅需4G显存即可使用SDXL模型。通过重新思考Stable Diffusion和Midjourney的设计理念,Fooocus简化了安装过程,降低了使用门槛,让更多人能够体…- 4k
-
CharacterGLM-6B – 角色扮演AI大模型,本地整合包,你会和佟掌柜来一场恋爱,还是跟张起灵一起去古墓探险呢?
为了满足不同用户的需求,CharacterGLM设计并定制了多种角色,覆盖了名人类、生活类、游戏影音类和虚拟恋爱类等多个领域。 一、CharacterGLM-6B模型介绍: CharacterGLM-6B 是 聆心智能和清华大学 CoAI 实验室联合发布的新一代对话预训练模型。CharacterGLM-6B 是 基于 ChatGLM2 系列中的开源模型,在保留了前两代模型对话流畅、部署门槛低等众多…- 2k
-
Bert-VITS 2 – 爆杀原版?原神&星穹铁道全角色文本转语音AI工具,栩栩如生,声色克隆,原神启动!
为游戏爱好者们带来一款新的体验工具,原神&星穹铁道全角色文本转语音AI工具。该工具基于先进的BERT-VITS模型,这是一种结合了Transformer架构的语音合成技术。BERT-VITS模型通过深度学习,能捕捉到不同音色的独特属性,并能够实现高度个性化的语音合成效果。这款整合包特别支持多角色对话模式,让用户能够体验到更加丰富和真实的交互对话。 一、Bert-VITS 2是什么? BER…- 2.5k
-
LightFlow – AI绘画超强作弊神器!一键复用工作流,Stable Diffusion革命性插件,腾讯出品~
一、LightFlow是什么? LightFlow可以将一张图像的生成参数和相关设置保存为文件,这样无论是复用图像生成信息还是分享给别人都非常方便,可以有效提升我们的出图效率。 它可以帮助你一键保存所有工作流数据(包括垫图和其他第三方插件设置),下次使用只需拖入.flow文件,就能快速复现整个工作流,就像使用Photoshop的PSD文件那样方便。 二、LightFlow的网址: 1、Github…- 2k
-
Easy-Wav2Lip – 数字人口播视频制作AI工具,高度口型同步,本地整合包,支持图片和视频~
一、Easy-Wav2Lip是什么? Easy-Wav2Lip是Wav2Lip的改进版本,在设计上更为简洁,执行速度更快,同时生成的视频效果更加逼真。Wav2Lip技术可以让视频中的人物根据输入的音频生成匹配的唇形动作,从而实现口型与语音同步的效果。这项技术不仅适用于静态图像,还能够对动态视频进行处理,生成与目标语音同步的视频输出。 二、Easy-Wav2Lip的项目地址: 1、Github仓库:…- 3k
-
FaceChain – AI写真馆,妙鸭相机最强平替,仅需2张,即可获得专属写真大片~
FaceChain人物写真生成,仅需要某个人物的2张照片,即可训练得到该人物的专属形象,并批量生成各种风格的写真照片。FaceChain基于扩散模型的图像生成能力,结合LoRA训练实现人像和风格融合,并叠加一系列后处理能力,实现兼具相似度、真实感、美观度的写真生成能力。 一、FaceChain是什么? FaceChain是一款可以用于打造个人数字形象的深度学习模型工具。用户只需提供最低一张照片即可…- 2.2k
-
Wisdom Interrogatory 智海录问 – 本地私人法律顾问, 阿里巴巴大模型,本地整合包
8月21日,由中国工程院院刊《Engineering》、中国人工智能学会、中国工程院院刊信息与电子工程领域分刊《FITEE》联合主办的Engineering大讲堂暨“智行中国”第五期系列论坛在浙江大学举行,论坛围绕基座模型基础理论、AI+X垂直领域赋能应用及基座模型评测体系等问题邀请领域专家展开了深入探讨。在论坛上,由浙江大学联合阿里云、华院计算联合研制面向司法领域开源开放的法律大模型——智海-录…- 1.8k
-
ChatGPT Academic – 中科院学术专业版ChatGPT,一键搞定所有论文!助力科研创新,开启智能学术之旅~
自ChatGPT Academic在Github推出已有一段时间,已收获无数网友点赞。那什么是ChatGPT Academic,如何在自己电脑上部署呢?今天,就让小编带着大家一探究竟! 一、ChatGPT Academic是什么? ChatGPT Academic也被称为「中科院学术专业版 ChatGPT」,是中科院计算机科学与技术研究所研发的一款人工智能学术助手,旨在为科研人员提供高效、便捷的学…- 7.3k
-
启真医学Chat – 私人家庭医生,国内开源中文医疗大模型~
一 、启真医学模型是什么? 启真医学大模型坚持“数据+知识双轮驱动”的技术路线,通过大模型技术和医学知识库的紧密结合,融合医疗应用场景中的实际需求,从医学数据治理、医学推理、医患问答、病历自动生成、临床决策辅助支持系统等方面开展迭代研发,助力大模型技术在医疗行业的落地和应用实践。 目前大多数开源的ChatLLM项目使用的是其他模型(如:ChatGPT)生成的指令数据,其不可避免的存在数据幻想的问题…- 1.9k
-
ProPainter – 专业视频修复去水印AI工具,可以抹除视频中的静态水印、动态物体/人物,效果出色~
ProPainter是一个基于E2FGVI实现的AI视频编辑工具,它可以一键移除视频内的移动物体和水印。这个开源项目提供了一个简单而强大的解决方案,帮助用户轻松编辑和改善视频内容。 一、ProPainter是什么? ProPainter 是一个用于视频修复的先进模型。它结合了增强的传播和 Transformer 机制,能够快速高效地进行视频修复、对象去除、水印去除等任务。ProPainter 通过…- 4.5k
-
EasyPhoto – 您的AI艺术写真AI工具,快速创建自己的AI数字分身,中文本地整合包
🦜 EasyPhoto 是一个 Webui UI 插件,用于生成 AI 肖像,可用于训练与您相关的数字分身。 一、EasyPhoto是什么? EasyPhoto 是一个 Webui UI 插件,用于生成 AI 肖像,可用于训练与您相关的数字分身。训练建议用5到20张人像图片进行,最好是半身照片,并且不要戴眼镜(几张图中的人物戴眼镜也没关系)。训练完成后,我们可以在推理部分生成它。我们支持使用预设的…- 1.8k
-
Roop Unleashed – 一键单图换脸AI工具,中文整合包,无需训练LoRA,已更新至3.6.5
ROOP-Unleashed是一款基于ROOP的换脸web UI,界面简单易用。 一、Roop Unleashed的主要特征: 独立于平台的浏览器 GUI 一次性选择多个输入/输出面 许多不同的交换模式,首先检测到,面部选择,按性别 图像/视频的批量处理 使用文本提示遮盖面部遮挡物 使用不同增强剂的可选面部修复 预览不同视频帧的交换 使用您的网络摄像头进行实时假摄像头 用于剪切视频等的附加选项卡。…- 3.5k
-
Wav2Lip – 使用AI听音同步人物面部口型,AI虚拟主播数字人工具整合包
Wav2Lip适用于任何人脸、任何语言,对任意视频都能达到很高都准确率,可以无缝地与原始视频融合,还可以用于转换动画人脸。 一、Wav2Lip是什么? Wav2Lip实现的是视频人物根据输入音频生成与语音同步的人物唇形,使得生成的视频人物口型与输入语音同步。Wav2Lip不仅可以基于静态图像来输出与目标语音匹配的唇形同步视频,还可以直接将动态的视频进行唇形转换,输出与目标语音匹配的视频。Wav2L…- 3k
-
Bark – 高度逼真的开源文本转语音AI工具,最强TTS本地整合包
Bark是一个开源的文本转语音的AI模型。Bark 可以生成高度逼真的多语言语音以及其他音频 - 包括音乐、背景噪音和简单的音效。该模型可以模拟正常说话口气的语音,如笑、叹息和哭泣。支持多语言,包括中文。 一、Bark的项目地址: 1、论文地址: https://arxiv.org/abs/2209.03143 2、Github仓库: https://github.com/suno-ai/bark…- 2.6k
-
川虎GPT🐯 – 本地开源AI对话客户端,速度优于ChatGPT,支持联网~
川虎GPT🐯为ChatGPT等多种LLM提供了一个轻快好用的Web图形界面和众多附加功能 一、川虎GPT的最近更新: 全新的用户界面!精致得不像 Gradio,甚至有毛玻璃效果! 适配了移动端(包括全面屏手机的挖孔/刘海),层级更加清晰。 历史记录移到左侧,使用更加方便。并且支持搜索(支持正则)、删除、重命名。 现在可以让大模型自动命名历史记录(需在设置或配置文件中开启)。 现在可以将…- 760
-
EmotiVoice易魔声 – 爆火国产文本转语音AI工具,支持中英文,具有情绪控制功能~
网易有道AI算法团队也开源了一款国产TTS语音合成引擎EmotiVoice,刚上线仅一周时间就暴涨4200颗星,问鼎当周GitHub trending流行榜第一。而如今已冲到了 4.5k Star。 一、EmotiVoice是什么? EmotiVoice是一款功能强大且现代的开源文本转语音引擎,您可以免费使用。EmotiVoice 提供中英文两种语言,超过 2000 种不同的语音。最突出的功能是情…- 2.6k