山鲸AI
无数可心AI Tool,
助你总有新发现。
🔥热门工具
-
Suno AI – 重量级颠覆传统认知的AI音乐制作平台,一键制作你的专属音乐,轻松实现文本转歌曲,媲美真实歌手!
一、Suno AI是什么? Suno AI是一款强大的人工智能音乐生成器,由 Anthropic 公司开发完成。 可以将文本转化为高度逼真的音乐和语音。该系统包括多种音乐风格,如电影、RAP、翻唱等,并提供了多语言和不同性别的播音员选择。用户可以使用命令来生成音频并进行个性化设置。它支持英文、中文等 50 种语言,可以在网站和 Discord 双平台上使用。 新用户有 250 个免费积分,可以生成… -
SDXL-Light – 目前最快文生图AI模型,让AI出图速度提升 10 倍!
生成式人工智能技术已成为业界的焦点,它能够根据文本提示创造出图像或视频。目前的先进模型依赖于一个耗时的扩散过程来生成单一图像,可能需要5秒钟,并且要多次调用庞大的神经网络。因此,研究的热点是如何在保证图像质量的同时,加快图像的生成速度。 一、SDXL-Lightning是什么? SDXL-Lightning 模型是从 Stability AI 的 stable-diffusion-xl-base-… -
MuseV – 数字虚拟人视频生成AI工具,一键整合包,开箱即用,腾讯天琴实验室开源
一、MuseV是什么? MuseV是一个由腾讯音乐娱乐的天琴实验室开源的虚拟人视频生成框架,专注于生成高质量的虚拟人视频和口型同步。它利用先进的算法,能够制作出具有高度一致性和自然表情的长视频内容。MuseV支持自定义动作和风格,视频时长理论上无限,且生成速度快。这一技术在AI创作领域中表现出色,为虚拟人视频制作提供了新的可能性。 二、MuseV的网站地址: 1、Github开源地址: https… -
TripoSR – 快速单图生成3D模型,1秒完成,本地部署包,Stability AI与华人团队联合开源
TripoSR 的开发灵感来源于LRM(Large Reconstruction Models)的最新研究成果,即通过单一图像实现复杂三维结构的重建。这一突破性的图像到3D模型转换技术,旨在满足娱乐、游戏、工业设计以及建筑行业专业人士对高效3D建模工具的需求,通过快速响应输出,实现3D模型细节的精确可视化。 在性能测试中,TripoSR 在Nvidia A100硬件平台上运行仅需约0.5秒即可生成… -
OOTDiffusion – 本地整合包,一键完美AI换装,虚拟换衣服不再困难,效果超神,支持半身,全身!!!
OOTDiffusion 支持上半身、全身的换装,如果你想要自定义模特或者衣服,需要自己提供背景干净的模特或者衣服模型。对于从事服装销售的行业来说,完全可以依赖AI 虚拟换装的方式生成营销宣传海报,无需聘请高昂的模特和拍摄费用,这是一个低成本的试装方案。 一、OOTDiffusion是什么? OOTDiffusion是一种基于潜在扩散的虚拟试穿技术,其主要目的是通过实现控制性的换装融合,让用户能够… -
ComflowySpace – 开箱即用的ComfyUI客户端,MacOS用户的福音~
有在使用 Mac 电脑又想使用 ComfyUI,但因为安装困难而放弃的朋友吗? 开源AI图像和视频生成工具值得更好的交互设计体验,而不仅仅是WebUI和ComfyUI的原生外观。很多人不愿意学习或参与AI生成浪潮,因为工具门槛太高。这正是我们想要解决的问题。因此,我们认为应该创建一个更加用户友好和有用的AI图像和视频生成工具,ComflowySpace。 ComflowySpace的目标是做出人人…
🥕最新收录
-
PurePhotos – 超强在线抠图工具,内置图像校正,可输出PSD,每月100张免费额度!推荐五颗星⭐️⭐️⭐️⭐️⭐️
说到抠图,我想,每个人第一个想到的就是PS!(谁敢说不是) PS的强大功能,真的一骑绝尘,不可否认,PS中可以用来作为抠图的工具也是很多,套索,魔棒,快速选择,调整边缘(选择并遮住),色彩范围,钢笔,等等。 那么,除了PS,还有没有什么好用的? 一、PurePhotos 是什么? Purephotos是一个图片去背景线上网站,你只需要通过浏览器上传你想要处理的图片,可以自动删除相片上的背景,而且有… -
remove.bg – 专业图片背景移除在线工具,自动抠图,3秒完成!可免费使用~
近几年remove.bg一度刷屏互联网行业,其号称只需要上传一张带有人像的照片,它就会帮你自动抠掉背景,全自动、5秒完成。可以起到辅助作用,节省了大量人工操作。 一、remove.bg 是什么? Remove.bg 是一款功能强大的在线抠图工具,将想要抠去背景的图片上传,网站就会自动抠去背景,整个过程完全不需要手动操作,简单易上手,可以弥补 Midjourney 和 Stable diffusio… -
InsightFaceSwap – 超快速精准换脸AI工具,效果恐怖如斯,实现你的一切童年幻想!Midjourney最强伴侣插件~
对于很多小伙伴来说,都使用 Midjourney 制作过个人头像,这也是目前变现方式之一。但在生成头像的时候往往难以控制,做到和照片“很像”。InsightFaceSwap 这款插件,它支持精准替换人物面貌,而不改变图片中的其他内容,可以更好地帮助你解决这个问题。 一、InsightFaceSwap 是什么? InsightFaceSwap 是一款基于深度学习的人脸交换工具,它可以将两张人脸图片进… -
D-ID – 全球最专业最全面的数字人视频生成AI工具,真人口播,三分钟打造超炫虚拟数字人,开启逼真数字人新时代~
随着人工智能技术的不断发展,我们逐渐迈入了一个全新的数字时代。在这个时代,人们可以通过创造性的方式与虚拟现实相结合,创造出惊人的数字人物。其中,Creative Reality Studio (D-ID) 是一家提供 AI 拟真人视频产品服务和开发的公司,其独特的技术让用户能够以惊人逼真的方式与数字人物进行互动。本文将介绍D-ID的技术原理和使用技巧,带您领略数字时代的无限可能性。 一、D-ID … -
GitLab Duo Chat – 人工智能编程助理,GitLab旗下最新产品,开发者新宠儿,AI时代利器,助力程序员提高开发效率
一、GitLab Duo Chat是什么? Duo Chat 是源代码管理平台 GitLab 推出的一款集成了人工智能(AI)的对话式编程助手,旨在通过自然语言交互为工程和非工程用户提供实时指导。该AI编程工具支持整个软件开发生命周期,帮助团队提高代码理解速度、增强协作能力,并快速掌握 GitLab 的使用。Duo Chat 能够解释代码、重构代码、生成测试,以及提供代码建议,从而提升开发效率和代… -
LeiaPix – 专业2D图片转3D裸眼动画特效AI工具,让您的图片栩栩如生,打破视觉界限!
随着科技的发展,人工智能在图像处理方面展现了强大的能力。LeiaPix Converter就是一个使用AI技术,可以非常容易地将普通2D图片转换成3D动画的免费在线工具。在本文中,我将为您详细介绍如何使用LeiaPix Converter的各项功能,将静态图片转换成栩栩如生的3D动画。 一、LeiaPix 是什么? LeiaPix是一个基于网络的创新人工智能平台,能够将2D照片转3D效果的实用AI…
-
Pixian AI – AI智能驱动的在线一键抠图工具,支持批量~
一、Pixian AI是什么? Pixian.AI 提供了一种简单且用户友好的解决方案,用于从图像中删除背景,无需注册或订阅的麻烦。 用户可以轻松上传图像,并让 Pixian.AI 的先进算法对其进行处理,创建具有透明或选定颜色背景的图像。 Pixian.AI 非常适合多种用途,包括电子商务、营销材料、社交媒体帖子等,它简化了图像编辑任务,并提供了额外的功能,例如为开发人员提供 API 集成、与竞… -
Upscayl – 顶级图像无损智能放大AI工具,最高可放大16倍
Upscayl是什么? 在数字化时代,图像的质量对于视觉体验至关重要。Upscayl 是一款利用 AI 技术无损放大图像的工具,能够将图片放大高达 16 倍,极大地提升了图片的清晰度和细节。它适合于提升老照片清晰度、处理网络素材图片等场景,且完全免费且开源。 Upscayl的官网地址? https://www.upscayl.org/ Upscayl的特点优势? AI 技术支持:采用先进的人工智能… -
DiffBIR – 新一代高质量图像修复技术AI工具(支持Google Colab)
在人工智能照片修复方面,我们通常会想到像SD(StyleGAN等)这类的生成式对抗网络。然而,这些模型有时候会在图像修复过程中“发挥过头”,导致生成的图片与原始内容大相径庭。 本次我们要分享的AI照片修复工具,有效解决了上述问题。这个工具不仅能够有效去除图片噪声、模糊等问题,还能复原老照片中褪色或缺失的细节,使其看起来更加鲜活和真实。同时,保证修复后的图片忠实于原图内容。这一突破性的算法模型被称为… -
Rembg – 强大的批量抠图去背景AI工具
在当今的数字图像处理领域,抠图技术占据着不可忽视的地位。它不仅在专业的图形设计工作中扮演重要角色,也常见于日常的图片编辑需求中。随着人工智能技术的发展,出现了如rembg这样的基于AI的抠图工具,它们能够显著提升抠图的效率和质量。 Rembg的开源地址: https://github.com/danielgatis/rembg Rembg的抠图模型列表: u2net: 适用于通用场景的高精度预训练… -
Waifu2x Extension GUI – 开源图片视频GIF无损放大AI神器,本地整合包,视频不再模糊~
使用机器学习放大 图片/视频/GIF 以及 视频插帧(补帧),支持 AMD / Nvidia / Intel 显卡。下载最新版本的绿色版安装包, 适用于拥有Intel/AMD/Nvidia显卡的Windows 64位系统个人电脑。 Waifu2x Extension GUI是什么? Waifu2x-Extension-GUI 是一款开源、免费、易用的图片、GIF 和视频放大与降噪工具,基于 Wai… -
DemoFusion – 专业优化放大AI图像/细节增强高清神器,无需$$$
DemoFusion 是一款能够显著提高图像分辨率的增强工具。它允许用户将图像的分辨率提升至原来的4倍、16倍甚至更高,不仅增强图片的清晰度,还能够细化图片中的小细节,如纹理和边缘,创造出更为自然和逼真的视觉效果。DemoFusion 与基于潜在扩散模型(LDM)的多种应用无缝集成,例如ControlNet,同时还能放大真实世界中拍摄的图像。 一、DemoFusion的技术剖析: 使用生… -
ComfyUI 秋叶整合包 – 工作流界面,超多节点,解压即用,一键启动,快速入门AI绘画
上周赛博佛祖秋葉 Aki 发布了针对 ComfyUI 的整合安装包,让这款原本偏专业的 AI 绘画工具对初学者来说更容易上手使用了,我也安装试用了一下,的确非常方便,今天就为大家详细介绍一下整合包的用法 ~ 来自B站up@秋葉aaaki,近期发布了Stable Diffusion整合包v4版本,一键在本地部署Stable Diffusion!! 适用于零基础想要使用AI绘画的小伙伴~ 一、Comf… -
APISR – 专注二次元动漫图像分辨率增强,无损放大AI神器,让漫画焕然一新,动漫爱好者的福音~
APISR:动漫制作启发现实世界动漫超分辨率 APISR旨在恢复和增强低质量、低分辨率的动漫图像和视频源,这些图像和视频源与现实世界场景相比存在各种退化。 一、APISR是什么? APISR 是一个新的放大算法,专门用于恢复和增强各种低质量、低分辨率的动漫图像和视频,其模型代码已经开源,并且有免费的在线 Demo 可以体验。试了一下效果的确非常不错,可以有效提升线条细节的清晰度,并且色彩的还原度也…
-
MuseV – 数字虚拟人视频生成AI工具,一键整合包,开箱即用,腾讯天琴实验室开源
一、MuseV是什么? MuseV是一个由腾讯音乐娱乐的天琴实验室开源的虚拟人视频生成框架,专注于生成高质量的虚拟人视频和口型同步。它利用先进的算法,能够制作出具有高度一致性和自然表情的长视频内容。MuseV支持自定义动作和风格,视频时长理论上无限,且生成速度快。这一技术在AI创作领域中表现出色,为虚拟人视频制作提供了新的可能性。 二、MuseV的网站地址: 1、Github开源地址: https… -
ProPainter – 专业视频修复去水印AI工具,可以抹除视频中的静态水印、动态物体/人物,效果出色~
ProPainter是一个基于E2FGVI实现的AI视频编辑工具,它可以一键移除视频内的移动物体和水印。这个开源项目提供了一个简单而强大的解决方案,帮助用户轻松编辑和改善视频内容。 一、ProPainter是什么? ProPainter 是一个用于视频修复的先进模型。它结合了增强的传播和 Transformer 机制,能够快速高效地进行视频修复、对象去除、水印去除等任务。ProPainter 通过… -
DiffSynth Studio – 专业视频“三渲二”风格转绘/换衣,递进式AI绘图工具,最佳DomoAI本地平替,国内B站大神开源~
在数字内容创作的领域,扩散模型已经崭露头角,成为图像合成技术中的一股不可忽视的力量。然而,当这些模型被应用到视频合成时,它们往往面临着一系列挑战,比如内容闪烁等问题。针对这一问题,最新研发的 DiffSynth 方法便应运而生,它将图像合成技术巧妙地延伸至视频领域,取得了令人瞩目的成果。 一、DiffSynth Studio是什么? DiffSynth Studio 不仅仅是一个工具,它融合了多项… -
Video Subtitle Remover – 前沿VSR视频硬字幕去除AI工具,影视剪辑爱好者有福了~
引领科技前沿的Video-subtitle-remover(VSR)工具,专为那些希望清除视频中硬编码字幕的用户设计。借助尖端AI技术,VSR不仅仅是移除字幕那么简单,它还能够: 无损分辨率将视频中的硬字幕去除,生成去除字幕后的文件 通过超强AI算法模型,对去除字幕文本的区域进行填充(非相邻像素填充与马赛克去除) 支持自定义字幕位置,仅去除定义位置中的字幕(传入位置) 支持全视频自动去除所有文本(… -
Wav2Lip – 使用AI听音同步人物面部口型,AI虚拟主播数字人工具整合包
Wav2Lip适用于任何人脸、任何语言,对任意视频都能达到很高都准确率,可以无缝地与原始视频融合,还可以用于转换动画人脸。 一、Wav2Lip是什么? Wav2Lip实现的是视频人物根据输入音频生成与语音同步的人物唇形,使得生成的视频人物口型与输入语音同步。Wav2Lip不仅可以基于静态图像来输出与目标语音匹配的唇形同步视频,还可以直接将动态的视频进行唇形转换,输出与目标语音匹配的视频。Wav2L… -
VideoReTalking – 虚拟数字人视频AI工具整合包,同步音频嘴型/面部表情,腾讯出品~
你只需要输入任意一个视频和一个音频文件,它能给你生成一个新的视频,在这个视频里,人物的嘴型会与音频同步。VideoReTalking不仅可以让嘴型与声音同步,还可以根据声音改变视频中人物的表情。整个过程不需要用户干预,都是自动完成的。 一、什么是VideoReTalking? VideoReTalking,这是一种新的AI系统,可以根据输入音频编辑现实世界中头部说话视频的面孔,即使具有不同的情绪,… -
DynamiCrafter – 图片转动画视频AI工具,腾讯出品
一、DynamiCrafter是什么? DynamiCrafter是一款由腾讯、北大等人开发的图像动画工具。通过利用预训练的视频扩散先验,可以基于文本提示为开放域的静止图像添加动画效果。该工具支持高分辨率模型,提供更好的动态效果、更高的分辨率和更强的一致性。 二、DynamiCrafter开源地址: 1、Github仓库: https://github.com/Doubiiu/DynamiCraf… -
Luna AI – 国内本土顶尖全自动数字人AI虚拟直播系统
一、Luna AI是什么? Luna AI 是一款结合了最先进技术的虚拟AI主播。它的核心是一系列高效的人工智能模型,包括 ChatterBot、GPT、Claude、langchain、chatglm、text-generation-webui、讯飞星火、智谱AI、谷歌Bard、文心一言、通义星尘、千帆大模型、Gemini、Kimi Chat、QAnything、kobold…
🎵AI声音工具
-
Suno AI – 重量级颠覆传统认知的AI音乐制作平台,一键制作你的专属音乐,轻松实现文本转歌曲,媲美真实歌手!
一、Suno AI是什么? Suno AI是一款强大的人工智能音乐生成器,由 Anthropic 公司开发完成。 可以将文本转化为高度逼真的音乐和语音。该系统包括多种音乐风格,如电影、RAP、翻唱等,并提供了多语言和不同性别的播音员选择。用户可以使用命令来生成音频并进行个性化设置。它支持英文、中文等 50 种语言,可以在网站和 Discord 双平台上使用。 新用户有 250 个免费积分,可以生成… -
VALL-E – 微软最强AI声音克隆工具,免训练,免安装,本地整合包,三秒偷走你的声音~
该模型支持多种语言(英语、中文和日语)和零样本语音克隆,你只需要提供一个人短短几秒钟的录音(3-10秒),就能模仿出那个人的声音。此外,它还具有语音情感控制和口音控制等高级功能。同时相对于其他模型,它更轻量、更快速… 一、VALL-E是什么? Vall-E AI是微软开发的一款基于人工智能的文本到语音转换器。该工具将文本输入转换为音频,并将其与人的情绪和房间的声学效果相匹配。它可以使用三秒的短音频… -
Bark – 高度逼真的开源文本转语音AI工具,最强TTS本地整合包
Bark是一个开源的文本转语音的AI模型。Bark 可以生成高度逼真的多语言语音以及其他音频 - 包括音乐、背景噪音和简单的音效。该模型可以模拟正常说话口气的语音,如笑、叹息和哭泣。支持多语言,包括中文。 一、Bark的项目地址: 1、论文地址: https://arxiv.org/abs/2209.03143 2、Github仓库: https://github.com/suno-ai/bark… -
GPT SoVITS WebUI – 快速声音AI克隆工具,完美复刻任何角色的语音、语调、语气!
语音技术在人工智能的驱动下,正在以前所未有的速度推进。GPT-SoVITS-WebUI正是这一变革的先驱它利用少量的声音源,可以快速地训练出一个语音合成(Text-to-Speech,简称TTS)模型。 这个强大的Web界面工具不仅提供了零次学习和少量次学习的文本到语音(TTS)功能,还支持跨语言的语音转换,为语音技术的爱好者和开发者打开了一扇新的大门。 一、GPT SoVITS WebUI的功能… -
EmotiVoice易魔声 – 爆火国产文本转语音AI工具,支持中英文,具有情绪控制功能~
网易有道AI算法团队也开源了一款国产TTS语音合成引擎EmotiVoice,刚上线仅一周时间就暴涨4200颗星,问鼎当周GitHub trending流行榜第一。而如今已冲到了 4.5k Star。 一、EmotiVoice是什么? EmotiVoice是一款功能强大且现代的开源文本转语音引擎,您可以免费使用。EmotiVoice 提供中英文两种语言,超过 2000 种不同的语音。最突出的功能是情… -
Bert-VITS 2 – 爆杀原版?原神&星穹铁道全角色文本转语音AI工具,栩栩如生,声色克隆,原神启动!
为游戏爱好者们带来一款新的体验工具,原神&星穹铁道全角色文本转语音AI工具。该工具基于先进的BERT-VITS模型,这是一种结合了Transformer架构的语音合成技术。BERT-VITS模型通过深度学习,能捕捉到不同音色的独特属性,并能够实现高度个性化的语音合成效果。这款整合包特别支持多角色对话模式,让用户能够体验到更加丰富和真实的交互对话。 一、Bert-VITS 2是什么? BER… -
AudioCraft – 顶级音乐生成AI工具,来自Meta AI免费开源,音乐效果媲美音乐家作品~
一、AudioCraft是什么? AudioCraft是Meta AI免费开源的一款深度学习进行音频处理和生成的库。可满足您所有的生成音频需求:音乐、音效以及原始音频信号训练后的压缩。 它具有最先进的EnCodec音频压缩器/标记器,沿着MusicGen,一个简单可控的音乐生成LM,具有文本和旋律调节。 素材训练使用2万小时的授权音乐来训练MusicGen。 二、AudioCraft的项目地址: … -
MeloTTS – 高质量实时文本转语音AI工具,支持多国语言,同时兼容GPU/CPU
一、MeloTTS是什么? MeloTTS 是一个强大的多语言文本转语音库,特别设计以支持CPU环境下的实时语音合成,无需依赖GPU。该库能够输出自然流畅的语音,提供了一种高效便捷的方式,将文本信息转换为听觉内容。 MeloTTS不仅支持多种语言,包括英语、西班牙语、法语、中文、日语和韩语,还能处理混合语言文本,如含有英语单词的中文文本。此外,用户还可以根据需求调整语速,选择不同的发音口音,如美式…
-
Genie – 史诗级文生高精度3D模型AI工具,Luma AI旗下产品,免费在线使用~
3D版Midjourney来了?Luma AI发布Genie,生成手办只需10秒 随着生成式 AI 的浪潮席卷而来,科技公司都在冲击 AIGC 的下一个突破口 —— 3D 生成。目前,文生 3D 在学术界取得了许多新突破。在产业界,无论是像英伟达这样的行业巨头,还是像 Stability AI 这样的中坚力量,都推出了自己的文生 3D 工具。虽然 3D 生成领域一直「卷」到飞起,但是好像一直没有出… -
Bark – 高度逼真的开源文本转语音AI工具,最强TTS本地整合包
Bark是一个开源的文本转语音的AI模型。Bark 可以生成高度逼真的多语言语音以及其他音频 - 包括音乐、背景噪音和简单的音效。该模型可以模拟正常说话口气的语音,如笑、叹息和哭泣。支持多语言,包括中文。 一、Bark的项目地址: 1、论文地址: https://arxiv.org/abs/2209.03143 2、Github仓库: https://github.com/suno-ai/bark… -
Catjourney – 专业收录高质量AI绘画提示词网站,值得收藏~
Catjourney可以帮助您快速生成美观、实用、可重复使用的AI图像。您可以复制提示以在您最喜欢的图像生成工具中生成图像,无论是Midjourney、Firefly还是DALL-E。每周都会发布各种类型的新提示和图像。 一、Catjourney是什么? Catjourney 是由 @歸藏 和 @ LysonOber 联合开发的一个提示词网站,专门收录高质量的 AI 绘画提示词,可以一键复制并用于… -
GFPGAN – 老照片人脸修复AI工具本地整合包,腾讯团队出品~
在数字时代,老照片的修复和保存成为了一项挑战性的任务。幸运的是,随着人工智能技术的发展,我们现在能够以前所未有的方式恢复这些珍贵的回忆。GFPGAN,由腾讯开源,代表了这一技术进步的前沿。这款先进的人脸修复算法不仅仅是一个工具,它集成了一系列的先验知识,以支持对老旧照片中的人脸进行高效、自动化的修复。 通过使用预训练的模型,GFPGAN能够处理所谓的“盲脸”(blind face)修复任务,即在没… -
Wisdom Interrogatory 智海录问 – 本地私人法律顾问, 阿里巴巴大模型,本地整合包
8月21日,由中国工程院院刊《Engineering》、中国人工智能学会、中国工程院院刊信息与电子工程领域分刊《FITEE》联合主办的Engineering大讲堂暨“智行中国”第五期系列论坛在浙江大学举行,论坛围绕基座模型基础理论、AI+X垂直领域赋能应用及基座模型评测体系等问题邀请领域专家展开了深入探讨。在论坛上,由浙江大学联合阿里云、华院计算联合研制面向司法领域开源开放的法律大模型——智海-录… -
CharacterGLM-6B – 角色扮演AI大模型,本地整合包,你会和佟掌柜来一场恋爱,还是跟张起灵一起去古墓探险呢?
为了满足不同用户的需求,CharacterGLM设计并定制了多种角色,覆盖了名人类、生活类、游戏影音类和虚拟恋爱类等多个领域。 一、CharacterGLM-6B模型介绍: CharacterGLM-6B 是 聆心智能和清华大学 CoAI 实验室联合发布的新一代对话预训练模型。CharacterGLM-6B 是 基于 ChatGLM2 系列中的开源模型,在保留了前两代模型对话流畅、部署门槛低等众多… -
Image to Line Drawings – 图片一键转素描线稿AI工具
一、Image to Line Drawings是什么? 在传统艺术学习过程中,绘制一幅素描作品往往需要耗费大量时间和精力。然而,在AI的帮助下,这一过程可以被大幅简化。本文介绍的Image to Line Drawings整合包,便是这样一个工具,它能够帮助用户迅速将普通图片转换成素描风格的线条图。 二、Image to Line Drawing如何使用? 为了让更多用户能够轻松体验这一技术,我… -
CSM 3D – 波士顿AI初创公司3D模型生成AI工具,图片秒变3D,有手就会的AI建模神器~
在AI领域的持续创新中,3D建模一直是等待着自己的"ChatGPT"时刻。 一、CSM 3D 是什么? CSM全称 Common Sense Machines,来自普纳的前 Google DeepMind 研究科学家 Tejas Kulkarni 与他人共同创立。这是一家位于波士顿的人工智能初创公司,旨在彻底改变 3D 生成人工智能平台。支持从视频和图像创建 3D 模型,最新上… -
Adobe Premiere Pro 将支持 AI 视频编辑功能! 可接入 Sora、Runwa 等模型
Adobe 也宣布将为其旗下的专业视频编辑软件 Premiere Pro 接入一系列生成式 AI 功能,包括添加对象、删除对象、视频内容延长以及根据文本生成视频,为用户提供更便捷精准地视频编辑服务。 Adobe Premiere Pro的AI功能: 1、视频生成Video Generate: AI 技术目前在视频生成领域有广泛应用,出现了很多成熟的工具,比如 Sora、Runway、Pi… -
Ideogram – 比Midjourney更好用的AI绘画工具,能准确生成文本内容!轻松搞定LOGO,无需魔法,免费使用~
一家名为Ideogram的AI生成式图像创业公司宣布获得了由a16z和Index Ventures领投的1650万美元种子轮融资。 一直以来,Midjourney 稳坐AIGC文生图的王座,少有威胁,直到这家公司的出现。 8 月 23 日,生成式人工智能创业公司 Ideogram AI 正式官宣:「我们正在开发最先进的人工智能工具,使创意表达变得更容易、更有趣、更高效。」 一、Ideogram是什… -
Stable Audio – 革命性AI音乐/音效生成工具,Stability AI旗下又一重磅产品,音乐人的噩梦~
在Stable Audio 我们可以免费体验其文生音乐功能。只需先填写提示词,然后设置时长,点击 Generate 后等待 30 秒左右就完成了,拿来做视频的背景音乐完全没有问题。写提示词时记得要详细描述你想要的风格流派、乐器以及相关的情绪和氛围细节,可以多用描述性的短语。 一、Stable Audio是什么? Stable Audio是Stability AI 推出的AI生成音乐平台,你只需要输… -
FlowGPT – ChatGPT提示词专业分享平台,提供训练有素的AI角色,现已兼容主流AI大模型~
一、FlowGPT是什么? FlowGPT 是一个AI驱动的GPTs的应用商店平台,允许用户分享和发现 AI 提示。 AI 提示向 ChatGPT 等 AI 模型发出指令,生成文本、翻译语言、编写不同类型的创意内容或者以信息丰富的方式回答您的问题。 当用户在 FlowGPT 上共享 AI 提示时,该提示将被添加到平台的提示库中。然后,其他用户可以找到并使用此提示来生成文本、翻译语言、编写… -
Jamba – 首个基于Mamba架构的生产级别大语言模型,AI21 Labs开源
首次推出基于 Mamba 的生产级模型,提供一流的质量和性能。 一、Jamba是什么? Jamba是由AI21 Labs推出的首个基于Mamba架构的生产级别的大语言模型,目前大部分的大模型(如GPT、Gemini 和 Llama)都是基于 Transformer 结构。而 Jamba 结合了 Mamba 结构化状态空间模型(SSM)和 传统Transformer 架构,兼具了高质量输出、高吞吐量… -
Stable Diffusion 秋叶整合包v4.6 – 解压即用,防爆显存,快速入门AI绘画
Stable Diffusion秋叶整合包,超简单一键安装Stable Diffusion,无任何使用门槛,完全免费使用,支持Nvdia全系列显卡 来自B站up@秋葉aaaki,近期发布了Stable Diffusion整合包v4版本,一键在本地部署Stable Diffusion!! 适用于零基础想要使用AI绘画的小伙伴~ Stable Diffusion(SD)是什么? Stable Diff… -
OOTDiffusion – 本地整合包,一键完美AI换装,虚拟换衣服不再困难,效果超神,支持半身,全身!!!
OOTDiffusion 支持上半身、全身的换装,如果你想要自定义模特或者衣服,需要自己提供背景干净的模特或者衣服模型。对于从事服装销售的行业来说,完全可以依赖AI 虚拟换装的方式生成营销宣传海报,无需聘请高昂的模特和拍摄费用,这是一个低成本的试装方案。 一、OOTDiffusion是什么? OOTDiffusion是一种基于潜在扩散的虚拟试穿技术,其主要目的是通过实现控制性的换装融合,让用户能够… -
🧠Awesome ChatGPT Prompts – AI对话角色提示语生成器,让你更高效的使用ChatGPT~
在人工智能技术的星空中,ChatGPT无疑是一颗璀璨的明星。这款由OpenAI研发的人工智能聊天机器人,以其强大的对话能力,赢得了广泛的关注和好评。ChatGPT能够流畅地与用户进行交流,并且在多种场景下提供帮助。 一、Awesome ChatGPT Prompts是什么? Awesome ChatGPT Prompts专门服务于ChatGPT,众所周知ChatGPT要充分发挥其潜力,合理的提示词…