山鲸AI
无数可心AI Tool,
助你总有新发现。
🔥热门工具
-
Suno AI – 重量级颠覆传统认知的AI音乐制作平台,一键制作你的专属音乐,轻松实现文本转歌曲,媲美真实歌手!
一、Suno AI是什么? Suno AI是一款强大的人工智能音乐生成器,由 Anthropic 公司开发完成。 可以将文本转化为高度逼真的音乐和语音。该系统包括多种音乐风格,如电影、RAP、翻唱等,并提供了多语言和不同性别的播音员选择。用户可以使用命令来生成音频并进行个性化设置。它支持英文、中文等 50 种语言,可以在网站和 Discord 双平台上使用。 新用户有 250 个免费积分,可以生成… -
SDXL-Light – 目前最快文生图AI模型,让AI出图速度提升 10 倍!
生成式人工智能技术已成为业界的焦点,它能够根据文本提示创造出图像或视频。目前的先进模型依赖于一个耗时的扩散过程来生成单一图像,可能需要5秒钟,并且要多次调用庞大的神经网络。因此,研究的热点是如何在保证图像质量的同时,加快图像的生成速度。 一、SDXL-Lightning是什么? SDXL-Lightning 模型是从 Stability AI 的 stable-diffusion-xl-base-… -
MuseV – 数字虚拟人视频生成AI工具,一键整合包,开箱即用,腾讯天琴实验室开源
一、MuseV是什么? MuseV是一个由腾讯音乐娱乐的天琴实验室开源的虚拟人视频生成框架,专注于生成高质量的虚拟人视频和口型同步。它利用先进的算法,能够制作出具有高度一致性和自然表情的长视频内容。MuseV支持自定义动作和风格,视频时长理论上无限,且生成速度快。这一技术在AI创作领域中表现出色,为虚拟人视频制作提供了新的可能性。 二、MuseV的网站地址: 1、Github开源地址: https… -
TripoSR – 快速单图生成3D模型,1秒完成,本地部署包,Stability AI与华人团队联合开源
TripoSR 的开发灵感来源于LRM(Large Reconstruction Models)的最新研究成果,即通过单一图像实现复杂三维结构的重建。这一突破性的图像到3D模型转换技术,旨在满足娱乐、游戏、工业设计以及建筑行业专业人士对高效3D建模工具的需求,通过快速响应输出,实现3D模型细节的精确可视化。 在性能测试中,TripoSR 在Nvidia A100硬件平台上运行仅需约0.5秒即可生成… -
OOTDiffusion – 本地整合包,一键完美AI换装,虚拟换衣服不再困难,效果超神,支持半身,全身!!!
OOTDiffusion 支持上半身、全身的换装,如果你想要自定义模特或者衣服,需要自己提供背景干净的模特或者衣服模型。对于从事服装销售的行业来说,完全可以依赖AI 虚拟换装的方式生成营销宣传海报,无需聘请高昂的模特和拍摄费用,这是一个低成本的试装方案。 一、OOTDiffusion是什么? OOTDiffusion是一种基于潜在扩散的虚拟试穿技术,其主要目的是通过实现控制性的换装融合,让用户能够… -
ComflowySpace – 开箱即用的ComfyUI客户端,MacOS用户的福音~
有在使用 Mac 电脑又想使用 ComfyUI,但因为安装困难而放弃的朋友吗? 开源AI图像和视频生成工具值得更好的交互设计体验,而不仅仅是WebUI和ComfyUI的原生外观。很多人不愿意学习或参与AI生成浪潮,因为工具门槛太高。这正是我们想要解决的问题。因此,我们认为应该创建一个更加用户友好和有用的AI图像和视频生成工具,ComflowySpace。 ComflowySpace的目标是做出人人…
🥕最新收录
-
remove.bg – 专业图片背景移除在线工具,自动抠图,3秒完成!可免费使用~
近几年remove.bg一度刷屏互联网行业,其号称只需要上传一张带有人像的照片,它就会帮你自动抠掉背景,全自动、5秒完成。可以起到辅助作用,节省了大量人工操作。 一、remove.bg 是什么? Remove.bg 是一款功能强大的在线抠图工具,将想要抠去背景的图片上传,网站就会自动抠去背景,整个过程完全不需要手动操作,简单易上手,可以弥补 Midjourney 和 Stable diffusio… -
InsightFaceSwap – 超快速精准换脸AI工具,效果恐怖如斯,实现你的一切童年幻想!Midjourney最强伴侣插件~
对于很多小伙伴来说,都使用 Midjourney 制作过个人头像,这也是目前变现方式之一。但在生成头像的时候往往难以控制,做到和照片“很像”。InsightFaceSwap 这款插件,它支持精准替换人物面貌,而不改变图片中的其他内容,可以更好地帮助你解决这个问题。 一、InsightFaceSwap 是什么? InsightFaceSwap 是一款基于深度学习的人脸交换工具,它可以将两张人脸图片进… -
D-ID – 全球最专业最全面的数字人视频生成AI工具,真人口播,三分钟打造超炫虚拟数字人,开启逼真数字人新时代~
随着人工智能技术的不断发展,我们逐渐迈入了一个全新的数字时代。在这个时代,人们可以通过创造性的方式与虚拟现实相结合,创造出惊人的数字人物。其中,Creative Reality Studio (D-ID) 是一家提供 AI 拟真人视频产品服务和开发的公司,其独特的技术让用户能够以惊人逼真的方式与数字人物进行互动。本文将介绍D-ID的技术原理和使用技巧,带您领略数字时代的无限可能性。 一、D-ID … -
GitLab Duo Chat – 人工智能编程助理,GitLab旗下最新产品,开发者新宠儿,AI时代利器,助力程序员提高开发效率
一、GitLab Duo Chat是什么? Duo Chat 是源代码管理平台 GitLab 推出的一款集成了人工智能(AI)的对话式编程助手,旨在通过自然语言交互为工程和非工程用户提供实时指导。该AI编程工具支持整个软件开发生命周期,帮助团队提高代码理解速度、增强协作能力,并快速掌握 GitLab 的使用。Duo Chat 能够解释代码、重构代码、生成测试,以及提供代码建议,从而提升开发效率和代… -
LeiaPix – 专业2D图片转3D裸眼动画特效AI工具,让您的图片栩栩如生,打破视觉界限!
随着科技的发展,人工智能在图像处理方面展现了强大的能力。LeiaPix Converter就是一个使用AI技术,可以非常容易地将普通2D图片转换成3D动画的免费在线工具。在本文中,我将为您详细介绍如何使用LeiaPix Converter的各项功能,将静态图片转换成栩栩如生的3D动画。 一、LeiaPix 是什么? LeiaPix是一个基于网络的创新人工智能平台,能够将2D照片转3D效果的实用AI… -
Vector Magic – 超级好用的位图转矢量AI工具,中文破解版,轻松驾驭Mac与Win双平台~
@你丫才美工 :推荐一个超好用的软件,位图秒转矢量图!真的是秒转哦!软件的名字叫:Vector Magic,转矢量最强软件!试用之后真的超级厉害的!转出来的文件,锚点少,曲线平滑 还原度高,简直设计师必备!以后素材不够大都靠它啦!已打包,赶紧来拿! 在数字化时代,图像已经成为我们生活和工作中不可或缺的一部分。无论是设计师、艺术家,还是普通用户,都对图像质量有着极高的要求。而矢量图像,以其清晰度高、…
-
RunDiffusion – 托管式SD绘画聚合云平台,OpenAI旗下产品, 整合所有Stable Diffusion绘画工具,不用再到处找云端了~
RunDiffusion 是一个专注于 SD 及开源生态的 AI 工具平台,提供 Stable Diffuison WebUI / ComfyUI / WebUI Forge / Fooocus / SD.next 等多款 SD 操作界面的线上使用,并拥有相对完整的插件配置。如果你是非 N 卡用户,或者因为电脑显存不足导致自己无法顺利使用 SD 软件,那么 RunDiffusion 是一个不错的选… -
NovelAI – 专注二次元漫画AI绘画工具,本地部署,一键免费使用
大家近几个月应该都听说过了,大批画师感叹要失业了,当然,就目前来看,这一言论还不太符合实际,但是究竟为什么让画师们这么震惊呢? 一、NovelAI是什么? NovelAI 是一项在线云端的订阅服务,它使用人工智能算法来协助作者、讲故事和虚拟陪伴。它提供了诸如文本到图像AI艺术生成器和生成新概念和情节线等功能。该服务于2021年6月在beta版中推出,并在2022年10月添加了图像生成功能。它由位于… -
DDColor – 阿里AI老照片上色一键修复工具
一、什么是DDColor? 🎨DDColor 是最新的 SOTA 图像上色算法,能够对输入的黑白图像生成自然生动的彩色结果,使用 UNet 结构的骨干网络和图像解码器分别实现图像特征提取和特征图上采样,并利用 Transformer 结构的颜色解码器完成基于视觉语义的颜色查询,最终聚合输出彩色通道预测结果。 🪄 DDColor 可以为历史黑白老照片提供生动自然的着色。 🎲 它甚至可以对动漫游戏中的… -
Osprey – 首个像素级别的区域图像分析多模态AI工具
A part of Along the River During the Qingming Festival (清明上河图) Spirited Away (千与千寻) Osprey 是一款创新图像分析AI工具,旨在提升大型语言模型(LLM)对图像的理解能力,精确到像素级别。它使用户能够在图像上选择特定区域,并对这些区域进行深入分析和识别。 一、什么是Osprey? Osprey 是一种掩码文本指令… -
remove.bg – 专业图片背景移除在线工具,自动抠图,3秒完成!可免费使用~
近几年remove.bg一度刷屏互联网行业,其号称只需要上传一张带有人像的照片,它就会帮你自动抠掉背景,全自动、5秒完成。可以起到辅助作用,节省了大量人工操作。 一、remove.bg 是什么? Remove.bg 是一款功能强大的在线抠图工具,将想要抠去背景的图片上传,网站就会自动抠去背景,整个过程完全不需要手动操作,简单易上手,可以弥补 Midjourney 和 Stable diffusio… -
Lama Cleaner – 一键去水印、去人物、去背景AI工具,本地整合包,修复老照片,轻松去除旅行照片中的路人~
这是一款 AI 修复神器,对于照片中不想要的东西,我们只需要简单涂抹,后台就会自动抹去对应的部分且尽量让抹去的部分和周围的环境相融合。 比如想去个图片的水印,自拍照去掉背景中杂乱的人物或事物,都可以用这款软件帮到你。 就连有破损的老照片也能修复,让我们一起探索它的更多功能。 一、Lama Cleaner是什么? Lama Cleaner是一款开源的去水印工具,专为Windows平台设计。它采用了先… -
GFPGAN – 老照片人脸修复AI工具本地整合包,腾讯团队出品~
在数字时代,老照片的修复和保存成为了一项挑战性的任务。幸运的是,随着人工智能技术的发展,我们现在能够以前所未有的方式恢复这些珍贵的回忆。GFPGAN,由腾讯开源,代表了这一技术进步的前沿。这款先进的人脸修复算法不仅仅是一个工具,它集成了一系列的先验知识,以支持对老旧照片中的人脸进行高效、自动化的修复。 通过使用预训练的模型,GFPGAN能够处理所谓的“盲脸”(blind face)修复任务,即在没… -
DeNoise AI – 完美图像智能降噪锐化AI工具,支持Win/MacOS,中文汉化,一键解决图片噪点问题,重拾图片纯净之美~
在数字摄影时代,我们常常会遇到图片噪点过多的问题,这不仅影响了图片的清晰度,还使得照片的艺术性和观赏性大打折扣。然而,借助Topaz DeNoise AI这一革命性的图片降噪软件,您将能够轻松解决这一问题,重拾图片纯净之美。 一、DeNoise AI 是什么? DeNoise AI 是 Topaz Labs 旗下一款基于人工智能技术的图片降噪软件。相较于传统降噪工具,DeNoise AI…
-
MuseV – 数字虚拟人视频生成AI工具,一键整合包,开箱即用,腾讯天琴实验室开源
一、MuseV是什么? MuseV是一个由腾讯音乐娱乐的天琴实验室开源的虚拟人视频生成框架,专注于生成高质量的虚拟人视频和口型同步。它利用先进的算法,能够制作出具有高度一致性和自然表情的长视频内容。MuseV支持自定义动作和风格,视频时长理论上无限,且生成速度快。这一技术在AI创作领域中表现出色,为虚拟人视频制作提供了新的可能性。 二、MuseV的网站地址: 1、Github开源地址: https… -
ProPainter – 专业视频修复去水印AI工具,可以抹除视频中的静态水印、动态物体/人物,效果出色~
ProPainter是一个基于E2FGVI实现的AI视频编辑工具,它可以一键移除视频内的移动物体和水印。这个开源项目提供了一个简单而强大的解决方案,帮助用户轻松编辑和改善视频内容。 一、ProPainter是什么? ProPainter 是一个用于视频修复的先进模型。它结合了增强的传播和 Transformer 机制,能够快速高效地进行视频修复、对象去除、水印去除等任务。ProPainter 通过… -
DiffSynth Studio – 专业视频“三渲二”风格转绘/换衣,递进式AI绘图工具,最佳DomoAI本地平替,国内B站大神开源~
在数字内容创作的领域,扩散模型已经崭露头角,成为图像合成技术中的一股不可忽视的力量。然而,当这些模型被应用到视频合成时,它们往往面临着一系列挑战,比如内容闪烁等问题。针对这一问题,最新研发的 DiffSynth 方法便应运而生,它将图像合成技术巧妙地延伸至视频领域,取得了令人瞩目的成果。 一、DiffSynth Studio是什么? DiffSynth Studio 不仅仅是一个工具,它融合了多项… -
Video Subtitle Remover – 前沿VSR视频硬字幕去除AI工具,影视剪辑爱好者有福了~
引领科技前沿的Video-subtitle-remover(VSR)工具,专为那些希望清除视频中硬编码字幕的用户设计。借助尖端AI技术,VSR不仅仅是移除字幕那么简单,它还能够: 无损分辨率将视频中的硬字幕去除,生成去除字幕后的文件 通过超强AI算法模型,对去除字幕文本的区域进行填充(非相邻像素填充与马赛克去除) 支持自定义字幕位置,仅去除定义位置中的字幕(传入位置) 支持全视频自动去除所有文本(… -
Wav2Lip – 使用AI听音同步人物面部口型,AI虚拟主播数字人工具整合包
Wav2Lip适用于任何人脸、任何语言,对任意视频都能达到很高都准确率,可以无缝地与原始视频融合,还可以用于转换动画人脸。 一、Wav2Lip是什么? Wav2Lip实现的是视频人物根据输入音频生成与语音同步的人物唇形,使得生成的视频人物口型与输入语音同步。Wav2Lip不仅可以基于静态图像来输出与目标语音匹配的唇形同步视频,还可以直接将动态的视频进行唇形转换,输出与目标语音匹配的视频。Wav2L… -
VideoReTalking – 虚拟数字人视频AI工具整合包,同步音频嘴型/面部表情,腾讯出品~
你只需要输入任意一个视频和一个音频文件,它能给你生成一个新的视频,在这个视频里,人物的嘴型会与音频同步。VideoReTalking不仅可以让嘴型与声音同步,还可以根据声音改变视频中人物的表情。整个过程不需要用户干预,都是自动完成的。 一、什么是VideoReTalking? VideoReTalking,这是一种新的AI系统,可以根据输入音频编辑现实世界中头部说话视频的面孔,即使具有不同的情绪,… -
DynamiCrafter – 图片转动画视频AI工具,腾讯出品
一、DynamiCrafter是什么? DynamiCrafter是一款由腾讯、北大等人开发的图像动画工具。通过利用预训练的视频扩散先验,可以基于文本提示为开放域的静止图像添加动画效果。该工具支持高分辨率模型,提供更好的动态效果、更高的分辨率和更强的一致性。 二、DynamiCrafter开源地址: 1、Github仓库: https://github.com/Doubiiu/DynamiCraf… -
Luna AI – 国内本土顶尖全自动数字人AI虚拟直播系统
一、Luna AI是什么? Luna AI 是一款结合了最先进技术的虚拟AI主播。它的核心是一系列高效的人工智能模型,包括 ChatterBot、GPT、Claude、langchain、chatglm、text-generation-webui、讯飞星火、智谱AI、谷歌Bard、文心一言、通义星尘、千帆大模型、Gemini、Kimi Chat、QAnything、kobold…
🎵AI声音工具
-
Suno AI – 重量级颠覆传统认知的AI音乐制作平台,一键制作你的专属音乐,轻松实现文本转歌曲,媲美真实歌手!
一、Suno AI是什么? Suno AI是一款强大的人工智能音乐生成器,由 Anthropic 公司开发完成。 可以将文本转化为高度逼真的音乐和语音。该系统包括多种音乐风格,如电影、RAP、翻唱等,并提供了多语言和不同性别的播音员选择。用户可以使用命令来生成音频并进行个性化设置。它支持英文、中文等 50 种语言,可以在网站和 Discord 双平台上使用。 新用户有 250 个免费积分,可以生成… -
VALL-E – 微软最强AI声音克隆工具,免训练,免安装,本地整合包,三秒偷走你的声音~
该模型支持多种语言(英语、中文和日语)和零样本语音克隆,你只需要提供一个人短短几秒钟的录音(3-10秒),就能模仿出那个人的声音。此外,它还具有语音情感控制和口音控制等高级功能。同时相对于其他模型,它更轻量、更快速… 一、VALL-E是什么? Vall-E AI是微软开发的一款基于人工智能的文本到语音转换器。该工具将文本输入转换为音频,并将其与人的情绪和房间的声学效果相匹配。它可以使用三秒的短音频… -
GPT SoVITS WebUI – 快速声音AI克隆工具,完美复刻任何角色的语音、语调、语气!
语音技术在人工智能的驱动下,正在以前所未有的速度推进。GPT-SoVITS-WebUI正是这一变革的先驱它利用少量的声音源,可以快速地训练出一个语音合成(Text-to-Speech,简称TTS)模型。 这个强大的Web界面工具不仅提供了零次学习和少量次学习的文本到语音(TTS)功能,还支持跨语言的语音转换,为语音技术的爱好者和开发者打开了一扇新的大门。 一、GPT SoVITS WebUI的功能… -
Bark – 高度逼真的开源文本转语音AI工具,最强TTS本地整合包
Bark是一个开源的文本转语音的AI模型。Bark 可以生成高度逼真的多语言语音以及其他音频 - 包括音乐、背景噪音和简单的音效。该模型可以模拟正常说话口气的语音,如笑、叹息和哭泣。支持多语言,包括中文。 一、Bark的项目地址: 1、论文地址: https://arxiv.org/abs/2209.03143 2、Github仓库: https://github.com/suno-ai/bark… -
EmotiVoice易魔声 – 爆火国产文本转语音AI工具,支持中英文,具有情绪控制功能~
网易有道AI算法团队也开源了一款国产TTS语音合成引擎EmotiVoice,刚上线仅一周时间就暴涨4200颗星,问鼎当周GitHub trending流行榜第一。而如今已冲到了 4.5k Star。 一、EmotiVoice是什么? EmotiVoice是一款功能强大且现代的开源文本转语音引擎,您可以免费使用。EmotiVoice 提供中英文两种语言,超过 2000 种不同的语音。最突出的功能是情… -
Bert-VITS 2 – 爆杀原版?原神&星穹铁道全角色文本转语音AI工具,栩栩如生,声色克隆,原神启动!
为游戏爱好者们带来一款新的体验工具,原神&星穹铁道全角色文本转语音AI工具。该工具基于先进的BERT-VITS模型,这是一种结合了Transformer架构的语音合成技术。BERT-VITS模型通过深度学习,能捕捉到不同音色的独特属性,并能够实现高度个性化的语音合成效果。这款整合包特别支持多角色对话模式,让用户能够体验到更加丰富和真实的交互对话。 一、Bert-VITS 2是什么? BER… -
AudioCraft – 顶级音乐生成AI工具,来自Meta AI免费开源,音乐效果媲美音乐家作品~
一、AudioCraft是什么? AudioCraft是Meta AI免费开源的一款深度学习进行音频处理和生成的库。可满足您所有的生成音频需求:音乐、音效以及原始音频信号训练后的压缩。 它具有最先进的EnCodec音频压缩器/标记器,沿着MusicGen,一个简单可控的音乐生成LM,具有文本和旋律调节。 素材训练使用2万小时的授权音乐来训练MusicGen。 二、AudioCraft的项目地址: … -
MeloTTS – 高质量实时文本转语音AI工具,支持多国语言,同时兼容GPU/CPU
一、MeloTTS是什么? MeloTTS 是一个强大的多语言文本转语音库,特别设计以支持CPU环境下的实时语音合成,无需依赖GPU。该库能够输出自然流畅的语音,提供了一种高效便捷的方式,将文本信息转换为听觉内容。 MeloTTS不仅支持多种语言,包括英语、西班牙语、法语、中文、日语和韩语,还能处理混合语言文本,如含有英语单词的中文文本。此外,用户还可以根据需求调整语速,选择不同的发音口音,如美式…
-
OpenVoice – 专业即时语音克隆复制AI工具,免训练,免部署,一键使用
多功能的即时语音克隆AI工具,只需要参考说话者的一个简短的音频剪辑即可复制他们的声音并生成多种语言的语音。除了复制参考说话者的音色之外,OpenVoice 还可以对语音风格进行精细控制,包括情感、口音、节奏、停顿和语调。OpenVoice还可以针对海量说话人训练集中未包含的语言实现零样本跨语言语音克隆。OpenVoice 的计算效率也很高,其成本比性能较差的商用 API 低数十倍。 一、OpenV… -
FlowGPT – ChatGPT提示词专业分享平台,提供训练有素的AI角色,现已兼容主流AI大模型~
一、FlowGPT是什么? FlowGPT 是一个AI驱动的GPTs的应用商店平台,允许用户分享和发现 AI 提示。 AI 提示向 ChatGPT 等 AI 模型发出指令,生成文本、翻译语言、编写不同类型的创意内容或者以信息丰富的方式回答您的问题。 当用户在 FlowGPT 上共享 AI 提示时,该提示将被添加到平台的提示库中。然后,其他用户可以找到并使用此提示来生成文本、翻译语言、编写… -
DDColor – 阿里AI老照片上色一键修复工具
一、什么是DDColor? 🎨DDColor 是最新的 SOTA 图像上色算法,能够对输入的黑白图像生成自然生动的彩色结果,使用 UNet 结构的骨干网络和图像解码器分别实现图像特征提取和特征图上采样,并利用 Transformer 结构的颜色解码器完成基于视觉语义的颜色查询,最终聚合输出彩色通道预测结果。 🪄 DDColor 可以为历史黑白老照片提供生动自然的着色。 🎲 它甚至可以对动漫游戏中的… -
Toona – 日本漫画黑白线稿上色,支持批量,完全免费~
在数字艺术和漫画创作的世界里,上色是一个既耗时又需要技巧的过程。对于许多艺术家和爱好者来说,将黑白草图或插画转变为充满活力的彩色作品是一个挑战。 幸运的是,随着人工智能技术的发展,现在有了一种既快速又简单的方法来为漫画和插画上色。这就是http://Toona.io,一个免费的AI漫画上色工具,它能够将黑白图像转换成令人印象深刻的彩色作品。 一、Toona是什么? Toona是一个基于网页的工具,… -
Cutie – 高质量视频一键精准抠像分离AI工具,短视频剪辑利器,视频换背景、去人物原来如此简单!
Cutie用于自动识别和追踪视频里的特定物体,比如一个人或一辆车。假设你有一段视频,里面有很多人和物体在移动,Cutie可以自动找出其中一个特定的人并一直追踪他。 一、Cutie是什么? Cutie 是一个视频对象分割框架,是XMem的后续作品,具有更好的一致性、鲁棒性和速度。该存储库包含用于标准视频对象分割的代码和用于交互式视频分割的 GUI 工具。 GUI 工具还包含“永久内存”(来自XMem… -
FaceChain – AI写真馆,妙鸭相机最强平替,仅需2张,即可获得专属写真大片~
FaceChain人物写真生成,仅需要某个人物的2张照片,即可训练得到该人物的专属形象,并批量生成各种风格的写真照片。FaceChain基于扩散模型的图像生成能力,结合LoRA训练实现人像和风格融合,并叠加一系列后处理能力,实现兼具相似度、真实感、美观度的写真生成能力。 一、FaceChain是什么? FaceChain是一款可以用于打造个人数字形象的深度学习模型工具。用户只需提供最低一张照片即可… -
SOME – 高质量音乐MIDI提取AI工具
一、SOME是什么? SOME(Singing-Oriented MIDI Extractor)是一个旨在将人声音频文件自动转换为MIDI序列的项目。这个工具对于音乐制作人和爱好者来说是一个创新的解决方案,因为它可以自动化音乐制作过程中的一个关键步骤,即将人声转换为可以编辑和进一步处理的数字格式。 在i5 12400 CPU上,它可以以9倍于实时的速度运行,而在3080Ti GPU上,速度更是达到… -
启真医学Chat – 私人家庭医生,国内开源中文医疗大模型~
一 、启真医学模型是什么? 启真医学大模型坚持“数据+知识双轮驱动”的技术路线,通过大模型技术和医学知识库的紧密结合,融合医疗应用场景中的实际需求,从医学数据治理、医学推理、医患问答、病历自动生成、临床决策辅助支持系统等方面开展迭代研发,助力大模型技术在医疗行业的落地和应用实践。 目前大多数开源的ChatLLM项目使用的是其他模型(如:ChatGPT)生成的指令数据,其不可避免的存在数据幻想的问题… -
天机(来事儿AI)- 专业中国式传统人情世故语言训练AI大模型,化解一切尴尬场合和矛盾冲突,本地整合包,一键开启使用,你也是社牛达人!
江湖不是打打杀杀,江湖是人情世故~ 一、天机(来事儿AI)是什么? 天机是 SocialAI(来事儿AI)制作的一款免费使用、非商业用途的人工智能系统。您可以利用它进行涉及传统人情世故的任务,如如何敬酒、如何说好话、如何会来事儿等,以提升您的情商和核心竞争能力。我们坚信,只有人情世故才是未来AI的核心技术,只有会来事儿的AI才有机会走向AGI,让我们携手见证通用人工智能的来临。 —— "… -
Pixian AI – AI智能驱动的在线一键抠图工具,支持批量~
一、Pixian AI是什么? Pixian.AI 提供了一种简单且用户友好的解决方案,用于从图像中删除背景,无需注册或订阅的麻烦。 用户可以轻松上传图像,并让 Pixian.AI 的先进算法对其进行处理,创建具有透明或选定颜色背景的图像。 Pixian.AI 非常适合多种用途,包括电子商务、营销材料、社交媒体帖子等,它简化了图像编辑任务,并提供了额外的功能,例如为开发人员提供 API 集成、与竞… -
DomoAI – 一键照片和视频转换风格,支持文生图,图生图,可以对科目三的小姐姐们下手了~
2023年出现 Runway、Pika 等 AI 视频生成工具,今天我们继续了解一款 AI 视频工具 Domo AI。如果说 Runway 的特色是动态笔刷、Pika 的特色是视频局部重绘,那么 DomoAI 最厉害的就是它的视频转绘功能,可以把真人视频转为效果稳定的风格化视频,最近网上很多热门 AI 视频也都是用它生成的。 一、DomoAI是什么? DomoAI是由… -
Dreamina – 字节旗下AIGC创作工具,首个中文生成视频的AI工具,用简单的文案,创作精彩的作品
居然才发现!字节跳动旗下国产AI绘画工具Dreamina,这么好用居然还免费!(强烈推荐) 一、Dreamina是什么? Dreamina是由字节跳动抖音旗下的剪映推出的一款AI图片创作和绘画工具,专门设计用于激发艺术创意和提升绘画体验。 我们提供多样化的功能,包括文字绘图、扩图、局部重绘和图片灵感生成,让您的艺术创作更加多元和精准。 在Dreamina,您可以使用自然语言描述您想要的图片,让先进… -
TeleChat – 星辰语义AI对话大模型,中国电信出品,免费开源
一、TeleChat是什么? 星辰语义大模型TeleChat是由中电信人工智能科技有限公司研发训练的大语言模型,其中7B模型基座采用1.5万亿 Tokens中英文高质量语料进行训练,12B模型基座采用3万亿 Tokens中英文高质量语料进行训练。 我们开源了对话模型TeleChat-7B-bot与TeleChat-12B-bot,以及其huggingface格式的权重文件。此外,我们还开源了7B、… -
AI作品能否得到著作权保护呢?
埃德蒙德·贝拉米的肖像 2018年10月,首幅AI创作画作《埃德蒙德·贝拉米的肖像》在美国纽约拍出43.25万美元。编写人工智能程序和创作这幅画作的,是巴黎一个名为“显而易见”的团体。 我和我的祖国 2019年10月11日,以《我和我的祖国》、《在希望的田野上》等经典曲目为基础,由人工智能创作的涵盖五个变奏段落的交响曲在深圳音乐厅上演。区别于一般AI作曲更多停留在单旋律、短篇幅的乐曲形态,此次尝… -
Jamba – 首个基于Mamba架构的生产级别大语言模型,AI21 Labs开源
首次推出基于 Mamba 的生产级模型,提供一流的质量和性能。 一、Jamba是什么? Jamba是由AI21 Labs推出的首个基于Mamba架构的生产级别的大语言模型,目前大部分的大模型(如GPT、Gemini 和 Llama)都是基于 Transformer 结构。而 Jamba 结合了 Mamba 结构化状态空间模型(SSM)和 传统Transformer 架构,兼具了高质量输出、高吞吐量… -
Ideogram – 比Midjourney更好用的AI绘画工具,能准确生成文本内容!轻松搞定LOGO,无需魔法,免费使用~
一家名为Ideogram的AI生成式图像创业公司宣布获得了由a16z和Index Ventures领投的1650万美元种子轮融资。 一直以来,Midjourney 稳坐AIGC文生图的王座,少有威胁,直到这家公司的出现。 8 月 23 日,生成式人工智能创业公司 Ideogram AI 正式官宣:「我们正在开发最先进的人工智能工具,使创意表达变得更容易、更有趣、更高效。」 一、Ideogram是什…