-
v2vt – 视频自动翻译AI工具,本地整合包,HeyGen最佳平替,B站大神免费开源~
大家最近肯定刷到很多名人说英文的视频,今天分享一个能够将任意语言视频自动翻译成中文的小工具,可以解决语言障碍问题,轻松英文语音转中文。 一、v2vt是什么? 带有口型同步功能的视频翻译的开源项目,可以完成转录视频语音并翻译、语音克隆、口型同步、压制字幕、支持中英视频互相转换等工作。 二、v2vt的开源地址: https://github.com/halfzm/v2vt 三、v2vt的功能亮点: ⚙…- 1.9k
-
OOTDiffusion – 本地整合包,一键完美AI换装,虚拟换衣服不再困难,效果超神,支持半身,全身!!!
OOTDiffusion 支持上半身、全身的换装,如果你想要自定义模特或者衣服,需要自己提供背景干净的模特或者衣服模型。对于从事服装销售的行业来说,完全可以依赖AI 虚拟换装的方式生成营销宣传海报,无需聘请高昂的模特和拍摄费用,这是一个低成本的试装方案。 一、OOTDiffusion是什么? OOTDiffusion是一种基于潜在扩散的虚拟试穿技术,其主要目的是通过实现控制性的换装融合,让用户能够…- 5.5k
-
零一万物 – 首款开源中英双语大模型,本地部署包,免训练,免安装,李开复最快AI独角兽开源项目~
支持输入30万汉字,看不懂《百年孤独》的人有救了 一、零一万物是什么? 知名投资人、创新工场董事长兼CEO李开复博士带队创办 AI 2.0大模型公司“零一万物”(01.AI),正式发布首款研发的最强开源人工智能(AI)大模型系列,名为“Yi”。 此次 Yi 系列基础模型的首个公开版本包括两款:Yi-6B(数据参数量为60亿)、Yi-34B(340亿),均是双语(英文/中文)、支持开源。其中,Yi-…- 2.6k
-
MuseV – 数字虚拟人视频生成AI工具,一键整合包,开箱即用,腾讯天琴实验室开源
一、MuseV是什么? MuseV是一个由腾讯音乐娱乐的天琴实验室开源的虚拟人视频生成框架,专注于生成高质量的虚拟人视频和口型同步。它利用先进的算法,能够制作出具有高度一致性和自然表情的长视频内容。MuseV支持自定义动作和风格,视频时长理论上无限,且生成速度快。这一技术在AI创作领域中表现出色,为虚拟人视频制作提供了新的可能性。 二、MuseV的网站地址: 1、Github开源地址: https…- 4.8k
-
Roop Unleashed – 一键单图换脸AI工具,中文整合包,无需训练LoRA,已更新至3.6.5
ROOP-Unleashed是一款基于ROOP的换脸web UI,界面简单易用。 一、Roop Unleashed的主要特征: 独立于平台的浏览器 GUI 一次性选择多个输入/输出面 许多不同的交换模式,首先检测到,面部选择,按性别 图像/视频的批量处理 使用文本提示遮盖面部遮挡物 使用不同增强剂的可选面部修复 预览不同视频帧的交换 使用您的网络摄像头进行实时假摄像头 用于剪切视频等的附加选项卡。…- 3.5k
-
Fooocus 2.0 中文版 – 傻瓜式AI绘画神器,超180种预置风格,体验直追Midjourney,三天登顶GitHub热榜!
玩AI画画,现在终于不用担心被老黄刀法“背刺”了! 只需要一块4年前的GTX 1650(显存4GB),AI出图效果堪比当前最好的开源模型SDXL。 一、Fooocus是什么? Fooocus是一款离线、开源且免费的AI绘画软件,仅需4G显存即可使用SDXL模型。通过重新思考Stable Diffusion和Midjourney的设计理念,Fooocus简化了安装过程,降低了使用门槛,让更多人能够体…- 4k
-
APISR – 专注二次元动漫图像分辨率增强,无损放大AI神器,让漫画焕然一新,动漫爱好者的福音~
APISR:动漫制作启发现实世界动漫超分辨率 APISR旨在恢复和增强低质量、低分辨率的动漫图像和视频源,这些图像和视频源与现实世界场景相比存在各种退化。 一、APISR是什么? APISR 是一个新的放大算法,专门用于恢复和增强各种低质量、低分辨率的动漫图像和视频,其模型代码已经开源,并且有免费的在线 Demo 可以体验。试了一下效果的确非常不错,可以有效提升线条细节的清晰度,并且色彩的还原度也…- 2.4k
-
Whisper-WebUI – 音视频字幕AI生成翻译工具,免部署,免安装,一键使用
Whisper-WebUI是一个基于Whisper模型的Gradio 的浏览器界面,可以轻松地将其用作字幕生成器! 一、Whisper-WebUI的开源地址: https://github.com/jhj0517/Whisper-WebUI 二、Whisper-WebUI的功能特点: 从多种来源生成字幕,包括: 从音视频文件自动识别字幕 从Youtube链接自动识别字幕 从麦克风输入实时识别字幕 …- 2.5k
-
VOICEVOX – 专业日语AI配音文本语音合成工具
日语文字转语音软件「VOICEVOX」,提供了很多种不同的语音角色,每个角色都有独特的声音特征,适用于不同的场景和需求。VOICEVOX提供了直观易用的用户界面,使用户能够轻松地输入文本、选择语音角色、调整语音参数,并生成语音。 同时支持CPU,GPU,提供超过30 种不同声音的角色让你选择,效果如下: 一、VOICEVOX的官网地址: https://voicevox.hiroshiba.jp/…- 2.1k
-
CausalLM 7B – 本地AI对话大语言模型系统,未内容审查/无思想钢印,兼容GUP/CPU
该模型是根据Qwen的模型权重训练的(并且使用了LLaMA2,是的,用于计算一些初始权重),您可能还需要根据情况遵守这两个模型的商业使用限制。训练过程采用与 LLaMA2 相同的模型架构,使用与原始 MHA LLaMA2 模型相同的注意力计算方法,并且没有对旋转位置编码 (RoPE) 应用额外的缩放。 我们利用 Hugging Face 的开源数据集手动整理了 1.3B 代币的 SFT 数据集进行…- 1.8k
-
Jasper – 新媒体内容创作者必备AI写作工具,AI助力高效内容创作
您可能听说过 ChatGPT 或其他自然语言处理 (NLP) 工具,但 Jasper 在简化工作流程方面优于它们。 它被设计为内容创建和管理的一站式商店:您可以使用它来创建博客文章、网页、电子邮件、社交媒体帖子、 YouTube 脚本、Facebook 广告等等。 一、Jasper 是什么? Jasper(原Jarvis)是国外最受欢迎的AI写作软件工具之一,因其丰富的的模板和强大的智能…- 616
-
DeepFaceLab – 官方原生AI换脸软件,开箱即用,可支持A卡和N卡~
DeepFaceLab(后面简称DFL)是一个GitHub上的一个开源项目,用于视频换脸,使用Python编写,基于Tensorflow框架。DFL是目前开源软件中最好用的AI换脸软件之一,现在还在不断更新,同时作者也在开发DeepFaceLive,用于实时换脸。哔哩哔哩上很多换脸视频都是基于此框架,包括著名的肌肉金轮。 一、DeepFaceLab是什么? Deepfacelab是一款基于深度学习…- 2.2k
-
FaceChain – AI写真馆,妙鸭相机最强平替,仅需2张,即可获得专属写真大片~
FaceChain人物写真生成,仅需要某个人物的2张照片,即可训练得到该人物的专属形象,并批量生成各种风格的写真照片。FaceChain基于扩散模型的图像生成能力,结合LoRA训练实现人像和风格融合,并叠加一系列后处理能力,实现兼具相似度、真实感、美观度的写真生成能力。 一、FaceChain是什么? FaceChain是一款可以用于打造个人数字形象的深度学习模型工具。用户只需提供最低一张照片即可…- 2.2k
-
TripoSR – 快速单图生成3D模型,1秒完成,本地部署包,Stability AI与华人团队联合开源
TripoSR 的开发灵感来源于LRM(Large Reconstruction Models)的最新研究成果,即通过单一图像实现复杂三维结构的重建。这一突破性的图像到3D模型转换技术,旨在满足娱乐、游戏、工业设计以及建筑行业专业人士对高效3D建模工具的需求,通过快速响应输出,实现3D模型细节的精确可视化。 在性能测试中,TripoSR 在Nvidia A100硬件平台上运行仅需约0.5秒即可生成…- 4.6k
-
Manga Image Translator – 日漫图片翻译AI神器,妈妈再也不用担心我看不懂漫画了~
一、Manga Image Translator是什么? Manga Image Translator是一款图片翻译工具,一个使用 Python 打造的开源项目,支持粘贴图片、选择图片或拖放图片进行翻译。该工具可以帮助用户快速翻译图片中的文字,提高工作效率。Manga Image Translator的优势在于翻译速度快、准确度高、操作简单。该工具免费使用,但用户可以通过捐赠支持该服务的维护和开发…- 1.9k
-
GPT SoVITS WebUI – 快速声音AI克隆工具,完美复刻任何角色的语音、语调、语气!
语音技术在人工智能的驱动下,正在以前所未有的速度推进。GPT-SoVITS-WebUI正是这一变革的先驱它利用少量的声音源,可以快速地训练出一个语音合成(Text-to-Speech,简称TTS)模型。 这个强大的Web界面工具不仅提供了零次学习和少量次学习的文本到语音(TTS)功能,还支持跨语言的语音转换,为语音技术的爱好者和开发者打开了一扇新的大门。 一、GPT SoVITS WebUI的功能…- 2.5k
-
Gigapixel 7 – 世界顶尖图像无损放大AI工具,支持Win/MacOS,完美激活,中文汉化,推荐指数五颗星⭐️⭐️⭐️⭐️⭐️
Topaz Gigapixel AI 7 这是一个更新大规模的版本,软件介面与 Topaz Photo AI 一样了,模型也与 Topaz Photo AI 一样相同类,包括一些全新的增强功能,以及对应用程序的几乎每个部分的许多改进! 全新界面。 600% 升级。 世界一流的人工智能模型。 一、Gigapixel 7 是什么? Gigapixel AI 可以帮助您很好地完成一件事:以自然的方式提高…- 2k
-
Video Subtitle Remover – 前沿VSR视频硬字幕去除AI工具,影视剪辑爱好者有福了~
引领科技前沿的Video-subtitle-remover(VSR)工具,专为那些希望清除视频中硬编码字幕的用户设计。借助尖端AI技术,VSR不仅仅是移除字幕那么简单,它还能够: 无损分辨率将视频中的硬字幕去除,生成去除字幕后的文件 通过超强AI算法模型,对去除字幕文本的区域进行填充(非相邻像素填充与马赛克去除) 支持自定义字幕位置,仅去除定义位置中的字幕(传入位置) 支持全视频自动去除所有文本(…- 4.3k
-
Bert-VITS 2 – 爆杀原版?原神&星穹铁道全角色文本转语音AI工具,栩栩如生,声色克隆,原神启动!
为游戏爱好者们带来一款新的体验工具,原神&星穹铁道全角色文本转语音AI工具。该工具基于先进的BERT-VITS模型,这是一种结合了Transformer架构的语音合成技术。BERT-VITS模型通过深度学习,能捕捉到不同音色的独特属性,并能够实现高度个性化的语音合成效果。这款整合包特别支持多角色对话模式,让用户能够体验到更加丰富和真实的交互对话。 一、Bert-VITS 2是什么? BER…- 2.5k
-
ChatGPT Academic – 中科院学术专业版ChatGPT,一键搞定所有论文!助力科研创新,开启智能学术之旅~
自ChatGPT Academic在Github推出已有一段时间,已收获无数网友点赞。那什么是ChatGPT Academic,如何在自己电脑上部署呢?今天,就让小编带着大家一探究竟! 一、ChatGPT Academic是什么? ChatGPT Academic也被称为「中科院学术专业版 ChatGPT」,是中科院计算机科学与技术研究所研发的一款人工智能学术助手,旨在为科研人员提供高效、便捷的学…- 7.3k
-
SudoWrite – 全能型小说剧本写作AI工具,用AI让写作变得如此简单,几天完成一部小说不是梦~
无论您是作家、小说作家还是博主,Sudowrite 都可以提供人工智能的实际用途来增强您的写作过程。让我们看看谁从使用它中受益最大! 一、SudoWrite是什么? Sudowrite是一款基于GPT-3和GPT-4的人工智能写作工具,可以帮助用户生成故事内容,或者将现有的文章改写润色成新的内容。Sudowrite具有多种写作风格和创作方式,可以为用户提供非判断性的、随时可用的AI写作伙伴,帮助用…- 1.2k
-
FaceFusion – 重磅更新,最强AI换脸汉化软化,去遮挡,高清化,卡通脸一键替换,本地整合包,无需部署,无需训练,免费使用!
一个替代Roop的开源软件,通过AI换脸技术实现简单的面部替换操作。Roop项目由于团队成员不当使用而停更,但其中一位作者开源了新项目FaceFusion,在GitHub上已经获得超过5000星的关注。 一、FaceFusion是什么? Facefusion是一款最新的开源AI视频/图片换脸项目。项目官方介绍只有一句话,下一代换脸器和增强器。采用了全新的界面设计,可以像Stable Diffuis…- 4.7k
-
Writesonic – 专为内容创作者设计的AI写作助手,具备搜索引擎优化功能,是少数可以生成博客文章的工具,AI写作在线平台新星!
您是否曾经面对过令人畏惧的空白页、迫在眉睫的截止日期和一长串的内容需求? Writesonic 可能正是您一直在寻找的魔杖。在当今快节奏的数字世界中,快速生成引人入胜的高质量内容是必要的。 Writesonic 成为该领域的游戏规则改变者,提供人工智能驱动的写作助手,保证在几秒钟内提供高质量的内容。 一、Writesonic是什么? Writesonic 是一款强大的AI写作助手,专为内容创作者设…- 1k
-
SDXL-Light – 目前最快文生图AI模型,让AI出图速度提升 10 倍!
生成式人工智能技术已成为业界的焦点,它能够根据文本提示创造出图像或视频。目前的先进模型依赖于一个耗时的扩散过程来生成单一图像,可能需要5秒钟,并且要多次调用庞大的神经网络。因此,研究的热点是如何在保证图像质量的同时,加快图像的生成速度。 一、SDXL-Lightning是什么? SDXL-Lightning 模型是从 Stability AI 的 stable-diffusion-xl-base-…- 4.6k