AI视频理解模型MiniGPT4-Video发布

MiniGPT4-video
4月08日

Carey

根据arXiv网站，KAUST和哈佛大学研究团队在4月4日发表的论文中提出MiniGPT4-Video框架，一个专为视频理解而设计的多模态大模型。该模型能够处理时间视觉和文本数据，使其能够熟练地理解视频的复杂性。MiniGPT4-video不仅考虑视觉内容，还集成了文本对话，允许模型有效地回答涉及视觉和文本组件的查询。据称，该模型优于现有的最先进的方法，在MSVD、MSRVTT、TGIF和TVQA基准测试上分别获得4.22%、1.13%、20.82%和13.1%的成绩，模型和代码已公开。

论文地址：https://arxiv.org/pdf/2404.03413.pdf

GitHub地址：https://vision-cair.github.io/MiniGPT4-video/

赞同　

0 条回复 A文章作者 M管理员

暂无讨论，说说你的看法吧

Apple ID 美国，已购Shadowrocket火箭，独享账号！

￥ 68.88
Sora 2 / ChatGPT 索拉 2 官方邀请码，自动发货，免费赠送去水印教程

￥ 7.77
Google/Gmail 邮箱账号，绝版靓号，7位纯数字/不带4，可自选账号！

￥ 88.88
Apple ID 英国，独享账号

￥ 18.88
Google/Gmail 邮箱账号，稳定可用

￥ 39.99
Apple ID 美国，独享账号

￥ 18.88

❯

个人中心

购物车

优惠劵

今日签到

有新私信私信列表

搜索

客服

扫码打开当前页
山鲸AI丶鲸喜官

返回顶部

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部

error: 您点击的内容受到保护~