-
DeepSeek - AI界拼多多模型,新年重磅炸弹横空出世,媲美ChatGPT o1,支持多模态理解和图像生成,幻方量化旗下深度求索开源项目,本地一键使用
在经历了一周的激烈竞争后,OpenAI于今天发布了新模型 o3-mini。显然,DeepSeek的崛起使得OpenAI感受到了压力,其在美国App Store免费榜单的登顶无疑是一个信号。与此同时,ChatGPT首次向所有用户免费开放推理模型,ChatGPT Pro用户将享受无限制访问,而Plus和Team用户的消息发送限制也从原来的o1-mini的每天50条提升至o3-mini的每天150条。 …- 1
- 0
- 2.5k
-
Jamba - 首个基于Mamba架构的生产级别大语言模型,AI21 Labs开源
首次推出基于 Mamba 的生产级模型,提供一流的质量和性能。 一、Jamba是什么? Jamba是由AI21 Labs推出的首个基于Mamba架构的生产级别的大语言模型,目前大部分的大模型(如GPT、Gemini 和 Llama)都是基于 Transformer 结构。而 Jamba 结合了 Mamba 结构化状态空间模型(SSM)和 传统Transformer 架构,兼具了高质量输出、高吞吐量…- 0
- 0
- 2.9k
-
Grok-1 - 马斯克xAI的开源大模型,正式反击!3140亿参数迄今最大,权重架构全开放,免费可商用~
说到做到,马斯克承诺的开源版大模型 Grok 终于来了! 今天凌晨,马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家(MoE)模型「Grok-1」,以及该模型的权重和网络架构。 这也使得Grok-1成为当前参数量最大的开源大语言模型。 一、Grok-1是什么? Grok-1 是 xAI 开发的基于大型语言模型的生成式人工智能聊天机器人。它是埃隆·马斯克 (Elon Musk)…- 0
- 0
- 2.2k




