-
DeepSeek - AI界拼多多模型,新年重磅炸弹横空出世,媲美ChatGPT o1,支持多模态理解和图像生成,幻方量化旗下深度求索开源项目,本地一键使用
在经历了一周的激烈竞争后,OpenAI于今天发布了新模型 o3-mini。显然,DeepSeek的崛起使得OpenAI感受到了压力,其在美国App Store免费榜单的登顶无疑是一个信号。与此同时,ChatGPT首次向所有用户免费开放推理模型,ChatGPT Pro用户将享受无限制访问,而Plus和Team用户的消息发送限制也从原来的o1-mini的每天50条提升至o3-mini的每天150条。 …- 1
- 0
- 2.5k
-
ELLA - 腾讯开源文生图扩散模型,利用LLM增强语义对齐,本地整合包,免训练,一键运行,效果赶超DALL-E~
一、ELLA是什么? ELLA(Efficient Large Language Model Adapter,高效大型语言模型适配器)由腾讯研究人员开发。该技术旨在提高文本到图像生成模型在处理复杂文本提示时的语义对齐能力。通过整合大型语言模型(LLM),ELLA极大增强了模型的文本对齐性能,而这一切无需对U-Net或LLM进行额外的训练。. BigBootythickkbitch312 abell…- 1
- 0
- 2.3k
-
零一万物 - 首款开源中英双语大模型,本地部署包,免训练,免安装,李开复最快AI独角兽开源项目~
支持输入30万汉字,看不懂《百年孤独》的人有救了 一、零一万物是什么? 知名投资人、创新工场董事长兼CEO李开复博士带队创办 AI 2.0大模型公司“零一万物”(01.AI),正式发布首款研发的最强开源人工智能(AI)大模型系列,名为“Yi”。 此次 Yi 系列基础模型的首个公开版本包括两款:Yi-6B(数据参数量为60亿)、Yi-34B(340亿),均是双语(英文/中文)、支持开源。其中,Yi-…- 0
- 2
- 6k
-
Jamba - 首个基于Mamba架构的生产级别大语言模型,AI21 Labs开源
首次推出基于 Mamba 的生产级模型,提供一流的质量和性能。 一、Jamba是什么? Jamba是由AI21 Labs推出的首个基于Mamba架构的生产级别的大语言模型,目前大部分的大模型(如GPT、Gemini 和 Llama)都是基于 Transformer 结构。而 Jamba 结合了 Mamba 结构化状态空间模型(SSM)和 传统Transformer 架构,兼具了高质量输出、高吞吐量…- 0
- 0
- 2.9k
-
Grok-1 - 马斯克xAI的开源大模型,正式反击!3140亿参数迄今最大,权重架构全开放,免费可商用~
说到做到,马斯克承诺的开源版大模型 Grok 终于来了! 今天凌晨,马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家(MoE)模型「Grok-1」,以及该模型的权重和网络架构。 这也使得Grok-1成为当前参数量最大的开源大语言模型。 一、Grok-1是什么? Grok-1 是 xAI 开发的基于大型语言模型的生成式人工智能聊天机器人。它是埃隆·马斯克 (Elon Musk)…- 0
- 0
- 2.2k






