当前位置:首页>全部工具>AI办公>AI助理>DeepSeek - AI界拼多多模型,新年重磅炸弹横空出世,媲美ChatGPT o1,支持多模态理解和图像生成,幻方量化旗下深度求索开源项目,本地一键使用

DeepSeek - AI界拼多多模型,新年重磅炸弹横空出世,媲美ChatGPT o1,支持多模态理解和图像生成,幻方量化旗下深度求索开源项目,本地一键使用

在经历了一周的激烈竞争后,OpenAI于今天发布了新模型 o3-mini。显然,DeepSeek的崛起使得OpenAI感受到了压力,其在美国App Store免费榜单的登顶无疑是一个信号。与此同时,ChatGPT首次向所有用户免费开放推理模型,ChatGPT Pro用户将享受无限制访问,而Plus和Team用户的消息发送限制也从原来的o1-mini的每天50条提升至o3-mini的每天150条。

DeepSeek 是一家鲜为人知的中国初创公司,它发布了一款人工智能 (AI) 模型,其能力可与谷歌和 OpenAI 的创作相媲美,在全球科技界掀起了冲击波。

DeepSeek-R1 的创建者表示,其模型的开发所用的计算机芯片比美国科技巨头所用的芯片更少,而且先进程度也较低。

今年1月20日,中国人工智能公司DeepSeek发布全新模型DeepSeek-R1,震撼了AI产业界与美国股市。

据透露,DeepSeek-R1 的性能已接近OpenAI的ChatGPT,但其训练成本仅为后者的几十分之一。受此影响,美股七大科技巨头股价齐齐下跌,英伟达一周内累计跌幅超过15%,市值蒸发约6000亿美元。

一、DeepSeek 是什么?

DeepSeek 总部位于杭州,由连续创业者梁文峰于 2023 年底创立,梁文峰还经营着对冲基金 High-Flyer。

虽然梁文峰在中国以外鲜为人知,但他在将新兴技术与投资相结合方面有着丰富的经验。

据中国媒体新浪财经报道,2013 年,他与浙江大学的一位校友共同创立了杭州雅克比投资管理有限公司,这是一家使用人工智能实施交易策略的投资公司。

梁文峰随后分别于 2015 年和 2016 年成立了另外两家专注于计算机导向投资的公司——杭州幻方科技有限公司和宁波幻方量化投资管理合伙企业。

DeepSeek - AI界拼多多模型,新年重磅炸弹横空出世,媲美ChatGPT o1,支持多模态理解和图像生成,幻方量化旗下深度求索开源项目,本地一键使用

二、DeepSeek 的网站地址:

1、DeepSeek官网地址:

https://www.deepseek.com/

2、Github开源地址:

https://github.com/deepseek-ai/DeepSeek-V3

3、开源版权许可:

https://github.com/deepseek-ai/DeepSeek-V3/blob/main/LICENSE-CODE

4、AI论文地址:

https://github.com/deepseek-ai/DeepSeek-V3/blob/main/DeepSeek_V3.pdf

5、HuggingFace 模型下载地址:

https://huggingface.co/deepseek-ai

6、Discord 互动社区:

https://discord.com/invite/Tc7c45Zzu5

三、DeepSeek的优势是什么?

DeepSeek的大型语言模型V3完整版本有近700吉字节(gigabytes),大到只能在专业硬件上运行,参数量多达6850亿个,比以往任何供免费下载的模型都要大。相较之下,脸书母公司Meta的Llama 3.1模型只有4050亿个参数。人工智能编码平台Aider的测试结果显示,DeepSeek表现仅次于OpenAI的o1模型。

更令人惊艳的是,DeepSeek是以极低的成本,实现顶级的性能。独立研究公司Melius Research指出,DeepSeek很可能掌握了利用更高效内存和学习策略,来降低模型训练成本的方法,它的模型生成信息的成本仅为OpenAI的ChatGPT模型的十分之一。

DeepSeek的优势也在于它的算法改进和优化,它在算力上得到了节省,在输入数据和语料库上,不像以前要求那么大的数据量和大的算力。

据估计,西方主要AI模型使用了1万6000个专用晶片。DeepSeek的文件则显示,它仅用了约2048块英伟达H800晶片,这款晶片原本是针对中国市场的特供版,在某些性能参数上有所降低,以符合美国2022年对华出口管制。2023年10月,H800也纳入美国对中国出口禁令中。

四、DeepSeek的劣势是什么?

受中国的审查政策影响,DeepSeek并非总是知无不言。《经济学人》尝试向它询问台湾时,它生成几句就停下来,还删除之前的回答,要求用户“聊点别的”。

目前,美国的人工智能也仍然具备中国对手尚无法匹敌的能力。例如,谷歌的一项研究项目能让用户的网络浏览器与聊天机器人Gemini对话,这或有助于实现人工智能“代理”(agent)与互联网互动的前景。OpenAI的聊天机器人则不仅会帮用户编写代码,还会帮助他们运行代码。

OpenAI还在酝酿多项创新技术,包括据说能力堪比人类专家的“博士级超级代理”。

五、为什么 DeepSeek 会席卷科技界?

简而言之,该公司的成功引发了人们对硅谷和美国政府在人工智能领域所采取的方法的质疑。

人们普遍认为,美国科技公司在人工智能领域具有关键优势,尤其是因为它们规模庞大,这使得它们能够吸引来自世界各地的顶尖人才,并投入巨额资金建设数据中心和购买大量昂贵的高端芯片。

DeepSeek 的出现挑战了需要数十亿美元才能走在人工智能前沿的假设。

六、DeepSeek 应用场景

  1. 在线客服:我可以帮助企业提供在线客服服务,回答客户的问题,提供技术支持等。
  2. 智能问答:我可以在各种智能设备上提供问答服务,例如智能音箱、智能手表等。
  3. 教育培训:我可以帮助学生和教师提供教育培训服务,例如提供在线课程、解答学生问题等。
  4. 健康咨询:我可以帮助医生和患者提供健康咨询服务,例如提供健康建议、解答健康问题等。

七、如何使用DeepSeek?

1、在线使用:

DeepSeek目前支持网页版和移动端(iOS App和安卓App),可按需前往使用:

❤️温馨提示:除了deepseek,国产免费AI助手还有智谱清言、豆包、kimi也蛮不错,deepseek打不开卡顿的时候,也可以试试。

2、本地使用:

  • 1、打开https://lmstudio.ai/(已上传到本地网盘),根据自己电脑系统,下载合适版本的LM Studio,并安装到自己电脑;
  • 2、下载DeepSeek模型,由于huggingface需要科学上网环境,我们已经下载上传到国内网盘。
  • 3、打开LM Studio,点击【我的模型】,打开模型目录(即.lmstudio/models)
  • 4、把下载的模型复制到.lmstudio/models目录下;
  • 5、点击右侧聊天,选择需要加载的模型,即可开始使用。
DeepSeek - AI界拼多多模型,新年重磅炸弹横空出世,媲美ChatGPT o1,支持多模态理解和图像生成,幻方量化旗下深度求索开源项目,本地一键使用
下载权限
查看
  • 免费下载
    评论并刷新后下载
    登录后下载
  • {{attr.name}}:
您当前的等级为
登录后免费下载登录 小黑屋反思中,不准下载! 评论后刷新页面下载评论 支付以后下载 请先登录 您今天的下载次数(次)用完了,请明天再来 支付积分以后下载立即支付 支付以后下载立即支付 您当前的用户组不允许下载升级会员
您已获得下载权限 您可以每天下载资源次,今日剩余
1、山鲸AI所有文章,如无特殊说明或标注,均为本站作者原创发布。
2、任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。
3、如若此作者内容侵犯了原著者的合法权益,可联系客服提交工单进行处理。
4、山鲸AI内用户所发表的所有内容及言论仅代表其本人,并不反映任何山鲸AI之意见及观点。
AI绘画开源模型

ELLA - 腾讯开源文生图扩散模型,利用LLM增强语义对齐,本地整合包,免训练,一键运行,效果赶超DALL-E~

2024-4-17 22:40:10

AI助理AI对话

Gemma 3 - 超能硬核进化!Google 产出全球最轻量化的 LLM 开源模型,本地整合包,性能超越 DeepSeek V3,仅次于 DeepSeek R1!

2025-3-26 19:53:35

!
你也想出现在这里? 立即联系
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索
error: 您点击的内容受到保护~