在经历了一周的激烈竞争后,OpenAI于今天发布了新模型 o3-mini。显然,DeepSeek的崛起使得OpenAI感受到了压力,其在美国App Store免费榜单的登顶无疑是一个信号。与此同时,ChatGPT首次向所有用户免费开放推理模型,ChatGPT Pro用户将享受无限制访问,而Plus和Team用户的消息发送限制也从原来的o1-mini的每天50条提升至o3-mini的每天150条。
DeepSeek 是一家鲜为人知的中国初创公司,它发布了一款人工智能 (AI) 模型,其能力可与谷歌和 OpenAI 的创作相媲美,在全球科技界掀起了冲击波。
DeepSeek-R1 的创建者表示,其模型的开发所用的计算机芯片比美国科技巨头所用的芯片更少,而且先进程度也较低。
今年1月20日,中国人工智能公司DeepSeek发布全新模型DeepSeek-R1,震撼了AI产业界与美国股市。
据透露,DeepSeek-R1 的性能已接近OpenAI的ChatGPT,但其训练成本仅为后者的几十分之一。受此影响,美股七大科技巨头股价齐齐下跌,英伟达一周内累计跌幅超过15%,市值蒸发约6000亿美元。
一、DeepSeek 是什么?
DeepSeek 总部位于杭州,由连续创业者梁文峰于 2023 年底创立,梁文峰还经营着对冲基金 High-Flyer。
虽然梁文峰在中国以外鲜为人知,但他在将新兴技术与投资相结合方面有着丰富的经验。
据中国媒体新浪财经报道,2013 年,他与浙江大学的一位校友共同创立了杭州雅克比投资管理有限公司,这是一家使用人工智能实施交易策略的投资公司。
梁文峰随后分别于 2015 年和 2016 年成立了另外两家专注于计算机导向投资的公司——杭州幻方科技有限公司和宁波幻方量化投资管理合伙企业。

二、DeepSeek 的网站地址:
1、DeepSeek官网地址:
2、Github开源地址:
https://github.com/deepseek-ai/DeepSeek-V3
3、开源版权许可:
https://github.com/deepseek-ai/DeepSeek-V3/blob/main/LICENSE-CODE
4、AI论文地址:
https://github.com/deepseek-ai/DeepSeek-V3/blob/main/DeepSeek_V3.pdf
5、HuggingFace 模型下载地址:
https://huggingface.co/deepseek-ai
6、Discord 互动社区:
https://discord.com/invite/Tc7c45Zzu5
三、DeepSeek的优势是什么?
DeepSeek的大型语言模型V3完整版本有近700吉字节(gigabytes),大到只能在专业硬件上运行,参数量多达6850亿个,比以往任何供免费下载的模型都要大。相较之下,脸书母公司Meta的Llama 3.1模型只有4050亿个参数。人工智能编码平台Aider的测试结果显示,DeepSeek表现仅次于OpenAI的o1模型。
更令人惊艳的是,DeepSeek是以极低的成本,实现顶级的性能。独立研究公司Melius Research指出,DeepSeek很可能掌握了利用更高效内存和学习策略,来降低模型训练成本的方法,它的模型生成信息的成本仅为OpenAI的ChatGPT模型的十分之一。
DeepSeek的优势也在于它的算法改进和优化,它在算力上得到了节省,在输入数据和语料库上,不像以前要求那么大的数据量和大的算力。
据估计,西方主要AI模型使用了1万6000个专用晶片。DeepSeek的文件则显示,它仅用了约2048块英伟达H800晶片,这款晶片原本是针对中国市场的特供版,在某些性能参数上有所降低,以符合美国2022年对华出口管制。2023年10月,H800也纳入美国对中国出口禁令中。
四、DeepSeek的劣势是什么?
受中国的审查政策影响,DeepSeek并非总是知无不言。《经济学人》尝试向它询问台湾时,它生成几句就停下来,还删除之前的回答,要求用户“聊点别的”。
目前,美国的人工智能也仍然具备中国对手尚无法匹敌的能力。例如,谷歌的一项研究项目能让用户的网络浏览器与聊天机器人Gemini对话,这或有助于实现人工智能“代理”(agent)与互联网互动的前景。OpenAI的聊天机器人则不仅会帮用户编写代码,还会帮助他们运行代码。
OpenAI还在酝酿多项创新技术,包括据说能力堪比人类专家的“博士级超级代理”。
五、为什么 DeepSeek 会席卷科技界?
简而言之,该公司的成功引发了人们对硅谷和美国政府在人工智能领域所采取的方法的质疑。
人们普遍认为,美国科技公司在人工智能领域具有关键优势,尤其是因为它们规模庞大,这使得它们能够吸引来自世界各地的顶尖人才,并投入巨额资金建设数据中心和购买大量昂贵的高端芯片。
DeepSeek 的出现挑战了需要数十亿美元才能走在人工智能前沿的假设。
六、DeepSeek 应用场景
- 在线客服:我可以帮助企业提供在线客服服务,回答客户的问题,提供技术支持等。
- 智能问答:我可以在各种智能设备上提供问答服务,例如智能音箱、智能手表等。
- 教育培训:我可以帮助学生和教师提供教育培训服务,例如提供在线课程、解答学生问题等。
- 健康咨询:我可以帮助医生和患者提供健康咨询服务,例如提供健康建议、解答健康问题等。
七、如何使用DeepSeek?
1、在线使用:
DeepSeek目前支持网页版和移动端(iOS App和安卓App),可按需前往使用:
- DeepSeek官网地址:https://chat.deepseek.com/
- DeepSeek iOS App:https://apps.apple.com/cn/app/deepseek/id6737597349
- DeepSeek 安卓App:安卓应用商店搜索“DeepSeek”安装使用。
❤️温馨提示:除了deepseek,国产免费AI助手还有智谱清言、豆包、kimi也蛮不错,deepseek打不开卡顿的时候,也可以试试。
2、本地使用:
- 1、打开https://lmstudio.ai/(已上传到本地网盘),根据自己电脑系统,下载合适版本的LM Studio,并安装到自己电脑;
- 2、下载DeepSeek模型,由于huggingface需要科学上网环境,我们已经下载上传到国内网盘。
- 3、打开LM Studio,点击【我的模型】,打开模型目录(即.lmstudio/models)
- 4、把下载的模型复制到.lmstudio/models目录下;
- 5、点击右侧聊天,选择需要加载的模型,即可开始使用。



