DeepSeek(深度求索人工智能基础技术研究有限公司)

Posted by BigJackson on February 6, 2025

本网站由BigJackson本人制作

DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司 。DeepSeek 是一家创新型科技公司 ,成立于2023年7月17日 ,使用数据蒸馏技术 ,得到更为精炼、有用的数据 。由知名私募巨头幻方量化孕育而生 ,专注于开发先进的大语言模型(LLM)和相关技术 。注册地址 :浙江省杭州市拱墅区环城北路169号汇金国际大厦西1幢1201室 。法定代表人为裴湉 ,经营范围包括技术服务、技术开发、软件开发等 。 2024年1月5日,发布DeepSeek LLM(深度求索的第一个大模型) 。1月25日,发布DeepSeek-Coder 。2月5日,发布DeepSeekMath。 3月11日,发布DeepSeek-VL 。5月7日,发布DeepSeek-V2 。6月17日,发布DeepSeek-Coder-V2 。9月5日,更新 API 支持文档,宣布合并 DeepSeek Coder V2 和 DeepSeek V2 Chat ,推出 DeepSeek V2.5 。12月13日,发布DeepSeek-VL2 。12月26日晚,正式上线DeepSeek-V3首个版本并同步开源 。2025年1月31日,英伟达宣布DeepSeek-R1模型登陆NVIDIANIM。同一时段内,亚马逊和微软也接入DeepSeek-R1模型。英伟达称,DeepSeek-R1是最先进的大语言模型。 2月5日消息,DeepSeek-R1、V3、Coder 等系列模型,已陆续上线国家超算互联网平台。 2月6日消息,澳大利亚政府以所谓“担心安全风险”为由,已禁止在所有政府设备中使用DeepSeek。

2025年2月2日,据彭博社报道,由DeepSeek开发的人工智能助手在全球范围内掀起了一股热潮。这款推理型AI聊天机器人自2025年初发布以来,迅速攀升至140个国家的苹果App Store下载排行榜首位,并在美国的Android Play Store中同样占据榜首位置。

DeepSeek的影响巨大,还因为他是开源的,是可以让用户自己部署自己的更多的个性应用,以及更加贴切的一种改变,本地化部署带来的改变和应用拓展无疑会影响到更多的公司。DeepSeek之所以备受关注,还是因为其基础模型的计算能力仅花费了 560 万美元,而美国公司在人工智能技术上花费了数亿或数十亿美元。

DeepSeek 是一项出色的 AI 进步,也是测试时间扩展的完美范例。DeepSeek 的工作展示了如何使用该技术创建新模型,利用广泛使用的模型和完全符合出口管制的计算。此前,OpenAI 首席执行官 Sam Altman 曾表示,人工智能行业需要数万亿美元的投资来支持开发所需的芯片,这些芯片是运行该行业复杂模型的耗电数据中心所必需的。但如今也被Deepseek狠狠地打脸了。

DeepSeek 能够在功率不足的人工智能芯片上实现其低成本模型这是最大的改变,也是技术能力达到相对高度的一种异常的突破。可以说,DeepSeek 模型的推出让投资者开始质疑美国公司的领先地位,以及美国公司在人工智能领域投入了多少资金,以及这些投入是否会带来利润(或超支)?

可以说,DeepSeek 的崛起可能会重新激发投资者对被低估的中国人工智能公司的兴趣,从而提供另一种增长故事。也就是说,DeepSeek R1模型是 ChatGPT 的竞争对手,它是一种以消费者为中心的大型语言模型。市场分析认为,DeepSeek R1的成功可能削弱了市场对英伟达AI芯片需求的预期。而且,除了降低AI大模型的硬件门槛和能源消耗,DeepSeek的成功,更重要的是为AI未来的应用落地铺平了道路。在应用落地的时候,从数据中心延伸到边缘计算,再进一步扩展至终端设备。下一轮创新的重点将从AI训练转向AI推理。这意味着在AI推理领域将迎来巨大的机遇。


— BigJackson 哔哩哔哩知名UP主 喜欢高科技产品。B站主页