DeepSeek 爆火出圈,马斯克放话:超越它的 AI 模型···
2025/02/11在人工智能这片充满无限可能的广阔天地里,Deepseek 如同一颗突然升起的璀璨新星,绽放出令人瞩目的光芒。它不仅在国内人工智能市场中占据了极为重要的地位,更是在全球范围内大放异彩,力压谷歌的 Gemini,成为全球第二受欢迎的 AI 聊天机器人。这一突破性的成就,瞬间吸引了全球科技领域的聚焦目光,就连特斯拉的传奇领导者埃隆・马斯克也对其予以关注。
最近,在备受瞩目的 WELT 经济峰会上,马斯克接受采访的视频引发了广泛热议。在采访中,马斯克毫不吝啬对中国工程师的赞美之词,他高度认可中国工程师的聪明才智与勤勉努力,并且认为 Deepseek 的成功正是中国人才济济的有力体现。不过,马斯克在肯定 Deepseek 的同时,也表达了自己的一些看法。他对 Deepseek 所谓的 “革命性” 持保留态度,坚定地相信自己旗下的 xAI 以及其他 AI 企业,在不久的将来就能够推出更为先进的模型。
无独有偶,谷歌 DeepMind 的首席执行官、诺贝尔化学奖获得者德米斯・哈萨比斯也针对 Deepseek 发表了自己的见解。他称赞 Deepseek 的 AI 模型堪称中国顶尖水平,不过也指出,该模型并没有带来科学层面的重大突破,更多的是基于现有技术进行的优化升级,外界对其的过度追捧和炒作或许存在夸大其词的情况。哈萨比斯还特别提到,谷歌新发布的 Gemini 2.0 Flash 模型在效率方面表现更为出色。
回顾科技发展的历程,每一次重大的技术变革在推动行业大步向前的同时,总是不可避免地会面临各种质疑与挑战。曾经,ChatGPT 的问世吸引了全球的目光,引发了巨大的轰动,然而,它的创新性也曾遭到 meta 首席人工智能科学家杨立昆的质疑。但随着时间的推移,事实证明,ChatGPT 为人工智能领域带来了具有划时代意义的变革,成功引领整个行业朝着生成式 AI 的方向迈进。
Deepseek,这个凭借极低的成本迅速崛起的 AI 领域新贵,如今同样面临着类似的质疑与挑战。但深入探究其背后的发展历程,却有着许多值得关注的亮点。Deepseek 是由国内对冲基金巨头幻方量化于 2023 年 5 月创立的,从创立至今还不到两年时间。在 2024 年 5 月,Deepseek 发布了开源的第二代 MoE 大模型 DeepSeek-V2,这款模型在性能表现上与 GPT-4 Turbo 旗鼓相当,然而价格却仅仅是 GPT-4 的百分之一,因此被人们形象地称为 “价格屠夫” 和 “AI 界的拼多多”。
到了 2025 年 1 月,Deepseek 推出的 R1 模型更是展现出了强大的实力,在数学、代码、自然语言推理等多个关键任务中,都表现出与 OpenAI-o1-1217 不相上下的水平。尤其值得一提的是,在 AIME 2024、MATH - 500 和 SWE - Bench Verified 三项极具挑战性的测试中,R1 模型还以极其微弱的优势取得了胜利。更令人惊叹的是,取得这些成绩仅仅投入了不到 600 万美元。Deepseek 这种以小博大、“四两拨千斤” 的发展模式,彻底打破了人们以往对大模型行业 “大力出奇迹” 的传统认知,为整个行业的实际应用和落地发展开辟了全新的道路,提供了更多的可能性。
声明:本站所使用的图片文字等素材均来源于互联网共享平台,并不代表本站观点及立场,如有侵权或异议请及时联系我们删除。