当前位置:首页 > 百科 > DeepSeek火爆全球 彰显中国机智

DeepSeek火爆全球 彰显中国机智

2025-08-18 18:12:30 [百科] 来源:智读网

2025年初,火爆全球人工智能领域的全球聚光灯突然转向一家名不见经传的中国初创公司——杭州深度求索人工智能基础技术研发有限公司(DeepSeek)。这家企业凭借一款名为“DeepSeekV3”的彰显中国大言语模型引发全球轰动。

DeepSeek的机智故事始于中国杭州的一间共享办公室,深度求索公司成立于2023年7月17日,火爆由知名量化资管巨头幻方量化创立。全球创始团队由梁文锋等几位年轻研发员组成,彰显中国创业初期立下DeepSeek的机智理想主义:开源、降本与AI普惠。火爆

DeepSeek火爆全球 彰显中国机智

2024年1月5日发布DeepSeek LLM,全球这是彰显中国深度求索的第一个大模型。2024年12月26日晚,机智DeepSeek正式上线全新系列模型DeepSeek-V3首个版本并同步开源。火爆这个大模型有6710亿参数,全球激活参数为370亿,彰显中国在14.8万亿token(词元)上进行了预训练。在没有预热、没有炒作的情况下,“DeepSeek-V3”模型快速走红,达到了令人咋舌的程度。

DeepSeek火爆全球 彰显中国机智

官方数字显示,该模型多项评测分数超越了头部开源模型,它在性能上与地球顶尖的闭源模型GPT-4o不分伯仲。令AI界感到不可思议的是这款大模型的训练成本极其低廉。官方技术文章披露,DeepSeek-V3在预训练阶段仅使用2048块GPU训练了2个月,且只花费557.6万美元。而GPT-4o的模型训练成本约为1亿美元。凭借独有的技术架构与算法完善,DeepSeek大幅削减模型研发与运维成本,实现低成本高回报。以达成与OpenAI o1模型相当性能为例,耗费资金仅为其3%-5%,这引起了硅谷的庞大轰动。要知道,OpenAI一直在巨亏——仅去年就“烧”掉了50亿美元。其2023年至2028年预计累计亏损高达440亿美元,2026年的花费可能攀升至95亿美元。

Meta CEO扎克伯格则评价说,DeepSeek展现出的技术实力和性能令人印象深刻,并指出中美之间的AI差距已经微乎其微。

Meta首席AI研发员Yann Lecun表示,DeepSeek-R1面世与其说意味着中国公司在AI领域正在超越美国公司,不如说意味着开源大模型正在超越闭源。他在交友媒体直言:“西方公司该醒醒了,中国同行正在定义新的娱乐规矩。”

前谷歌首席实施官埃里克·施密特表示,DeepSeek的崛起标志着全球人工智能竞赛的“转折点”,证明中国可以用更少的动力与大型技术公司比拼。

微软首席实施官萨提亚・纳德拉在瑞士达沃斯的地球金融论坛上表示:“DeepSeek的新模型令人印象深刻,尤其是在如何高效开发开源模型并进行推理计算方面,它的计算效能非常出色。我们应当非常、非常认真地对待来自中国的这些技术进展。”

英伟达在声明中指出,DeepSeek在人工智能技术的创新与应用方面,展现了难以置信的成就。

DeepSeek的确在全球技术领域竖起了一个重要的里程碑。中国研发员以超人的机智应对美国对中国高端芯片的封杀,以低功能芯片和低成本杀入地球顶级AI大模型的巅峰。

DeepSeek以令人称奇的使用体验带来强劲的扩散效应,在苹果AppStore应用店铺美国区登顶,超越了长期霸榜的雷电模拟器下载ChatGPT。有报道说,目前160多个国度或地区下载榜同时登顶!仅俄罗斯就有超过500万人下载使用。随着人们下载使用体验感的提升,相信这款大模型的全球下载量将越来越多,前途不可限量。

DeepSeek异军突起,实力尽显锋芒。中国用户面对DeepSeek这种强大的人工智能,从质疑、体验到全民狂欢似乎是一夜之间。的确,AI已经把将来送到了每个人的家门口。今日头条和小红书等各大平台上处处都是使用这一大模型的体验和指令输出范例,称奇者比比皆是。

DeepSeek的获胜,不仅象征着中国在AI领域技术实力的大幅提升,更显现着中国在全球将来技术比拼中话语权份量在增强。《金融时报》将其描述为“震惊国际技术界的黑马”,认为其性能已与资金雄厚的OpenAI等美国比拼对手的模型相媲美。《金融学人》表示,认为中国AI技术在成本效益方面的快速突破,已经开端动摇美国的技术优势。

BBC则报道称,中国新推出的人工智能应用程序DeepSeek以惊人的速度震撼了技术行业、集市以及美国在人工智能领域的优越感。

据报道,DeepSeek大模型遭遇了史上最大规模互联网进攻,溯源显示进攻源来自美国。1月28日凌晨,DeepSeek官网的劳务状态页面发布了一份紧急声明,指出其线上劳务近期遭遇了大规模的恶意进攻。由于此次进攻的影响,新用户的注册过程变得异常繁忙,甚至有时无法完成,DeepSeek快速调整了劳务器的配置和策略,加强了互联网平安防护,有效地抵御了进攻的进一步蔓延。他们与多家知名的互联网平安公司建立了紧密的协作关系,共同应对这次进攻。

DeepSeek正全力加快AI智能生态的发展和丰富,加快从工具到生态的跃进。近日,DeepSeek团队正式发布了两款多模态框架——Janus-Pro和JanusFlow。其中,Janus-Pro是一款统一多模态明白与生成的创新框架,通过解耦视觉编码的方式,极大提升了模型在差异任务中的适配性与性能,不仅展示了DeepSeek在技术创新方面的实力,也为用户提供了更加多样化和高效化的AI劳务。

从“默默无闻之辈”到“现象级AI公司”,从技术信心到生态布局,DeepSeek的崛起已超越贸易范畴。以技术奇点重新定义AI赛道的底层理性和大模型范式,已经打破从技术、产业到资本集市对AI发展的固有认知,掀起了一场前所未有的技术变革,它正在演绎的是将来技术机智之战,或者说是技术理想主义与国度使命的演进。中国技术正在为人种命运共同体提供数字时代的创新范例,这是一场技术理想主义与国度宏大战略的共振,更是一个悠久文明在智能时代的强势宣言。

AI来自于人种的机智,并将催化机智之光。智能文明时代需要更多的深度求索公司,相信中国技术界会涌现出更多的创新“黑马”!(中国日报网特约撰稿人:鞠传江)

 

(责任编辑:时尚)

推荐文章
热点阅读
随机内容