2024年12月25号,正值美国圣诞节期间,一款名为Deep Seek-V3的AI模型经由一家中国名不见经传的小公司——Deep Seek发布,2025年1月27日,Deep Seek应用在苹果美国区应用商店免费APP下载榜一跃超过了Chat GPT,同时也成为中国区第一;
以参数量高达 671b 的 DeepSeek - v3 大模型为例,仅用 2048 块 GPU 训练 2 个月,耗费 557.6 万美元,相较于 GPT - 4 等大模型,成本大幅降低,却能实现相当甚至更优的性能。
春节期间中国的人工智能公司DeepSeek在全世界突然扬名,据彭博社前天报道,DeepSeek的人工智能软件在全球140个市场中的移动应用下载量排行榜上位居榜首,对此韩国一家主流媒体赶紧派记者前往DeepSeek创始人的广东老家探访。