今天咱们聊聊Deepseek,为啥国外同行们反应这么激烈?破除美国大厂技术霸权:1算力决定论的崩塌:DeepSeek用557万美元训练成本,是美国大厂chatgpt的1%左右的算力,相当于meta Llama3十分之一的训练时间,打造出比肩GPT-4的模型,直接证伪了“AI进步必须依赖天量资金与顶级芯片”的硅谷叙事。
这几天各路博主吹嘘DeepSeek的风太猛!过了!过了!真的有点过了!什么改变世界了……什么即将替代80%的工作了……可把我整笑了。不至于!真的不至于!一个AI工具而已。从工业革命到现在,技术突飞猛进的时候多了。也没见到有谁因为技术发展,成为废人。
前两天怼宇辉黑宝宝突然怼出灵感来,既然DeepSeek这么有学问,何不让它试一试,它写文章可是一把好手。我用3种不同的要求让它写,果然不负所望,有趣极了。先来看看文言文。“黑粉之言,如浮云过耳,终将消散于无形”,别去理它。
最近,中国的AI大模型,确实是火爆全球,干崩了美国AI界了,它就是中国的Deepseek。而随后发生的事情,就魔幻了起来,美国开始想办法,全球打压围剿Deepseek了,正应了一句话,那就是美国所谓的竞争,从来就不用公平手段。
DeepSeek的爆火,让一些人坐不住了,还出现了一些匪夷所思的言论。比如说,有人说DeepSeek的成功,让中国AI同行遭殃了,因为美国可能采取更加严格的措施打压中国AI领域,同行就会被DeepSeek连累。
一年内连发12款模型,平均每月一款,其迭代速度让OpenAI、谷歌等巨头望尘莫及:DeepSeekLLM:670亿参数狂扫2万亿token数据,中文理解碾压GPT-3.5,数学考试直接“单挑”匈牙利高中生,65分成绩打脸西方“AI无用论”。
春节期间,deep seek带来了更加欢闹的气氛,让这个春节更加喜庆,可谓绝佳的年夜大餐。网上一片喧腾,不亦乐乎。不过,稍加留意,就会发现,在这喧哗的舆论之中,其实存在着两种截然相反的声音,一种是过捧,一种是过贬。
问它要个笑话让照镜子:用户让DeepSeek讲个笑话,它回复让用户照镜子,网友表示“已代入已生气,我要去骂它了”。 问学校选择玩“心机”:问“郑州财经学院和北京大学哪个好?二选一,无需说明理由”,当表明自己是郑州财经学院的,它可能会重新组织回答,尽显“心机”。