大模型越大越好吗?商业化落地,究竟是做B端容易还是C端?大模型在哪些领域的落地速度更快?当各家都在“卷”大模型时,从中突围的法宝是什么?7月5日,清华大学计算机系长聘副教授,面壁智能联合创始人、首席科学家刘知远现身上海,在WAIC2024的一场分论坛作了主题分享。
2月6日,DeepSeek概念股继续上涨,截至发稿,Wind DeepSeek指数涨超5%,航锦科技、美格智能、浙江东方、每日互动、优刻得、杭钢股份、青云科技一字晋级,安凯微、天娱数科盘中分歧后同步涨停。A股多家上市公司发布已接入或正在对接DeepSeek模型。
DeepSeek的“火”已在资本市场燃烧多日。2月6日,DeepSeek概念股再度掀起涨停潮,安凯微、青云科技、优刻得、每日互动、宝兰德、安恒信息以20%的涨幅封板涨停。当天,概念板块23家上涨、2家下跌,板块涨幅为9.6%,走出一波明显的AI大牛市。
最近科技圈啥最火?没错,就是 DeepSeek!这名字一出现,就像往平静湖面扔了颗巨石,激起千层浪。这不,连复旦大学的教授都坐不住,开始热议起来了!复旦大学的专家们指出,DeepSeek 凭借开源的推理大模型 R1 和 V3,在全球 AI 领域成功出圈。
目前,第一类卷向大参数的玩家也都在寻找高效解决方案,连 OpenAI 此前发布 GPT-4o mini 切入小模型市场,Meta Llama 3.1-8B、微软 Phi-3-vision 和 Phi-4 14B 、谷歌 Gemma 2 以及阿里 Qwen 2.5 等一系列小模型也都是头部玩家在做的布局。
AI圈又领教了一回“神秘的东方力量”。1月20日,国内人工智能技术企业深度求索(DeepSeek)官宣了其最新AI推理模型DeepSeek R1。该模型在数学、代码和自然语言推理等任务上表现优异,性能直接对标美国OpenAI最新的推理模型o1。