来源:中国新闻网 中新网北京2月8日电 春节前后,中国AI公司深度求索(DeepSeek)推出的大模型DeepSeek-R1在网络上引发关注,迅速成为热门话题。俄罗斯自然科学院德籍院士、欧盟中国中心主席刘雨雄近日接受记者采访时表示,深度求索为中国乃至全球的科技发展提供了新范例。
在生死攸关的ICU战场,每一分每一秒都至关重要。如今,我国在重症医疗领域取得重大突破——迈瑞医疗联合腾讯,发布全球首个重症医疗大模型「启元重症大模型」。这一创举,将彻底改变ICU医生的救治模式,为患者带来更多生的希望。
《科创板日报》1月29日讯(记者 黄心怡)过年放大招!在春节期间中国的大模型技术迎来了一阵密集更新。今日凌晨,阿里云通义千问超大规模的MoE模型Qwen2.5-Max 正式上线,Qwen2.5-Max模型是阿里云通义团队对MoE模型的最新成果,预训练数据超过20万亿tokens。
11月26日,全球首个千亿参数多模态大模型“紫东太初”3.0在2024东湖国际人工智能高峰论坛上正式发布,武汉人工智能研究院与多领域头部企业签署合作协议,推出建筑设计、智能焊接、机车设计等一批垂类应用细分模型,推动国产大模型赋能千行百业数字化、智能化升级。
4月30日,国内权威大模型评测机构SuperCLUE发布了《中文大模型基准测评2024年度4月报告》,报告选取国内外具有代表性的32个大模型4月份的版本,通过多维度综合性测评,对国内外大模型发展现状进行观察与思考。
来源:证券时报 最近,随着OpenAI长达12天的“马拉松式”新品发布会告一段落,这家全球瞩目的大模型明星独角兽企图霸占全球科技媒体的头条,但除了Sora等个别关注度高的新品外,实际并未掀起太大的涟漪。与两年前发布堪称AI领域“原子弹”的ChatGPT-3.
近日,中国AI初创公司深度求索的一系列大动作在科技界引发了轩然大波。短短一个月内,该公司先后发布了DeepSeek-V3和DeepSeek-R1两款大模型,其成本低廉、性能却与OpenAI相当的特点,不仅让硅谷震惊,更让Meta陷入了恐慌模式。
#爆料##DeepSeek被美国科技圈盯上了#中国AI大模型DeepSeek,吓坏了美国科技行业,尤其金融机构当场震惊了!为啥震惊呢?来自硅谷朋友说了,早在上周,整个美国AI行业基本逼疯了,有十几家机构,拼命研究DeepSeek发布的V3大模型!大伙听过Mate公司吧!
5月21日,国内权威大模型测评机构SuperCLUE正式发布商汤“日日新5.0”(SenseChat V5)中文基准测评结果,其以总分80.03分的优异成绩刷新国内最好成绩,并且在中文综合成绩上超越GPT-4-Turbo-0125。
从2023年2月20日“国内第一个对话式大型语言模型”MOSS发布,到4月21日该模型正式开源,两个月间,多家中国企业和研究机构以加速度扎堆冲入被ChatGPT轰炸出来的AI大模型赛道。在梳理这些大模型所试图呈现的特点之后,我们该如何看待这种趋势?·如何判断各家大模型的水平?