中国青年网讯 7月5日,世界人工智能大会在上海举行。会上,在谈及大模型的闭源与开源的选择时,两家知名的头部云企业阿里和百度相关负责人表达了截然不同的看法。百度创始人、董事长兼首席执行官李彦宏称,模型开源无法做到众人拾柴火焰高,商业化闭源模型最能打。
近日,全球最大AI开源社区Huggingface发布了最新的开源大模型榜单(Open LLM Leaderboard),榜单显示,其排名前十的开源大模型是基于阿里通义千问(Qwen)开源模型二次训练的衍生模型。
每经记者:可杨 每经编辑:文多百度“倒戈”了。2月14日,《每日经济新闻》记者获悉,百度将在未来几个月中陆续推出文心大模型4.5系列,并于6月30日起正式开源。此前,文心一言刚刚在官网宣布将于4月1日零时起全面免费。
南都记者关注到,2月10日全球最大AI开源社区Huggingface发布了最新的开源大模型榜单,其中排名前十的开源大模型,都基于阿里通义千问(Qwen)开源模型二次训练的衍生模型。除此以外,近期阿里通义千问(Qwen)模型屡次崭露头角。
蛇年伊始,DeepSeek就如平地惊雷引发空前讨论,成为资本市场关注焦点,相关概念股节后表现强劲。DeepSeek不仅在技术上取得了显著突破,还在多个行业展现了巨大应用潜力,吸引一众云厂商、车企、手机企业官宣“接入”DeepSeek。在此背景下,南方都市报“上岗了!
2月3日,李飞飞和斯坦福大学等团队在arXiv上发表了一篇名为《s1: Simple test-time scaling》的论文,仅在16块H100上微调26分钟,以不到50美元的价格训练出的新模型s1-32B,数学及编程能力与OpenAI o1及DeepSeek R1等尖端推理模型效果相当。