全球开源大模型综合实力对比

资讯

开源大模型与闭源大模型：优劣势对比与未来发展
（本文作者王鹏，北京市社会科学院研究员）人工智能大模型是基于深度学习技术的大规模神经网络模型，具有大量参数和复杂结构，能完成如自然语言、语音、图像处理与生成等各类复杂任务，对人工智能行业具有重要意义。
第一财经
全球各大公司大模型比较分析及 DeepSeek 布置流程
本文深入剖析全球各大公司推出的大型语言模型，包括 OpenAI 的 GPT 系列、Google 的 PaLM、DeepSeek、Meta 的 LLaMA 以及百度文心一言，从模型特点、优势与劣势等维度进行详细对比。
AI观察员sinaligt
1评论
全球最新排名：DeepSeek-V3夺开源模型第一！是“新瓶装旧酒”还是实质性突破？业内人士详解
每经记者：郑雨航每经实习记者：岳楚鹏每经编辑：高涵2024年12月26日，深度求索（DeepSeek）发布了其最新人工智能（AI）大模型DeepSeek-V3，并同步开源，刷屏中外AI圈。
每日经济新闻
105评论
阿里千问衍生模型数量破10万稳居全球最大开源模型榜首
e公司讯，记者获悉，全球最大AI开源社区Hugging Face最新显示，截至目前，阿里千问（Qwen）开源大模型的衍生模型数量已突破10万，持续领先美国Llama等开源模型，稳居全球最大开源模型榜首。自2023年8月起，阿里云相继开源Qwen、Qwen1.
证券时报e公司
太强了！10大开源大模型！
近期，Meta 隆重推出了两款开源模型:Llama 3 8B与Llama 3 70B，这两款模型可供外部开发者免费使用。
数据派THU
16评论
阿里通义Qwen2成斯坦福大模型榜单最强开源模型
来源：环球网【环球网科技综合报道】6月20日消息，斯坦福大学的大模型测评榜单HELM MMLU发布最新结果，斯坦福大学基础模型研究中心主任Percy Liang发文表示，阿里通义千问Qwen2-72B模型成为排名最高的开源大模型，性能超越Llama3-70B模型。
环球网
8评论
阿里千问衍生模型数量破10万居全球开源模型榜首
【阿里千问衍生模型数量破10万居全球开源模型榜首】财联社2月25日电，根据全球最大AI开源社区Hugging Face最新显示，截至目前，阿里千问（Qwen）开源大模型的衍生模型数量已突破10万，持续领先美国Llama等开源模型，稳居全球最大开源模型榜首。
财联社
2评论
阿里通义衍生模型霸榜全球开源榜前十，李飞飞的模型也用了
南都记者关注到，2月10日全球最大AI开源社区Huggingface发布了最新的开源大模型榜单，其中排名前十的开源大模型，都基于阿里通义千问（Qwen）开源模型二次训练的衍生模型。除此以外，近期阿里通义千问（Qwen）模型屡次崭露头角。
南方都市报
Meta发布最强开源大模型追赶GPT-4，小扎：明年反超
美国太平洋时间7月23日，Meta（原名Facebook）正式发布其Llama 3.1大模型，该模型共有8B、70B和 405B三个尺寸，上下文长度都提升到了128K。
南方都市报
谷歌再放核弹！开源大模型Gemini技术，碾压Llama 2
作者 | 香草李水青编辑 | 李水青就在刚刚，谷歌向最强开源大模型的宝座发起进攻！智东西2月22日报道，昨日晚间，谷歌毫无预兆地发布了开源模型Gemma，直接狙击Llama 2。继通过Gemini拳打OpenAI后，试图用Gemma脚踢Meta。
智东西
大模型年度榜单公布：GPT-4第一，智谱、阿里紧追
·国内大模型相比GPT-4还存在差距，推理、数学、代码、智能体是国内大模型短板，中文场景下国内最新大模型已展现出优势。OpenCompass2.0大语言模型中英双语客观评测前十名（采用百分制）。商用闭源模型通过API形式测试，开源模型直接在模型权重上测试。
澎湃新闻
2评论
行规大变！DeepSeek继续开源，OpenAI、百度、马斯克坐不住了
今日（21日），DeepSeek宣布继续开源5个代码库，给开源大模型再添一把火。今年初，全球大模型行业迎来一场“开源革命”，曾经坚持闭源策略的科技巨头们纷纷调整立场。无论是OpenAI还是百度，均开始对开源社区松口，就连马斯克刚发布的Grok-3也宣布免费使用。
北京日报
4评论

加载更多

视频

问答

斯坦福大学Alpaca模型训练成本低，性能比肩GPT-3.5，这是否能为大模型的研究提供新思路？
Alpaca是由Meta的LLaMA 7B微调而来的全新模型，仅用了52k数据，性能约等于GPT-3.5。关键是训练成本奇低，不到600美元。具体花费如下：在8个80GB A100上训练了3个小时，不到100美元；生成数据使用OpenAI的API，500美元。
头条问答

在线举报