国产大模型公司深度求索(DeepSeek)发布的最新AI(人工智能)大模型在海外引起开发者和投资者的热议。1月20日,量化巨头幻方量化旗下大模型公司DeepSeek正式发布推理大模型DeepSeek-R1。
特斯拉CEO埃隆·马斯克(Elon Musk)给大模型领域投下一枚重磅炸弹。北京时间3月18日凌晨,马斯克旗下大模型公司 xAI 在官网宣布开源 3140 亿参数的大模型Grok-1,以及该模型的权重和网络架构。
潮新闻客户端 记者 何泠瑶当地时间3月17日,特斯拉首席执行官(CEO)马斯克的AI创企xAI正式发布3140亿参数的混合专家模型Grok-1。xAI官方网站称,其遵照Apache 2.0协议开放模型权重和架构。
当地时间17日,美国知名企业家埃隆·马斯克旗下的人工智能初创公司xAI的大模型Grok正式宣布开源,这也意味着,所有人都可以查看其代码。美国《纽约时报》报道称,马斯克这一举动,势必加剧人工智能未来的竞争。
来源:环球网 【环球网科技综合报道】6月20日消息,斯坦福大学的大模型测评榜单HELM MMLU发布最新结果,斯坦福大学基础模型研究中心主任Percy Liang发文表示,阿里通义千问Qwen2-72B模型成为排名最高的开源大模型,性能超越Llama3-70B模型。
【环球时报报道 记者 樊巍】美国当地时间3月17日,马斯克旗下的人工智能初创公司xAI正式宣布开源大模型Grok-1,遵循Apache 2.0协议开放模型权重和架构。xAI官网显示,xAI已经将Grok-1的权重和架构在软件托管平台GitHub上开源。
xAI成了更“open”的AI。当地时间3月17日,特斯拉CEO埃隆·马斯克旗下的人工智能初创公司xAI正式宣布开源大模型Grok-1,遵循Apache 2.0协议开放模型权重和架构。官网显示,xAI已经将Grok-1的权重和架构在软件托管平台GitHub上开源。
近日,全球最大AI开源社区Huggingface发布了最新的开源大模型榜单(Open LLM Leaderboard),榜单显示,其排名前十的开源大模型是基于阿里通义千问(Qwen)开源模型二次训练的衍生模型。
每经记者:文巧 每经编辑:兰素英在推出开源大模型LLaMA2近一年之后,Meta的新一代大模型LLaMA 3即将面世。在4月9日伦敦举行的一次活动中,Meta确认计划在下个月内首次发布LLaMA 3。据了解,该模型将有多个具有不同功能的版本。
南都记者关注到,2月10日全球最大AI开源社区Huggingface发布了最新的开源大模型榜单,其中排名前十的开源大模型,都基于阿里通义千问(Qwen)开源模型二次训练的衍生模型。除此以外,近期阿里通义千问(Qwen)模型屡次崭露头角。
大模型时代,开源与闭源模型不断涌现,大模型为AI领域注入了新的活力,基于开源大模型的应用如雨后春笋般出现,同时也为研究者和开发者提供了更广阔的创新空间。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。