Llama架构

资讯

Llama架构比不上GPT2？神奇token提升10倍记忆？
近日，朱泽园和李远志的最新研究《语言模型物理学 Part 3.3:知识的 Scaling Laws》用海量实验总结了 12 条定律，为 LLM 在不同条件下的知识容量提供了较为精确的计量方法。作者研究了三种类型的合成数据:bioS、bioR、bioD。
机器之心Pro
1评论
全球首个开源GPT-4出世！Llama 3震撼发布，Meta AI免登录可用
【新智元导读】蛰伏许久，Meta刚刚扔出了重磅炸弹:大家期待已久的Llama 3，用了24000块GPU训练，一亮相便登上开源大模型铁王座。
新智元
68评论
Meta确认开源大模型LLaMA 3下个月登场，年底还将建成等同于60万个H100 GPU的“超级算力库” | 大模界
每经记者：文巧每经编辑：何小桃,兰素英“大模界”是每日经济新闻推出一档专注生成式AI与大模型技术的前沿科技报道栏目。在这里，我们将聚焦生成式AI技术浪潮，展现从文字、图像、音频、视频的大模型如何编织数字化世界。
每日经济新闻
2评论
llama-agents：构建生产级多智能体 AI 系统的强大框架
LlamaIndex 宣布 llama-agents 的 alpha 版本发布，这是一个新的开源框架，旨在简化构建、迭代和部署多智能体 AI 系统的流程，并将智能体转化为生产级微服务。
软件架构
13评论
Llama 3.1横空出世！开源巨无霸首次击溃闭源，全民GPT-4时代来临
Llama 3.1 405B重磅登场，在多项测试中一举超越GPT-4o和Claude 3.5 Sonnet。
新智元
15评论
开源社区分水岭：Meta大模型Llama 3发布，参数最高或达4000亿
为了保持公司在AI（人工智能）开源大模型领域的地位，社交巨头Meta推出了旗下最新开源模型。当地时间4月18日，Meta在官网上宣布公布了旗下最新大模型Llama 3。目前，Llama 3已经开放了80亿（8B）和700亿（70B）两个小参数版本，上下文窗口为8k。
澎湃新闻
1评论
改名！从Yi改回LLaMA，李开复的零一万物回应开发者质疑
近日，开发者群体正热议一款基于开源模型更换张量（Tensor）名字的话题。研究者认为零一万物近期发布的Yi-34B 模型基本上采用了 LLaMA 的架构，只是重命名了两个张量。11月6日，零一万物创始人及CEO李开复带队创办的AI 2.
第一财经
12评论
大模型那么火，教你一键Modelarts玩转开源LlaMA(羊驼)大模型
和 GPT 系列一样，LLaMA 模型也是 Decoder-only 架构，但结合前人的工作做了一些改进，比如:Pre-normalization . 为了提高训练稳定性，LLaMA 对每个 transformer 子层的输入进行归一化，使用 RMSNorm 归一化函数，Pre-normalization 由Zhang和Sennrich引入。
华为云开发者联盟
大模型被指抄袭，李开复的零一万物致歉
11月15日，创新工场创始人李开复创办的大模型公司零一万物，针对其开源Yi大模型涉嫌抄袭LLaMA一事作出说明，并“表达诚挚的歉意，我们正在各开源平台重新提交模型及代码并补充LLaMA 协议副本的流程中，承诺尽速完成各开源社区的版本更新”。
北京商报
李开复回应旗下AI独角兽陷“套壳”争议：起步受益于开源，会进步
李开复创办的AI公司零一万物（01.AI）近日陷入风波。
澎湃新闻
李开复零一万物大模型被指抄袭，致歉后再回应！专家分析
近日，创新工场董事长兼CEO李开复创办的AI 2.0公司零一万物陷入抄袭争议，被指“‘Yi’大模型使用了LLaMA的架构，只对两个张量进行重命名”。对此，该公司致歉称，“我们正在各开源平台重新提交模型及代码并补充LLaMA协议副本的流程中。
南方都市报
2评论

加载更多

视频