llama是谁开发的

资讯

王小川：LLaMA作为开源模型的时代已过
作者丨白杨编辑丨骆一帆图源丨图虫AI大模型的发展需要开源生态9月6日，百川智能宣布正式开源微调后的Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat与其4bit量化版本，并且均为免费可商用。
21世纪经济报道
2评论
改名！从Yi改回LLaMA，李开复的零一万物回应开发者质疑
近日，开发者群体正热议一款基于开源模型更换张量（Tensor）名字的话题。研究者认为零一万物近期发布的Yi-34B 模型基本上采用了 LLaMA 的架构，只是重命名了两个张量。11月6日，零一万物创始人及CEO李开复带队创办的AI 2.
第一财经
12评论
斯坦福Llama3-V抄袭事件始末：套壳面壁智能“小钢炮”，作者团队公开致歉
界面新闻记者 | 伍洋宇界面新闻编辑 | 文姝琪一场斯坦福AI团队抄袭清华系开源大模型的闹剧在海外社交平台上吵得沸沸扬扬，6月3日，此事最终以作者团队向后者公开道歉收场。
界面新闻
5评论
成立四周，法国AIGC创企获1.13亿美元融资，创始人曾领导LLaMA研发
智东西6月16日消息，据英国《金融时报》报道，近日，仅成立四周、连产品都还没有的法国AI创企Mistral AI在种子轮融资中筹集1.05亿欧元，并刷新了欧洲的种子轮融资记录。
智东西
开源大模型的“安卓时刻”要来了！Meta将发布商用版LLaMA
周二，据英国《金融时报》，Meta准备发布其大语言模型LLaMA的商用版本，将允许初创公司和企业在该技术的基础上构建定制AI软件。
华尔街见闻
2评论
Llama 3 上线4天，井喷1000多个变种！中文版也有了！
4月19号，Meta发布了其最新的大型语言模型Llama 3的早期版本，反响热烈，短短4天，就有了1000多个变种，而且这个数字还在持续增加...
夕小瑶科技说
16评论
大模型那么火，教你一键Modelarts玩转开源LlaMA(羊驼)大模型
和 GPT 系列一样，LLaMA 模型也是 Decoder-only 架构，但结合前人的工作做了一些改进，比如:Pre-normalization . 为了提高训练稳定性，LLaMA 对每个 transformer 子层的输入进行归一化，使用 RMSNorm 归一化函数，Pre-normalization 由Zhang和Sennrich引入。
华为云开发者联盟
Meta发布Llama 3.1开源大模型系列，扎克伯格：开源人工智能是前进之路
·Meta发布Llama 3.1开源大模型系列，包括最大的版本Llama 3.1 405B，轻量级的Llama 3.1 8B和Llama 3.1 70B，任何人都可以免费使用。扎克伯格表示，开源人工智能是前进之路，人工智能开发将继续保持非常激烈的竞争，开源正在迅速缩小差距。
澎湃新闻
4050亿个参数！Meta发布最强开源AI模型Llama 3.1 扎克伯格称“美国在AI方面领先中国数年不现实”【附全球生成式AI行业技术图谱】
Meta的公告显示，Llama 3.1在Llama 3的基础上进行了重大更新，Llama 3.1主要用于驱动聊天机器人，可以进行八种语言的对话，编写更高质量的计算机代码，并可以解决更复杂的数学问题。
前瞻网
6评论
淘天集团联合爱橙科技开源大模型训练框架Megatron-LLaMA
这些工作不仅在目前各种大模型能力客观评测榜单上表现卓越，同时展现了在长文本理解、长文本生成、代码编写、数学求解等实用场景的优秀性能。
机器之心Pro
5评论
第一批AI创业者，正在密集回大厂
第一批AI大模型创业者们，正密集加入大厂。因为讨厌大公司的官僚作风，2021年，AI大牛Noam Shazeer和Daniel De Freitas从谷歌离职，融资1.5亿美元，创立了大模型聊天机器人Character.AI。
虎嗅APP
10评论
AI群聊出现！用50万条真人聊天记录训练，个性十足年代感稍弱
在过去，创建六个不同个性的成员参与且令人信服的AI群聊，可能需要一个大学团队几个月完成，现在只需要一点专业知识和很少的预算，而且聊天的可信度非常高。
澎湃新闻
3评论
Sora来了，那个受人工智能影响最大的领域怎么办
特别是ChatGPT的强力表现，使人工智能成为媒体大规模报道的焦点。它的出现似一枚重磅炸弹，立刻在全球引发强烈反响，其影响之大，甚至胜过刚刚出现时的ChatGPT。
中国科学报
2评论
傍上微软“大腿”，“欧洲OpenAI” Mistral AI什么来头？
每经记者：李孟林每经编辑：兰素英AI热潮方兴未艾，本周最具话题性的企业是来自欧洲的AI独角兽Mistral AI。
每日经济新闻
大型语言模型走入消费级硬件，现在可以在电脑和手机上运行了
·通常，运行GPT-3需要多个数据中心级英伟达A100 GPU，但LLaMA可以在单个强大的消费类GPU上运行。通过一种被称为量化的技术来进行优化、使模型缩小后，LLaMA可以在配备M1芯片的苹果电脑或较小的英伟达消费级GPU上运行。人工智能世界正在以闪电般的速度发展。
澎湃新闻
18评论

加载更多

视频