大模型上下文是什么意思

资讯

大模型如何使用长上下文信息？将重要的信息放在开始或者结尾处！
昨天，斯坦福大学、加州伯克利大学和Samaya AI的研究人员联合发布的一个论文中有一个非常有意思的发现:当相关信息出现在输入上下文的开始或结束时，大模型的性能通常最高，而当大模型必须访问长上下文中间的相关信息时，性能显著下降。
数据学习DataLearner
2评论
一篇文章让你搞懂大模型到底是什么？
自从2022年11月30日ChatGPT发布以后，大模型这个词就开始被大家津津乐道，到底什么是大模型?
永胜学院
62评论
百川智能推出全球最长上下文窗口大模型
北京日报客户端 | 记者孙奇茹10月30日，北京人工智能大模型企业百川智能发布Baichuan2-192K大模型，其上下文窗口长度达192K，是目前全球最长的上下文窗口，能够处理约35万个汉字，是目前支持长上下文窗口最优秀大模型Claude2（支持100K上下文窗口，实测约8万
北京日报客户端
1评论
上下文就是大模型 LLM 需要的一切
现在，随着模型超过 100 万个标记，提高大型语言模型性能的令人兴奋的新方法正在出现。没有人知道，甚至 OpenAI 或 Deepmind 也不知道。
冰镇火锅聊AI
林达华谈大模型发展之路：未来会有更高效的模型结构出现
·大模型的上下文长度快速增长，超长上下文解锁新应用，但推理计算代价高昂，上下文本身对于信息不会进行压缩，不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年，人工智能领域风起云涌，模型架构、训练数据、多模态、超长上下文、智能体发展突飞猛进。
澎湃新闻
3评论
基于国产算力训练的最长上下文窗口大模型亮相
北京日报客户端 | 记者孙奇茹11月16日，百川智能与鹏城实验室宣布携手探索大模型训练和应用，双方展示了合作研发的基于国产算力的128K长窗口大模型“鹏城-百川·脑海33B”，该模型基于“鹏城云脑”国产算力平台训练，未来可升级至192K，是基于国产算力训练的最长上下文窗口。
北京日报客户端
NVIDIA把Llama-3的上下文长度扩展16倍，上下文理解能力超越GPT-4
我们知道，大模型的上下文长度越长，其计算过程中消耗的资源也就越多，看起来扩展大模型的上下文是一件耗时耗力的工作。
夕小瑶科技说
3评论
提示词：怎样与大模型沟通
若要充分发挥 GPT 的效用，需遵循以下步骤:首先是定义任务目标。站在用户的视角，写好提示词只需要掌握一个提示词公式即可，这个公式就是:提示词 = 定义角色 + 背景信息 + 任务目标 + 输出要求。
正正杂说
3评论
《红楼梦》里有大量东北方言？实测AI大模型“长文阅读”｜热财经
“想象一下，你正踏上一片遥远的沙漠星球，那里的沙丘像金色的海浪一样延绵不绝，而一场关于权力、背叛和复仇的史诗故事正缓缓展开。”这并非来自影评人的遐想，而是当下国内一家热门AI初创公司智能机器人的“阅读总结”。
金羊网
零一万物发布开源大模型Yi-34B 李开复：进军全球第一梯队
新京报贝壳财经讯（记者罗亦丹）11月6日，李开复带队创办的AI 2.0公司零一万物，正式发布首款预训练大模型 Yi-34B，并在阿里云魔搭社区开源首发。
新京报
1评论
一篇文章系统看懂大模型
上周在分享《我的AI产品经理转型之路》这篇文章的时候，就预告了一下，三白将输出一篇文章帮助大家系统的学习和了解大模型，今天来交稿了;
人人都是产品经理
10评论
李开复亲自下场发布大模型，公司成立8个月估值10亿美元
·Yi-34B在关键指标上胜过市场上已有的领先开源模型，包括备受推崇的Meta的Llama 2，其分别在Hugging Face英文开源社区平台和C-Eval中文评测的最新榜单爬升到第一位，成为全球开源大模型“双料冠军”。
澎湃新闻
11评论
10分钟读懂：全面解析AI大模型
中文分词工具包括:THULAC (Tsinghua University Language Analysis and Computing、HanLP 、LTP 等。
人人都是产品经理
41评论

加载更多

视频