大模型下上文窗口与上下文长度

资讯

百川智能推出全球最长上下文窗口大模型
北京日报客户端 | 记者孙奇茹10月30日，北京人工智能大模型企业百川智能发布Baichuan2-192K大模型，其上下文窗口长度达192K，是目前全球最长的上下文窗口，能够处理约35万个汉字，是目前支持长上下文窗口最优秀大模型Claude2（支持100K上下文窗口，实测约8万
北京日报客户端
1评论
大模型如何使用长上下文信息？将重要的信息放在开始或者结尾处！
昨天，斯坦福大学、加州伯克利大学和Samaya AI的研究人员联合发布的一个论文中有一个非常有意思的发现:当相关信息出现在输入上下文的开始或结束时，大模型的性能通常最高，而当大模型必须访问长上下文中间的相关信息时，性能显著下降。
数据学习DataLearner
2评论
百川智能推出大模型Baichuan2-192K 称上下文窗口长度是GPT-4的14倍
每经记者：可杨每经编辑：陈俊杰10月30日，百川智能发布Baichuan2-192K大模型。
每日经济新闻
百川智能与鹏城实验室开展合作推出基于国产算力的长窗口大模型
新京报贝壳财经讯（记者白金蕾）11月16日下午，在2023西丽湖论坛上，百川智能与鹏城实验室宣布将携手探索大模型训练和应用，合作研发基于国产算力的128K长窗口大模型“鹏城-百川·脑海33B”。百川智能和鹏城实验室展示了双方共同研发的“鹏城-百川·脑海33B”大模型。
新京报
鹏城实验室等开展合作突破国产算力大模型长窗口技术
中新网北京11月19日电 (记者张素)上下文窗口长度，对于模型理解和生成与特定上下文相关文本极为重要，是大模型核心技术之一。记者近日采访获悉，鹏城实验室等相关机构开展合作，在国产算力大模型长窗口技术方面有所突破。
中国新闻网
大模型落地难题怎样破解？百川智能用搜索给出答案
界面新闻记者 | 李京亚界面新闻编辑 | 大模型一周年之际，业界对各类工作的重要程度开始达成共识，比如多位开发者就公认，扩展大模型上下文长度是非常重要的工作，甚至会成为大模型落地的瓶颈，向量数据库则是另一个。
界面新闻
1评论
Kimi掀起大模型长文本之战
界面新闻记者 | 于浩伍洋宇界面新闻编辑 | 文姝琪凭借“长文本”标签，月之暗面从国内一众AI大模型公司中脱颖而出，打破了这个行业在产品上大同小异、技术上难分伯仲的刻板印象。
界面新闻
6评论
重磅！阿里开源推理大模型QwQ-32B：性能近R1满血版，免费商用！
阿里开源325亿参数规模的推理大模型QwQ-32B:性能接近DeepSeek R1满血版，参数更低，免费商用授权!
数据学习DataLearner
35评论
Kimi爆火，中国大模型何时商业落地
本报记者陈子帅杨沙沙马梦阳编者的话：一款擅长处理长文本的国产大模型日前引发广泛关注。据香港《南华早报》报道，中国人工智能公司“月之暗面”（Moonshot AI）宣布旗下大模型Kimi已经能够处理200万汉字的无损上下文，比去年10月时20万汉字的水平有了明显突破。
环球时报
6评论
百川智能创始人王小川：明年中国会有若干大模型超级应用产生
·“OpenAI正在研究把1000万颗GPU连在一起做大模型的技术。GPT-3.5用了4000颗GPU，做GPT-4是25000颗，英伟达一年生产能力只有100万颗。”10月31日，百川智能创始人兼首席执行官王小川在云栖大会上演讲。
澎湃新闻
9评论
AI扫盲指南！什么是大模型？什么prompt？什么是大模型参数？
比如我要生成下面的图片，我需要告诉ai我的要求，于是我输入了prompt:small blue kiddie size pool in background with dog laying inside it eating bubbles 35mm lens。
AI变革指南
8评论
最强开源大模型刚刚易主！李开复率队问鼎全球多项榜单
金磊明敏发自凹非寺。虽然Yi系列大模型出道时间相对较晚，但从效果上来看，绝对称得上是后发制人。命名来自“一”的拼音，“Yi”中的“Y”上下颠倒，巧妙形同汉字的 “人”，结合AI里的 i，代表 Human + AI。
量子位
36评论
解码AI|开启大模型“安卓”时刻，Meta刚刚干了一件大事
OpenAI的对手越追越紧了。美国当地时间4月18日，Meta发布了Llama 3开源大模型，包括Llama 3 8B和Llama 3 70B。Meta同时透露，目前其最大参数模型已超400B（4000亿）参数，但还在训练。
第一财经
对话深存科技：大模型时代，算力和数据变革的方向在哪？
活跃用户数5天破百万，2个月破亿，成为历史上增长最快的消费端应用程序，其背后隐含和衍生的意义有着无限的想象空间，可以说是下一个工业革命的到来。
集微网
智谱AI发布基座大模型GLM-4，发起大模型开源基金
·大模型开源基金包括三个“1000”，智谱AI将为大模型开源社区提供1000张卡助力开源开发，提供1000万元现金支持与大模型相关的开源项目，为优秀开源开发者提供1000亿免费API tokens。GLM-4文生图和多模态理解得到增强。
澎湃新闻
3评论
一年狂揽73亿美元投资，Anthropic点燃硅谷大模型“战火”
Sora给科技圈带来的冲击还未平静，Claude 3又来了。3月4日晚，被称之为是OpenAI最强竞争对手的Anthropic发布了其最新大模型系列Claude 3。
第一财经
Open AI首次开发者大会做了三件事：升级、降价、拓展生态
北京时间11月7日凌晨，在OpenAI首次开发者大会上，CEO阿尔特曼（Sam Altman）用45分钟的时间公布了过去一年中GPT的各项数据，以及最新版本GPT-4 Turbo的升级功能。
新京报
中国科学家正训练全新AI，一项数据比肩最新版GPT
近日，鹏城实验室与百川智能宣布携手探索大模型训练和应用，合作研发基于国产算力的128K长窗口大模型“鹏城-百川·脑海33B”。
南方+客户端
1评论
OpenAI首届开发者大会：模型降价一半，GPT应用商店也要来了
「技术正变得更民主化」撰文：王杰夫编辑：吴洋洋Key PointsGPT-4升级版GPT-4 Turbo来了，上下文窗口达到128k，为GPT-4的4倍；OpenAI还降低了几乎所有模型的API使用价格，整体便宜了一半多；GPT-4系列的多模态能力向B端用户开放；每个人都可以定制
第一财经YiMagazine
1评论

加载更多