70b大模型

资讯

杀疯了!8GB MacBook运行70B大模型!这个2k星项目,实现大模型自由
MacBook内部装备一个性能非常能打的GPU，而且架构设计其实非常适合运行AI模型。让一个普通的8GB MacBook笔记本可以跑顶级的70B大模型!
AI统治世界计划
1评论
2080 Ti就能跑70B大模型，上交大新框架让LLM推理增速11倍
对于FP16精度的模型，在搭载了13代Intel Core i9和单张RTX 4090的高端PC上，PowerInfer平均实现了7.23倍的速度提升，其中在Falcon 40B上实现了高达11.69倍的速度提升。
量子位
39评论
度小满：对“轩辕70B”金融大模型开源
中证网讯（记者董添）9月22日，度小满宣布“轩辕70B”金融大模型开源，所有用户均可自由下载和试用，并同时公布了“轩辕70B”在C-Eval、CMMLU两大权威大语言模型评测基准的成绩。数据显示，在C-Eval榜单上，“轩辕70B”的总成绩达到71.
中国证券报
港中文贾佳亚团队联合MIT发布全球首个70B长文本大语言模型
新京报贝壳财经讯（记者孙文轩）10月9日，港中文贾佳亚团队宣布联合麻省理工学院（MIT）发布超长文本扩展技术LongLoRA（超长上下文，一种大语言模型高效微调的技术）：只需两行代码、一台8卡A100机器，便可将7B模型的文本长度拓展到100k tokens（令牌，可简单理解为一
新京报
【万字硬核实录】陈天奇：A卡跑大模型，iphone跑70B，打爆英伟达GPU算力困境
不过，如果我们可以用A卡代替N卡，甚至不需要GPU就可以训练大模型，一切又会发生怎样的变化呢?通过这种优化方法，在最新Llama2的7B和13B模型中，用一块AMD Radeon RX 7900 XTX，速度已可达到英伟达RTX 4090的80%，或是3090Ti的94%。
华尔街见闻
新鲜早科技丨梁汝波把危机感列为字节年度目标；马斯克首富地位或不保；Meta发布开源大模型CodeLlama70B
21世纪经济报道数字经济课题组综合报道新的一天又开始了。在过去的24小时内，科技行业发生了哪些有意思的事情？来跟21tech一起看看吧。【巨头风向标】1、梁汝波担心字节变得平庸，把危机感列入年度目标。
21世纪经济报道
全面开放！20B的体量70B的性能，大模型书生·浦语又“上新”了
图说：书生·浦语大模型开源历程采访对象供图（下同）今天，上海人工智能实验室与商汤科技联合香港中文大学和复旦大学正式推出书生·浦语大模型200亿参数版本InternLM-20B，并在阿里云魔搭社区开源首发。
新民晚报
2评论
所有用户均可自由下载试用！又一国产金融大模型开源
北京日报客户端 | 记者袁璐大模型行业应用加速落地。9月22日，度小满宣布“轩辕70B”金融大模型开源，所有用户均可自由下载和试用。度小满CTO许冬亮认为，相比通用大模型，垂直类的金融大模型经过业务场景中沉淀的海量金融数据训练，对金融知识理解更专业、更精准，可控性、安全性更高。
北京日报客户端
度小满“轩辕”系列发布12款金融大模型，金融实战能力出色
3月11日，度小满宣布“轩辕”系列金融大模型新增开源6B、13B、70B三种参数12款金融大模型。这12款大模型具有“以小搏大”的实力，在用户信息分析、业务数据洞察等十余种金融实际任务评测中，达到自身2倍甚至5倍参数量的模型水平。
封面新闻
联影发布了一款医疗大模型
·联影智能发布的文本大语言模型支持70B文本输入。联影智能联席CEO沈定刚表示，70B参数的语言模型是一个专门为医学领域优化的工具，它集成了海量医学教科书和临床资料库的知识，在USMLE（美国医学执照考试）的评测上达到了67%的合格标准，展现了其在医学领域的应用潜力。
澎湃新闻
度小满“轩辕”大模型通过备案
12月22日，度小满“轩辕”大模型通过《生成式人工智能服务管理暂行办法》备案。今年5月，度小满发布了开源大模型“轩辕”。
光明网
“最强开源模型”被打假，CEO下场致歉
克雷西发自凹非寺量子位 | 公众号 QbitAI小型创业团队打造的“最强开源模型”，发布才一周就被质疑造假——不仅官方宣称的成绩在第三方测试中大打折扣，模型还被质疑套壳Claude。面对浩大的声浪，厂商CEO终于发文道歉，但并未承认造假，表示在调查有关原因。
量子位
5评论

加载更多

视频