大模型部署和训练

资讯

大模型的高效训练和部署技术卷出新高度！
2021 年初 Google 的 Switch Transformer 模型采用了相同的混合专家系统架构，参数量已达到 1.6 万亿。Q3:和 deep speed Metro LM 相比，Colossal-AI 最大的技术优势是什么?
DataFunTalk
6评论
深入解析大型语言模型：从训练到部署大模型
有许多强大的工具和库可供改进LLM使用，包括Comet、TensorFlow、PyTorch、Hugging Face Transformers、AllenNLP、OpenAI GPT、Fairseq和TensorFlow Text。
MobotStone
51评论
【AI大模型】研发、训练、私有部署及应用“大脑”—GPU选型指南
随着人工智能技术的迅猛发展，选择合适的硬件对于大模型的训练和推理变得至关重要。本文将探讨大模型所需的硬件计算资源GPU如何选型？工欲善其事，必先利其器。如果你正准备进行AI深度学习，什么样的GPU才是最合适的呢？
京小瓷
10评论
大模型训练的必修课：要想快，先修“路”
21世纪经济报道记者白杨北京报道大模型狂奔近两年，Scaling law（规模法则）依然有效，这使得大模型的参数规模将持续增长，从亿级向跃升至万亿级。在这个过程中，对算力的挑战也随之而来。
21世纪经济报道
昇思MindSpore 2.3版本发布，大模型开发训推更高效
来源：环球网【环球网综合报道】随着人工智能技术的飞速发展，人工智能框架作为软件领域的基础技术，已经成为推动AI大模型开发和产业智能化发展的关键动力。3月22日，昇思MindSpore社区发布了昇思MindSpore 2.3版本。
环球网
1评论
国产大模型出路在哪里？京东曹鹏：既要考虑芯片，也要考虑软件
“国产化不仅要真替真用，还要创造真价值。”文｜《中国企业家》记者李艳艳编辑｜李薇头图来源｜受访者近期，Sora引爆全球科技圈。当大模型从概念走向落地，曹鹏也在思考，国产大模型的出路在哪里。“算力是训练大模型的基础，只有拥有自主可控的算力底座，国产大模型才能够取得先机。
中国企业家杂志
一文掌握大模型数据准备、模型微调、部署使用全流程
例如，最新的吵的沸沸扬扬的ruozhi吧数据也还不错的COIG-CQIA: Quality is All You Need for Chinese Instruction Fine-tuning，提供了一个高质量的中文数据集。
AI让世界更懂你
19评论
百川智能发布一站式大模型商业化解决方案
来源：环球网【环球网科技综合报道】10月31日消息，百川智能推出一站式大模型商业化解决方案，即1+3产品矩阵（全链路优质通用训练数据，Baichuan4-Turbo、Baichuan4-Air两款模型和全链路领域增强工具链），旨在帮助企业以最低成本实现效果最佳的私有化部署。
环球网
大模型迎落地元年澜舟科技周明提出成功“九字诀”
21世纪经济报道记者白杨北京报道在AI领域，周明是公认的“大牛”。从1999年加入微软亚洲研究院，到2020年离开，他在微软工作了21年。
21世纪经济报道
如何跨越大模型落地应用“最后一公里”
今年政府工作报告提出，开展“人工智能+”行动。当下，人工智能大模型技术备受关注，如何使其更好落地应用，深度赋能千行百业？日前，北京澜舟科技有限公司（以下简称澜舟科技）发布包括孟子大模型在内的“一横N纵”大模型技术和产品体系。
光明网

视频