大语言模型微调

资讯

人工智能大语言模型微调技术：SFT 、LoRA 、Freeze 监督微调方法
人工智能大语言模型微调技术:SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法。
汀丶人工智能
20评论
阿里云 PAI 大语言模型微调训练实践
导读人工智能平台 PAI 是面向开发者和企业的 AI 工程化平台，提供了覆盖数据准备、模型开发、模型训练、模型部署的全流程服务。
DataFunTalk
5评论
深入浅出：初学者的微调大型语言模型实战教程
在快速发展的人工智能领域，高效、有效地利用大型自然语言模型变得越来越重要。但是，我们可以通过许多不同的方式使用大型自然语言模型，这对于初学者可能会让人不知所措。
无糖AI
8评论
研究人员揭示大模型指令微调新秘密，助力大模型高效、低成本定制
2020 年，通过增加大模型参数量的方法，OpenAI 在具有 1750 亿参数量的 GPT-3 上发现，大模型可以根据提示词中提供的信息，来执行新任务或改进现有任务。随后他们趁热打铁，一起研究能否使用上下文学习，来替代成本高昂的指令微调方法。
DeepTech深科技
2评论
大语言模型提升国际金融话语穿透力
来源：【中国社会科学网】随着经济全球化的深入，国际金融体系在全球经济治理中的作用日益凸显，作为世界第二大经济体，中国在国际金融领域的影响力逐渐增强，但仍面临着话语穿透力不足的挑战。提升我国国际金融话语穿透力，不仅关乎国家经济安全，也是实现金融强国目标不可或缺的一环。
全国党媒信息公共平台
2评论
天津大学“伏羲传语”多语言大模型正式发布并开源，应对大模型多语言能力不足
红星资本局8月16日消息，日前，天津大学自主研发的“伏羲传语”（FuxiTranyu）多语言大模型正式发布并开源。“大语言模型在各类任务中表现出了强大的能力，然而，许多大模型在应对不同语言时并不会表现出均衡的能力，这通常与预训练的语料数据的配比有关。
红星新闻
大模型微调方法总结
paper:LoRA: Low-Rank Adaptation of Large Language Models。
媛媛不是程序员
Meta语言大模型遭泄露，无意开启了GPT平替狂潮？
谁能想到，一场泄密事件，竟成了引发“ChatGPT平替”狂潮的开端。事情的最开端，是在今年2月24日，Meta发布大语言模型LLaMA（中文意为“羊驼”），因其参数量远小于GPT-3，效果却仍能优于后者一度在圈内引起热议。
南方都市报
49评论

视频