微调大语言模型lora

资讯

深入了解大模型的微调——什么是LoRA，PEFT，DeepSpeed，ZeRO
自从谷歌的那篇开创性的论文《注意力就是你所需要的一切》发表以来，大型语言模型 (LLM) 就随着ChatGPT的发布而风靡全球，这导致了生成式人工智能和 OpenAI 等公司的兴起。
爱编程的查理
32评论
不是大模型全局微调不起，只是LoRA更有性价比，教程已经准备好了
在经历数百次实验后，Sebastian Raschka 总结出了使用 LoRA 微调大模型的经验，并发布在 Ahead of AI 杂志上。
机器之心Pro
13评论
人工智能大语言模型微调技术：SFT 、LoRA 、Freeze 监督微调方法
人工智能大语言模型微调技术:SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法。
汀丶人工智能
20评论
GPT大语言模型Alpaca-lora本地化部署实践
模型介绍Alpaca模型是斯坦福大学研发的LLM（Large Language Model，大语言）开源模型，是一个在52K指令上从LLaMA 7B（Meta公司开源的7B）模型微调而来，具有70亿的模型参数（模型参数越大，模型的推理能力越强，当然随之训练模型的成本也就越高）。
京东云开发者
17评论
大模型微调方法总结
paper:LoRA: Low-Rank Adaptation of Large Language Models。
媛媛不是程序员
港中文贾佳亚团队联合MIT发布全球首个70B长文本大语言模型
新京报贝壳财经讯（记者孙文轩）10月9日，港中文贾佳亚团队宣布联合麻省理工学院（MIT）发布超长文本扩展技术LongLoRA（超长上下文，一种大语言模型高效微调的技术）：只需两行代码、一台8卡A100机器，便可将7B模型的文本长度拓展到100k tokens（令牌，可简单理解为一
新京报
大模型技术：LoRA 详解，从理论到实践理解 LoRA
LoRA是一种用于微调大型语言模型，特别是基于transformers的语言模型，以减少计算和内存开销。
冰镇火锅聊AI
9评论
开始打造专属 AI：DeepSeek 微调全攻略
本指南就是手把手教你如何用监督式微调搭配 Hugging Face 数据集，让 DeepSeek LLM 在你的领域里变得更聪明。
MobotStone
33评论
Llama3微调教程：超简单，人人都可以打造属于自己的GPT！
本文总结了Llama3微调教程，教你如何打造自己的GPT。随着Llama 3的发布，国内各路英雄豪杰纷纷开启了炼丹之旅。
人人都是产品经理
74评论
20+篇里程碑式论文，带你从「Transformer的前世」速通到ChatGPT
ProtTrans:Towards Cracking the Language of Life’s Code Through Self-Supervised Deep Learning and High Performance Computing，见原文链接。
新智元
43评论

视频