大语言模型安装到本地电脑运行 O

资讯

大型语言模型走入消费级硬件，现在可以在电脑和手机上运行了
·通常，运行GPT-3需要多个数据中心级英伟达A100 GPU，但LLaMA可以在单个强大的消费类GPU上运行。通过一种被称为量化的技术来进行优化、使模型缩小后，LLaMA可以在配备M1芯片的苹果电脑或较小的英伟达消费级GPU上运行。人工智能世界正在以闪电般的速度发展。
澎湃新闻
18评论
一文教你使用 Windows 本地运行开源大语言模型
如果是 Windows 可能需要额外的一些步骤，首先，对于 Windows 用户来说， WasmEdge 可以在 Windows 上运行，但是 ggml 插件无法在 Windows 上直接运行。
WASM爱好者
本地运行大语言模型的最佳工具集
但是这类模型往往需要通过Saas的方式访问其平台，如果真在在需要一些涉及敏感或者保密数据情况下就不能使用。
虫虫安全
8评论
如何在本地运行大语言模型，保护数据隐私
大型语言模型已经深刻地变革了技术领域，但数据安全问题依然严峻，尤其是在将敏感信息发送到第三方服务器时。
数据应用学院
2评论
在笔记本电脑本地跑大模型，英特尔要让生成式AI无处不在
芯东西6月12日报道，过去一年，从Stable Diffusion、ChatGPT到大语言模型等，生成式AI技术发展迅速。
芯东西
2评论
五个简单好用的本地运行大模型的方法
像ChatGPT、Claude.ai和phind这样的聊天机器人非常有用，但可能并不总是希望的问题或敏感数据由外部应用程序处理。一种解决方案是下载一个大型语言模型并在自己的机器上运行它。
51CTO
1评论
Ollama核心功能及安装使用详解
GitHub 仓库:GitHub - ollama/ollama: Get up and running with Llama 3.3， DeepSeek-R1， Phi-4， Gemma 2， and other large language models.
逛街企鹅
7评论

视频

问答

陈天奇等人新作MLC LLM能在任何设备上编译运行大语言模型，如何理解这一技术？有哪些应用场景？
最近人们都在研究ChatGPT，大语言模型（LLM）彻底改变了科技领域的格局，但对于AI开发者来说，并不是人人都有上万块A100的。为了跑得起大模型，就要寻找各种优化方法。在让大模型变小这条路上，人们做了很多尝试，先是Meta开源了LLaMA，让学界和小公司可以训练自己的模型。
头条问答