在上一篇文章中 如何用 30秒和 5 行代码写个 RAG 应用?,我们介绍了如何利用 LlamaIndex 结合 Ollama 的本地大模型和在 Hugging Face 开源的 embedding 模型用几行 Python 代码轻松构建一个 RAG 应用。
大家好,我是思卿,今年春节以来除了哪吒2电影大火之外,DeepSeek也是火的不行,由于用的人太多,官网总是显示【服务器繁忙】,所以本期教程给大家带来DeepSeek的各种使用教程,解决官网服务器繁忙问题。
Ollama提供了REST API与本地部署的大模型,如本例中的llama3,进行交互,使用命令 ollama serve 启动本地服务器,就可以通过API调用本地部署的大模型,然后在API基础上定制自己的大模型应用了。