Ollama 使用教程

从入门到精通的完整指南

Ollama 简介

Ollama是一款开源的本地大语言模型运行工具，支持在个人电脑上一键部署和运行Llama、Mistral、Qwen等主流开源模型。无需GPU云服务，无需复杂配置，通过简单的命令行即可启动模型服务。支持macOS、Linux、Windows系统，提供REST API接口，可与各类应用集成。适合开发者和AI爱好者在本地环境中快速体验和开发AI应用，保护数据隐私的同时降低使用成本。

详细功能介绍

【工具简介】

Ollama是一款轻量级开源工具，让用户在本地计算机上轻松下载、运行和管理大语言模型。

【核心功能】

①一键模型部署：通过简单的命令即可下载并运行Llama、Mistral、Gemma、Qwen等数十种开源模型，自动处理依赖和配置。

②多模型管理：支持同时管理多个模型版本，可随时切换不同模型进行对比测试，模型文件统一存储和管理。

③REST API服务：启动后自动提供标准API接口，兼容OpenAI格式，方便与各类应用和开发框架集成。

④Modelfile自定义：通过类似Dockerfile的语法自定义模型参数、系统提示词和运行环境，创建专属模型配置。

⑤跨平台支持：完美支持macOS、Linux和Windows系统，CPU和GPU均可运行，适配多种硬件环境。

【适用场景】

本地AI应用开发：开发者可以在本地环境中构建和调试AI应用，无需依赖云服务，降低开发成本并保护代码隐私。搭建私有知识库：企业或个人可以结合Ollama和向量数据库，构建完全私有的问答系统，敏感数据不离开本地网络。AI学习与研究：学生和研究人员可以在本地运行不同模型进行对比实验，深入理解模型特性和行为差异。

【快速入门】

①访问ollama.com下载对应系统的安装包，完成安装后ollama服务自动启动。②打开终端执行ollama pull llama3命令下载模型，首次下载需要一定时间。③运行ollama run llama3即可在终端直接与模型对话，体验交互效果。④如需API调用，服务默认监听11434端口，发送POST请求到/api/generate即可获取模型响应。

【优缺点分析】

优点：完全本地运行，数据隐私有保障；安装配置极其简单，新手友好；模型资源丰富，社区活跃更新快。缺点：大模型对硬件要求较高，8B参数模型至少需要8GB内存；生成速度受硬件限制，无GPU时响应较慢；暂无图形界面，纯命令行操作对部分用户有门槛。

【适合人群】

本地开发者：需要在本地环境中集成AI能力的程序员，可通过API快速对接各类应用。隐私敏感用户：对数据安全有要求的企业或个人，希望将AI能力部署在自有设备上。AI技术爱好者：想要低成本体验和对比不同开源模型的用户，Ollama提供了最便捷的方式。

1Ollama 入门教程：本地运行大语言模型的最佳选择

入门10分钟

工具简介 Ollama 是一款开源的本地大语言模型运行工具，支持在个人电脑上一键部署 Llama、Mistral、Qwen 等主流开源模型。无需 GPU 云服务，通过简单命令即可启动 AI 模型服务。快速开始 1. 下载安装：访问 ollama.com 下载对应系统的安装包，支持 macOS、Linux、Windows 2. 安装完成：运行 ollama --version 确认安装成功 3. 拉取模型：执行 ollama pull llama3 下载 Meta 的 Llama3 模型 4. 启动对话：运行 ollama run llama3 开始与模型对话 5. 退出对话：输入 /bye 或按 Ctrl+D 结束会话核心功能演示功能一：本地模型对话安装完成后，直接在终端与 AI 对话。运行 ollama run mistral 启动 Mistral 模型，输入问题即可获得回答。支持多轮对话，模型会记住上下文。无需联网，所有计算在本地完成，保护隐私数据。功能二：API 接口调用 Ollama 提供兼容 OpenAI 的 REST API 接口。启动服务后，使用 curl 命令测试：curl http://localhost:11434/api/generate -d '{model:llama3,prompt:你好}'。这使得 Ollama 可以轻松集成到现有应用中，替代云端 API。功能三：模型管理与切换使用 ollama list 查看已安装的模型，ollama pull model_name 下载新模型，ollama rm model_name 删除不需要的模型。支持同时安装多个模型，随时切换使用。还可以通过 Modelfile 自定义模型参数和系统提示词。实际使用案例案例一：隐私保护的代码助手开发公司内部系统时，代码不能上传到云端。在本地部署 Ollama 运行 CodeLlama 模型，作为代码补全和问题解答的助手。所有代码都在本地处理，满足企业的数据安全要求，同时享受 AI 辅助编程的便利。案例二：离线知识问答系统图书馆需要一个离线的参考咨询系统。使用 Ollama 部署中文模型，导入馆藏目录数据，读者可以通过自然语言查询书籍信息。系统完全离线运行，不依赖网络，适合各种环境部署。常见问题 FAQ Q1：需要什么样的电脑配置？ A1：基本要求 8GB 内存运行 7B 参数模型，16GB 内存运行 13B 模型。有 NVIDIA GPU 会显著加快推理速度，但 CPU 也能运行，只是速度较慢。Mac 用户推荐使用 M1/M2 芯片的设备。 Q2：模型文件保存在哪里？ A2：默认保存在用户目录下的 .ollama 文件夹。Linux/Mac 在 ~/.ollama，Windows 在 C:Users用户名.ollama。可以通过设置 OLLAMA_MODELS 环境变量自定义存储路径。 Q3：如何更新 Ollama 和模型？ A3：重新下载安装包即可更新 Ollama 本体。更新模型使用 ollama pull model_name 命令，会自动下载最新版本。建议定期更新以获得性能改进和新功能。小贴士 1. 善用 Modelfile：创建自定义 Modelfile 可以设定系统提示词、温度参数等，打造专属的 AI 助手角色，提升使用体验。 2. 资源监控：使用 ollama ps 查看当前运行的模型和资源占用，及时释放不需要的模型内存。 3. 社区模型：探索 Ollama 模型库，发现社区贡献的微调模型，如专门用于翻译、写作、编程等特定任务的版本。

返回Ollama详情页访问Ollama官网 →