Ollama 教學

Author: Kelvin Huang

Ollama 是一個可以在本機端運行 LLM 大型語言模型的免費開源工具,讓您無需連上網路也能使用類似 ChatGPT AI 服務。

Ollama 安裝簡單,通常只要一行指令就可以啟動模型。由於 Ollama 在本地運行,比較不會有資訊安全的問題,並且無需支付 AI 平台的訂閱費用。Ollama 整合容易,適合開發者用來做原型開發、嵌入自家應用程式。本教學也將展示使用 Python 撰寫程式串接 Ollama 開發 AI 相關的應用。更多資訊參考 https://ollama.com/library 網頁

您可以先從 Ollama 官方網站下載安裝檔案,支援 Windows / macOS / Linux 作業系統。

安裝 OllamaSetup.exe / Ollama-darwin.zip 175MB ( 需要 macOS 11 以上版本 )

Ollama 安裝完成後,將執行預設的 LLM 模型,例如此版本是 gemma3 ,這個模型體積小且速度快!

新版 Ollama 提供內建的操作介面,可直接用於 AI 對話。

請 gemma3 自我介紹吧!

這個 gemma3:1b 模型雖然不像更多參數量的模型擁有更多領域的知識,但稍後可以自行擴充知識。

進入設定可以登入 Ollama 帳號,設定模型的儲存位置。

 

開啟 Windows 命令提示字元 或 macOS 終端機,輸入 ollama 將顯示可用的指令。

 

開啟瀏覽器輸入 127.0.0.1:11434 將出現 Ollama is running 訊息,表示 Ollama 伺服器正常執行。

 

前往 https://ollama.com/library 可檢視 Ollama 支援的 LLM 大語言模型,下表列出部份模型:

模型 開發者 參數 大小 輸入 指令
gpt-oss OpenAI 20B / 120B 14GB / 65GB Text ollama run gpt-oss
Lllama 2 Meta 7B / 13B / 70B 3.8GB / 7.4GB / 39GB Text ollama run llama2
Llama 3 Meta 8B / 70B 4.7GB / 40GB Text ollama run llama3
Llama 3.1 Meta 8B / 70B / 405B 4.9GB / 43GB / 243GB Text ollama run llama3.2
Llama 3.2 Meta 1B / 3B 1.3GB / 2.0GB Text ollama run llama3.3
Llama 3.3 Meta 70B 43GB Text ollama run llama3.3
Llama 4 Meta 16x17B / 128x17B 67GB / 245GB Text, Image ollama run llama4
Phi-3 Microsoft 3.8B 14B 2.2GB / 7.9GB Text ollama run phi3
Phi-4 Microsoft 14B 9.1GB Text ollama run phi4
Gemma Google 2B / 7B 1.7GB / 5.0GB Text ollama run gemma
Gemma 2 Google 2B / 9B / 27B 1.6GB / 5.4GB / 16GB Text ollama run gemma2
Gemma 3 Google 1B / 4B / 12B / 27B 815MB / 3.3GB / 8.1GB / 17GB Text, Image ollama run gemma3
Mistral Mistral AI 7B 4.4GB Text ollama run mistral

 

第一次執行會自動下載模型,後續再執行將不會重複下載。

完成後,進入對話模式,與 ChatGPT 提供的文字交談類似。

輸入 /bye 離開對話

 

ollama run gemma:7b

ollama run llama3:8b

 

使用瀏覽器外掛程式

使用命令提示字元模式操作 Ollama 不習慣?你可以改用 Google Chrome 瀏覽器的外掛程式 - Page Assist

前往 Chrome 線上應用程式商店,搜尋 Page Assist - A Web UI for Local AI Models 按下加到 Chrome 按鈕。

[ https://chromewebstore.google.com/detail/page-assist-a-web-ui-for/ ]

點擊右上角的齒輪圖示,開啟 Page Assist 設定,一般設定可將語言設為繁體中文。

更改主題可選擇「亮色」或「暗色」。

網頁搜尋設定可選擇搜尋引擎與網域

語音轉文字設定的語音辨識語言可選擇中文(台灣)

文字轉語音提供商 可選擇 Browser TTS 或 ElevenLabs(需要輸入 API Key)

進入「模型管理」可檢視載入的模型,可設定或刪除模型。

進入「知識管理」可新增知識,例如使用 .jsonl 檔案,如果出現:請先從 RAG 設定頁面新增一個嵌入模型

請回到 RAG 設定,請選擇嵌入的模型,其餘維持預設值,按下儲存。

出現:知識新增成功,然後回到「知識管理」再試一次新增知識。

 

自行開發用戶端程式

若您有開發程式的基礎,可以自行製作串接 Ollama 的應用程式,以下提供 Python 程式碼:

[ ollama_chat_gemma3.py ] 使用 Gemma3 模型的 CLI 版本,最基本的文字對話,可用於測試

[ ollama_chat_gemma3_gui.py ] 改為使用 GUI 的版本

若您對於使用 Python 開發 Ollama 應用程式有興趣,請參閱本站的 [ Python - Ollama 教學 ]

 

Copyright © 2025 CG Digital Corp. All rights reserved.