用 ollama 跑的 llama3 8b 用来对话,starcode2 3b 用来补全,大概有 copilot 7 成的体验。 m2 mac mini 同时运行两个模型没啥压力。 小内存核显本也可以白嫖 cloudflare worker ai 的免费额度。 Blog: https://ray-d-song.com/zh-cn/blog/continue-free-ai-code-assistant/