没想到手机也能跑AI大模型,支持DeepSeek R1、Llama 3.3、Qwen2.5等切换,iOS/安卓离线使用,完全免费开源!

PocketPal AI 是一款袖珍型 AI 助手,由可直接在手机上运行的小型语言模型 (SLM) 驱动。PocketPal AI 专为 iOS 和 Android 系统设计,让您无需网络连接即可与各种 SLM 进行交互。
那么如何在手机上本地部署多款主流 AI 大模型?下面笔者来给大家介绍下,
PocketPal AI简介
PocketPal AI是一款完全开源的软件,目前在Github上获得3.1k star,截至到本文已经迭代23个版本,PocketPal AI支持模型包括: DeepSeek R1、Llama 3.3、Qwen2.5 和 Gemma 3 等。这些模型不仅支持中文理解与生成,还能在 iOS 和安卓设备上流畅运行,实现真正的离线智能体验。
主要特色:
- 离线 AI 辅助:无需互联网连接即可直接在您的设备上运行语言模型。
- 模型灵活性:下载并在多个 SLM 之间交换,包括DeepSeek R1、 Danube 2 和 3、Phi、Gemma 2 和 Qwen。
- 自动卸载/加载:当应用程序在后台运行时,通过卸载模型自动管理内存。
- 推理设置:自定义模型参数,如系统提示、温度、BOS 令牌和聊天模板。
- 实时性能指标:在 AI 响应生成期间查看每秒令牌数和每个令牌的毫秒数。
PocketPal AI 现已与 Hugging Face 模型中心集成!可以在应用内直接在 Hugging Face 模型中心浏览、下载和运行模型。
开源地址:https://github.com/a-ghorbani/pocketpal-ai
PocketPal AI安装教程
首先需要进行下载:
iOS
从 App Store 下载 PocketPal AI:
安卓
在 Google Play 上获取 PocketPal AI:
下载应用后并安装好,在使用前需要下载模型。可以直接从应用程序下载并使用这些模型,并加载喜欢的任何其他 GGUF 模型!

使用 PocketPal AI直接下载模型
- 点击汉堡菜单
- 导航到“模型”页面
- 选择您想要的型号并点击下载

接下来加载模型。下载完成后,点击“Load”将模型导入内存。现在就可以开始聊天了!
为了保持设备平稳运行,PocketPal AI 可以自动管理内存使用情况:
高级设置:
单击 V 形图标可访问高级 LLM 设置,例如:
- 温度
- BOS代币
- 聊天模板选项
- ETC
重要提示:到目前为止,PocketPal AI还没有找到一种简单的方法来从生成的响应中选择和复制文本,同时保留文本格式,特别是 Markdown 支持。
与此同时,以下是复制文本的当前选项:
段落级复制:长按特定段落即可复制其内容。
完整回复复制:使用文本气泡底部的复制图标复制整个 AI 生成的回复。
虽然这些选项可能不太理想,但是复制部分文本的困难也曾经是 ChatGPT 等聊天应用的一个特别烦人的地方。