没想到手机也能跑AI大模型,支持DeepSeek R1、Llama 3.3、Qwen2.5等切换,iOS/安卓离线使用,完全免费开源!

2025/04/17
没想到手机也能跑AI大模型,支持DeepSeek R1、Llama 3.3、Qwen2.5等切换,iOS/安卓离线使用,完全免费开源!

PocketPal AI 是一款袖珍型 AI 助手,由可直接在手机上运行的小型语言模型 (SLM) 驱动。PocketPal AI 专为 iOS 和 Android 系统设计,让您无需网络连接即可与各种 SLM 进行交互。

那么如何在手机上本地部署多款主流 AI 大模型?下面笔者来给大家介绍下,

PocketPal AI简介

PocketPal AI是一款完全开源的软件,目前在Github上获得3.1k star,截至到本文已经迭代23个版本,PocketPal AI支持模型包括: DeepSeek R1、Llama 3.3、Qwen2.5 和 Gemma 3 等。这些模型不仅支持中文理解与生成,还能在 iOS 和安卓设备上流畅运行,实现真正的离线智能体验。

主要特色:

  • 离线 AI 辅助:无需互联网连接即可直接在您的设备上运行语言模型。
  • 模型灵活性:下载并在多个 SLM 之间交换,包括DeepSeek R1、 Danube 2 和 3、Phi、Gemma 2 和 Qwen。
  • 自动卸载/加载:当应用程序在后台运行时,通过卸载模型自动管理内存。
  • 推理设置:自定义模型参数,如系统提示、温度、BOS 令牌和聊天模板。
  • 实时性能指标:在 AI 响应生成期间查看每秒令牌数和每个令牌的毫秒数。

PocketPal AI 现已与 Hugging Face 模型中心集成!可以在应用内直接在 Hugging Face 模型中心浏览、下载和运行模型。

开源地址:https://github.com/a-ghorbani/pocketpal-ai

PocketPal AI安装教程

首先需要进行下载:

iOS

从 App Store 下载 PocketPal AI:

在 App Store 下载

安卓

在 Google Play 上获取 PocketPal AI:

在 Google Play 上获取

下载应用后并安装好,在使用前需要下载模型。可以直接从应用程序下载并使用这些模型,并加载喜欢的任何其他 GGUF 模型!

models_page

使用 PocketPal AI直接下载模型

  • 点击汉堡菜单
  • 导航到“模型”页面
  • 选择您想要的型号并点击下载
  PocketPal AI

接下来加载模型。下载完成后,点击Load将模型导入内存。现在就可以开始聊天了!

为了保持设备平稳运行,PocketPal AI 可以自动管理内存使用情况:

  • 在模型页面上启用“自动卸载/加载”(默认情况下)
  • 应用程序将在后台卸载模型
  • 当您返回时它会重新加载(对于较大的模型,需要几秒钟的时间)

高级设置:

单击 V 形图标可访问高级 LLM 设置,例如:

  • 温度
  • BOS代币
  • 聊天模板选项
  • ETC

Pocketpal-ai高级设置

重要提示:到目前为止,PocketPal AI还没有找到一种简单的方法来从生成的响应中选择和复制文本,同时保留文本格式,特别是 Markdown 支持。

与此同时,以下是复制文本的当前选项:

段落级复制:长按特定段落即可复制其内容。

完整回复复制:使用文本气泡底部的复制图标复制整个 AI 生成的回复。

虽然这些选项可能不太理想,但是复制部分文本的困难也曾经是 ChatGPT 等聊天应用的一个特别烦人的地方。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注