skip to content
Logo Logo ZhenXI Blog

Gemma 4模型本地部署

/ 5 min read

一、Gemma 4

Gemma 4 于 Apr 02, 2026  2026 年 4 月 2 日发布。

官方介绍地址:Gemma 4:迄今为止我们最强大的开源模型

image.png

二、部署要求

2.1 查看可部署模型

通过:CanIRun.ai — Can your machine run AI models? 选择自己的配置从而查看是否能够进行本地部署。

其中绿色是运行良好、黄色勉强运行(完全没问题)、深黄勉强运行。

image.png这里我选择部署Gemma 4 E4B模型,可根据自己的电脑配置进行选择。

模型规模/定位速度显存占用回答质量复杂推理本地易用性
Gemma 4 E4B小型/轻量较弱
Gemma 4 26B-A4B中大型 + 压缩较强较强
Gemma 4 31B大型完整版

2.2 下载模型

HauhauCS/Gemma-4-E4B-无审查-HauhauCS-激进版 · Hugging Face --- HauhauCS/Gemma-4-E4B-Uncensored-HauhauCS-Aggressive · Hugging Face

image.png其中含义:

项目含义越高/越大意味着什么
Quant量化格式名称不同格式压缩方式不同
BPWBits Per Weight,每个权重平均占用 bit 数越高通常质量越好、体积越大
Size文件大小越大通常越占磁盘/显存
QuantBPWSize大致定位优点缺点推荐度
Q8_K_P9.47.6 GB高质量档最接近高精度,损失小很重显存足够时推荐
Q6_K_P7.05.9 GB高质量平衡档质量高,体积明显小于Q8仍不算轻很推荐
Q5_K_P6.15.5 GB偏质量折中档质量较好比Q4稍重推荐
Q5_K_M5.75.4 GB均衡档大小与质量平衡好比Q6略差很推荐
Q4_K_P5.25.1 GB省资源但保质量比Q4_M略好还是有压缩损失推荐
Q4_K_M4.85.0 GB主流实用档轻、稳、常用复杂任务稍弱非常推荐
IQ4_XS4.34.8 GB智能低比特档更小体积下尽量保效果具体表现看模型可尝试
Q3_K_P4.14.6 GB激进压缩档更省资源质量下降明显仅资源紧张时
Q3_K_M3.94.6 GB激进压缩档更轻稳定性更差仅资源紧张时
IQ3_M3.74.4 GB智能超低比特档很省质量损失较明显低资源尝试
Q2_K_P3.54.2 GB极限压缩档最省资源质量损失大不太推荐主用

选择你配置下可运行的模型文件即可,以及下载下述文件:

image.png多模态投影文件,简称 mmproj;让模型能“看图”的关键配套文件。

2.3 下载llama.cpp(用于运行模型)

①通过 nvidia-smi 命令查看本机CUDA Version,版本需12.4及以上!

image.png②找到适合的进行下载

Releases · ggml-org/llama.cpp

使用显卡选择cuda-12.4的即可。

image.png

2.4 工具齐全

将llama文件解压到没有中文目录的位置,再把模型文件放入即可。

image.png

三、模型运行

3.1 窗口运行

在llama文件夹窗口,输入cmd

image.png输入命令:

Terminal window
.\llama-cli.exe -m Gemma-4-E4B-Uncensored-HauhauCS-Aggressive-Q8_K_P.gguf --mmproj mmproj-Gemma-4-E4B-Uncensored-HauhauCS-Aggressive-f16.gguf -cnv -ngl 42 --temp 1.0 --top-p 0.95 --top-k 64 --jinja

看到下图即成功:
image.png这时候你已经可以进行窗口聊天了。请记住这个build,这个既是我们后续使用的API Key!

3.2 服务运行

可以将其运行至一个端口,再通过端口使用Cherry Studio进行连接使用:

Terminal window
.\llama-server.exe -m Gemma-4-E4B-Uncensored-HauhauCS-Aggressive-Q6_K_P.gguf --mmproj mmproj-Gemma-4-E4B-Uncensored-HauhauCS-Aggressive-f16.gguf -ngl 42 --port 11434

image.png打开Cherry Studio添加OpenAI提供商:

image.png

输入默认API地址以及上述说的API密钥!获取模型列表添加即可。

image.png

记得点击模型设置,将视觉打开。这样就可以识别图片了。

image.png

Cherry Studio中使用Gemma 4识别图片: image.png

本地资源消耗:Q8_K_P版本: Q6_K_P版本: