Gemini CLI 是 Google 开发的一款开源命令行工具,基于 Gemini 2.5 Pro 模型,允许用户在终端中直接使用 AI 功能。它支持处理大型代码库、生成应用程序、自动化工作流以及管理文件等任务。用户通过个人 Google 账户可免费使用,每分钟最多 60 次请求,每日最多 1000 次请求。Gemini CLI 采用 Apache 2.0 许可证,代码公开,开发者可自由修改和贡献。它轻量、易用,适合开发者在终端高效完成复杂任务。
功能列表
- 代码库操作 :查询和编辑超过百万 token 的代码库,支持复杂项目分析。
- 应用生成 :从 PDF 或手绘草图生成新应用,利用 Gemini 的多模态能力。
- 工作流自动化 :处理拉取请求、复杂 rebase 或生成 git 历史报告。
- 多模态支持 :处理文本、代码、图片、音频和视频等多种数据。
- 实时搜索 :通过 Google 搜索为模型提供实时外部信息。
- 文件管理 :批量转换图片格式或按日期整理 PDF 文件。
- 工具集成 :通过 MCP servers 连接 Imagen、Veo 或 Lyria 等媒体生成工具。
- 自定义设置 :通过配置文件调整系统提示,个性化交互体验。
使用帮助
安装流程
要使用 Gemini CLI,用户需完成以下安装和配置步骤:
- 环境准备
确保已安装 Node.js(版本 18 或以上)。可从 Node.js 官网 下载安装。 - 安装 Gemini CLI
有两种安装方式:- 通过 npx 运行 (无需全局安装):
在终端运行:
npx https://github.com/google-gemini/gemini-cli
这会直接下载并运行最新版本。
- 全局安装 :
运行以下命令全局安装:
npm install -g @google/gemini-cli
安装完成后,运行
gemini
进入交互模式。 - 通过 npx 运行 (无需全局安装):
- 选择主题
首次运行时,系统会提示选择颜色主题(如ascii
、dark
、light
)。按需选择,默认为ascii
。 - 认证配置
Gemini CLI 需要 Google 账户或 API 密钥认证:- 个人 Google 账户 :运行
gemini
后,系统会引导登录 Google 账户,授权后即可使用,每分钟 60 次、每日 1000 次免费请求。 - API 密钥 :
- 访问 Google AI Studio 生成密钥。
- 在终端设置环境变量:
export GEMINI_API_KEY="YOUR_API_KEY"
替换
YOUR_API_KEY
为实际密钥。API 密钥适合需要更高请求配额的用户。
- Google Workspace 账户 :参考 认证指南 配置。
- 个人 Google 账户 :运行
- 启动 Gemini CLI
认证完成后,运行:gemini
系统进入交互模式,显示
gemini >
提示,准备接受命令。
主要功能操作
Gemini CLI 的核心功能围绕终端中的 AI 交互。以下是详细操作说明:
1. 代码库操作
Gemini CLI 可处理大型代码库,适合分析和编辑复杂项目。例如:
- 分析项目架构 :进入项目目录,运行:
gemini > Describe the main pieces of this system's architecture
系统会返回代码库的架构概述。
- 查询安全机制 :输入:
gemini > What security mechanisms are in place?
系统会分析代码并列出安全措施。
- 实现 GitHub 问题 :输入:
gemini > Implement a first draft for GitHub issue #123
系统会生成代码初稿并提供保存选项。
2. 应用生成
利用 Gemini 的多模态能力,从 PDF 或草图生成应用。例如:
- 从 PDF 生成应用 :将 PDF 放入项目目录,运行:
gemini > Generate an app from requirements.pdf
系统会解析 PDF 内容,生成应用代码。
- 从草图生成应用 :上传手绘草图图片,输入:
gemini > Create a web app from sketch.jpg
系统会生成基于草图的 Web 应用。
3. 工作流自动化
Gemini CLI 支持自动化开发任务。例如:
- 生成 git 历史报告 :输入:
gemini > Make a slide deck showing the git history from the last 7 days, grouped by feature and team member
系统会生成包含 git 历史的幻灯片。
- 处理复杂 rebase :输入:
gemini > Help me perform a complex rebase on branch feature-x
系统会提供逐步指导完成 rebase。
4. 文件管理
Gemini CLI 可高效管理文件。例如:
- 转换图片格式 :在图片目录运行:
gemini > Convert all the images in this directory to png, and rename them to use dates from the exif data
系统会将图片转为 PNG 格式,并根据 EXIF 日期重命名。
- 整理 PDF 文件 :输入:
gemini > Organise my PDF invoices by month of expenditure
系统会根据元数据将 PDF 按月份分类。
5. 多模态支持与媒体生成
Gemini CLI 支持处理多种数据类型,并通过 MCP servers 集成媒体生成工具。例如:
- 生成 Discord 机器人 :输入:
gemini > Write a Gemini Discord bot that answers questions using a FAQ.md file
系统会根据 FAQ.md 生成机器人代码。
- 生成媒体内容 :通过 Imagen 或 Veo 生成图片或视频,输入:
gemini > Generate a promotional image for a tech event
系统会调用媒体生成工具并返回结果。
6. 实时搜索
Gemini CLI 可通过 Google 搜索获取实时信息。例如:
gemini > Search for recent JavaScript frameworks and summarize their features
系统会搜索最新框架并生成总结。
7. 自定义设置
用户可通过 GEMINI.md
文件设置系统提示。例如,创建 GEMINI.md
:
System Prompt: Respond in a concise and technical tone.
运行 gemini
,系统会根据提示调整输出风格。
命令参数
Gemini CLI 支持多种参数,增强灵活性:
-m, --model
:选择模型(如gemini-2.5-pro
)。例如:gemini -m gemini-2.5-pro
-s, --style
:设置输出主题(如dark
)。例如:gemini -s dark
-w, --wrap
:设置输出换行长度。例如:gemini -w 80
注意事项
- 确保 Node.js 版本为 18 或以上,否则可能出现兼容性问题。
- 检查网络连接,认证和实时搜索需要稳定网络。
- 免费账户有请求限制,超限需使用 API 密钥。
- 参考 故障排除指南 解决常见问题。
- 查看 完整文档 获取更多细节。
应用场景
- 快速开发原型
开发者可通过自然语言描述生成应用代码。例如,从 PDF 需求文档生成 Web 应用,节省开发时间。 - 代码库分析
新接手项目的开发者可使用 Gemini CLI 分析代码库架构或安全机制,快速熟悉项目。 - 自动化运维
DevOps 工程师可自动化处理拉取请求或生成 git 历史报告,提升团队协作效率。 - 文件批量处理
数据分析师可批量整理 PDF 发票或转换图片格式,简化繁琐的文件管理工作。 - 内容创作
内容创作者可生成视频脚本或促销图片,快速将创意转化为可执行内容。