O Gemini CLI é uma ferramenta de linha de comando de código aberto desenvolvida pelo Google, com base no modelo Gemini 2.5 Pro, que permite aos usuários trabalhar com a funcionalidade de IA diretamente no terminal. Ela oferece suporte a tarefas como trabalhar com grandes bases de código, gerar aplicativos, automatizar fluxos de trabalho e gerenciar arquivos. O uso é gratuito com uma conta pessoal do Google, com até 60 solicitações por minuto e 1.000 solicitações por dia. A CLI Gemini está licenciada sob a licença Apache 2.0 e o código está disponível publicamente para que os desenvolvedores possam modificar e contribuir. Ela é leve, fácil de usar e adequada para que os desenvolvedores concluam tarefas complexas com eficiência no terminal.
Lista de funções
- operação da base de código Consulte e edite uma base de código com mais de um milhão de tokens e ofereça suporte à análise de projetos complexos.
- Geração de aplicativos Geração de novos aplicativos a partir de PDFs ou esboços desenhados à mão, aproveitando os recursos multimodais do Gemini.
- Automação do fluxo de trabalho Gerencie solicitações pull, rebases complexos ou gere relatórios de histórico do git.
- suporte multimodal Manipula uma ampla gama de dados, como texto, código, imagens, áudio e vídeo.
- Pesquisa em tempo real Informações externas em tempo real: fornece informações externas em tempo real para o modelo por meio da pesquisa no Google.
- Gerenciamento de documentos Conversão em lote de formatos de imagem ou organização de arquivos PDF por data.
- integração de ferramentas Conecte ferramentas de geração de mídia, como Imagen, Veo ou Lyria, por meio de servidores MCP.
- Configurações personalizadas Personalize a experiência interativa ajustando os avisos do sistema por meio de arquivos de configuração.
Usando a Ajuda
Processo de instalação
Para usar a CLI do Gemini, os usuários precisam concluir as seguintes etapas de instalação e configuração:
- Preparação ambiental
Certifique-se de que o Node.js (versão 18 ou superior) esteja instalado. O download do Node.js pode ser feito em Site oficial do Node.js Faça o download e instale. - Instalação da CLI do Gemini
Há duas opções de montagem:- Execução via npx (não é necessária nenhuma instalação global):
É executado no terminal:
npx https://github.com/google-gemini/gemini-cli
Isso fará o download direto e executará a versão mais recente.
- instalação global ::
Execute o seguinte comando para instalar globalmente:
npm install -g @google/gemini-cli
Após a conclusão da instalação, execute
gemini
Entre no modo interativo. - Execução via npx (não é necessária nenhuma instalação global):
- Selecionar tópico
Na primeira execução, você será solicitado a selecionar um tema de cor (por exemploascii
edark
elight
). Selecione sob demanda, o padrão éascii
. - Configuração de autenticação
A CLI do Gemini requer uma conta do Google ou uma chave de API para autenticação:- Conta pessoal do Google : Executar
gemini
Em seguida, você será direcionado para fazer login na sua conta do Google e autorizar o uso, com 60 solicitações gratuitas por minuto e 1.000 por dia. - Chave da API ::
- entrevistas Estúdio de IA do Google Gerar a chave.
- Defina as variáveis de ambiente no terminal:
export GEMINI_API_KEY="YOUR_API_KEY"
intercambialidade
YOUR_API_KEY
para a chave real. A chave de API é adequada para usuários que precisam de cotas de solicitação mais altas.
- Conta do Google Workspace : Referência Guia de certificação Configuração.
- Conta pessoal do Google : Executar
- Iniciando a CLI do Gemini
Após a conclusão da autenticação, execute:gemini
O sistema entra em um modo interativo que exibe
gemini >
Cue, prepare-se para receber ordens.
Funções principais
A funcionalidade principal da CLI do Gemini gira em torno das interações de IA no terminal. Abaixo estão instruções detalhadas sobre como fazer isso:
1. operações de base de código
A CLI do Gemini lida com grandes bases de código e é adequada para analisar e editar projetos complexos. Exemplo:
- Analisar a arquitetura do projeto : Vá para o diretório do projeto e execute:
gemini > Describe the main pieces of this system's architecture
O sistema retorna uma visão geral da arquitetura da base de código.
- Mecanismo de segurança de consulta : Entrada:
gemini > What security mechanisms are in place?
O sistema analisa o código e lista as medidas de segurança.
- Implementação de problemas do GitHub : Entrada:
gemini > Implement a first draft for GitHub issue #123
O sistema gera um primeiro rascunho do código e oferece uma opção de salvar.
2. geração de aplicativos
Use os recursos multimodais do Gemini para gerar aplicativos a partir de PDFs ou esboços. Exemplo:
- Gerar aplicativos a partir de PDF Coloque o PDF no diretório do projeto e execute-o:
gemini > Generate an app from requirements.pdf
O sistema analisa o conteúdo do PDF e gera o código do aplicativo.
- Gerar aplicativos a partir de esboços : Carregue uma imagem de esboço desenhado à mão, entre:
gemini > Create a web app from sketch.jpg
O sistema gera um aplicativo da Web baseado em esboço.
3. automação do fluxo de trabalho
A CLI do Gemini oferece suporte a tarefas de desenvolvimento automatizadas. Por exemplo:
- Geração de um relatório de histórico do git : Entrada:
gemini > Make a slide deck showing the git history from the last 7 days, grouped by feature and team member
O sistema gera uma apresentação de slides contendo o histórico do git.
- Manuseio de rebases complexas : Entrada:
gemini > Help me perform a complex rebase on branch feature-x
O sistema fornece instruções passo a passo para concluir o rebase.
4. gerenciamento de documentos
A CLI do Gemini gerencia arquivos de forma eficiente. Por exemplo:
- Converter formatos de imagem Executa no diretório de imagens:
gemini > Convert all the images in this directory to png, and rename them to use dates from the exif data
O sistema converterá a imagem para o formato PNG e a renomeará de acordo com a data EXIF.
- Organizar arquivos PDF : Entrada:
gemini > Organise my PDF invoices by month of expenditure
O sistema classifica os PDFs por mês com base nos metadados.
5. suporte multimodal e geração de mídia
A CLI do Gemini suporta a manipulação de vários tipos de dados e a integração de ferramentas de geração de mídia por meio de servidores MCP. Por exemplo:
- Gerar robô de discórdia : Entrada:
gemini > Write a Gemini Discord bot that answers questions using a FAQ.md file
O sistema gera um código de robô com base no FAQ.md.
- Gerar conteúdo de mídia Geração de imagens ou vídeos via Imagen ou Veo, entrada:
gemini > Generate a promotional image for a tech event
O sistema chamará a ferramenta de geração de mídia e retornará os resultados.
6. pesquisa em tempo real
A CLI do Gemini pode ser pesquisada pelo Google para obter informações em tempo real. Por exemplo:
gemini > Search for recent JavaScript frameworks and summarize their features
O sistema procura as estruturas mais recentes e gera resumos.
7. configurações personalizadas
Os usuários podem acessar o GEMINI.md
para configurar um prompt do sistema. Por exemplo, criar GEMINI.md
::
System Prompt: Respond in a concise and technical tone.
estar em movimento gemini
o sistema ajustará o estilo de saída de acordo com os avisos.
parâmetro de comando
A CLI do Gemini suporta vários parâmetros para maior flexibilidade:
-m, --model
Selecione o modelo (por exemplogemini-2.5-pro
). Exemplo:gemini -m gemini-2.5-pro
-s, --style
Tema de saída: Defina o tema de saída (por exemplodark
). Exemplo:gemini -s dark
-w, --wrap
Define o comprimento da nova linha de saída. Exemplo:gemini -w 80
advertência
- Certifique-se de que a versão do Node.js seja 18 ou superior, caso contrário, poderão ocorrer problemas de compatibilidade.
- Verifique a conexão de rede, pois é necessária uma rede estável para autenticação e pesquisa em tempo real.
- As contas gratuitas têm um limite de solicitações e uma chave de API é necessária para exceder o limite.
- consulta Guia de solução de problemas Solução de problemas comuns.
- confira documento completo Obtenha mais detalhes.
cenário do aplicativo
- Prototipagem rápida
Os desenvolvedores podem gerar código de aplicativo a partir de descrições em linguagem natural. Por exemplo, a geração de um aplicativo da Web a partir de um documento de requisitos em PDF economiza tempo de desenvolvimento. - Análise da base de código
Os desenvolvedores novatos em um projeto podem usar a CLI do Gemini para analisar a arquitetura da base de código ou os mecanismos de segurança e se familiarizar rapidamente com o projeto. - operação e manutenção automatizadas (O&M)
Os engenheiros de DevOps podem automatizar solicitações pull ou gerar relatórios de histórico do git para melhorar a colaboração da equipe. - Processamento de lotes de documentos
O Data Analyst pode agrupar em lote faturas em PDF ou converter imagens para simplificar o tedioso gerenciamento de documentos. - criação de conteúdo
Os criadores de conteúdo podem gerar roteiros de vídeo ou imagens promocionais para transformar rapidamente ideias em conteúdo prático.
QA
- Há alguma taxa para a CLI do Gemini?
Gratuito com uma conta pessoal do Google, 60 solicitações por minuto, 1.000 solicitações por dia. Cotas mais altas exigem uma chave de API ou um plano pago. - Como faço para contribuir com o código?
entrevistas Diretrizes de contribuiçãoclonar o repositório, enviar um problema ou uma solicitação pull. - Quais são os modelos suportados?
Uso padrãogemini-1.5-flash
Isso pode ser feito por meio do-m
O parâmetro muda para ogemini-2.5-pro
e outros modelos. - E se a autenticação falhar?
Verifique a validade da rede, da conta do Google ou da chave de API. Consulte Guia de certificação Solução de problemas. - Como posso visualizar os comandos suportados?
confira arquivo de comando Saiba mais sobre todos os comandos disponíveis.