O ERNIE 4.5 é uma família de modelos de grande porte de código aberto desenvolvida pela Baidu com base na estrutura PaddlePaddle, abrangendo uma ampla gama de modelos de 0,3B a 424B de parâmetros, suportando processamento de texto, geração de imagens e tarefas multimodais. O projeto está hospedado no GitHub, com o Hugging Face fornecendo downloads de modelos e suporte à comunidade, e o AIStudio fornecendo aos desenvolvedores uma plataforma de treinamento e implantação on-line. O ERNIE 4.5 usa a arquitetura Mixed Expertise (MoE) para otimizar a eficiência computacional em uma ampla variedade de cenários, de dispositivos móveis a servidores de alto desempenho. O modelo supera modelos semelhantes em tarefas como raciocínio matemático, seguimento de instruções e memória de conhecimento do mundo, e o PaddlePaddle fornece o kit de ferramentas ERNIEKit para dar suporte ao treinamento, à compactação e à implantação do modelo, reduzindo a barreira ao desenvolvimento.
Lista de funções
- Oferece suporte a tarefas multimodais e lida com texto misto, imagem e entrada visual-verbal.
- Uma ampla gama de modelos de parâmetros de 0,3B a 424B está disponível para atender a diferentes hardwares.
- Integração do kit de ferramentas ERNIEKit para apoiar o treinamento, o ajuste fino e a compactação do modelo.
- Fornece ferramentas FastDeploy para otimizar a inferência e a implementação de modelos grandes.
- Suporta treinamento de sequência longa de 8K, adequado para o processamento de tarefas complexas.
- Compatível com downloads de modelos Hugging Face para simplificar a aquisição de modelos.
- Um ambiente de desenvolvimento on-line está disponível por meio do AIStudio para dar suporte à rápida experimentação e implementação.
Usando a Ajuda
Instalação e configuração do ambiente
Para usar os modelos do ERNIE 4.5, primeiro você precisa instalar a estrutura do PaddlePaddle e o kit de ferramentas do ERNIEKit. Veja a seguir as etapas detalhadas de instalação:
- Instalando o PaddlePaddle
Selecione a versão da GPU ou da CPU de acordo com seu ambiente de hardware. Execute o seguinte comando para instalar:# GPU 版本 pip install --upgrade paddlepaddle-gpu # CPU 版本 pip install --upgrade paddlepaddle
Recomenda-se o Python 3.8 ou posterior, e certifique-se de ter a versão mais recente do pip instalada em seu sistema.
- Instalação do ERNIEKit
Clone o repositório ERNIE do GitHub e instale o ERNIEKit:git clone https://github.com/PaddlePaddle/ERNIE.git cd ERNIE pip install -r requirements.txt
O ERNIEKit oferece treinamento e compactação de modelos e pode ser usado diretamente com scripts pré-configurados após a instalação.
- Modelos para download
O modelo ERNIE 4.5 pode ser baixado do site Hugging Face. O modelo 0.3B é usado como exemplo:huggingface-cli download baidu/ERNIE-4.5-0.3B-Paddle --local-dir baidu/ERNIE-4.5-0.3B-Paddle
Após o download, os arquivos do modelo serão armazenados em um diretório especificado para treinamento ou inferência local.
- Configurar o ambiente do AIStudio (opcional)
entrevistas AIStudioO AIStudio fornece potência de computação em nuvem com o PaddlePaddle pré-instalado para testes e implementações rápidas.
Funções principais
1. treinamento de modelos
O ERNIE 4.5 oferece suporte ao ajuste fino supervisionado (SFT) para sequências muito longas (8K). Tome o modelo 0.3B como exemplo e execute o seguinte comando:
erniekit train examples/configs/ERNIE-4.5-0.3B/sft/run_sft_8k.yaml
arquivo de configuração run_sft_8k.yaml
Contém parâmetros de modelo e configurações de treinamento e está localizado no repositório do GitHub em examples/configs
Catálogo. Os usuários podem modificar a taxa de aprendizado, o tamanho do lote e outros parâmetros, conforme necessário. O treinamento requer uma GPU com pelo menos 16 GB de memória de vídeo, recomendando-se a NVIDIA A100 ou superior.
2. tarefas multimodais
O ERNIE 4.5 suporta entrada mista de texto e imagem, o que é adequado para a geração de conteúdo gráfico. Por exemplo, use o módulo ERNIE-ViLG para geração de texto para imagem:
import paddlehub as hub
module = hub.Module(name="ernie_vilg")
results = module.generate_image(text_prompt=["一片宁静的湖泊"], style="landscape")
Os usuários precisam instalar o PaddleHub primeiro:
pip install --upgrade paddlehub
O resultado gerado será salvo como um arquivo de imagem, que é adequado para criatividade publicitária, design artístico e outros cenários.
3. inferência e implantação de modelos
A ferramenta FastDeploy otimiza o desempenho da inferência do modelo e oferece suporte à quantização de 4 bits/2 bits. Execute o seguinte comando para implantar o modelo:
fastdeploy --model baidu/ERNIE-4.5-0.3B-Paddle --device gpu --quantize q4
Uma vez implantado, o modelo pode ser executado em dispositivos com poucos recursos, como um Raspberry Pi, adequado para cenários de computação de ponta.
4. desenvolvimento on-line com o AIStudio
Na plataforma AIStudio, os desenvolvedores podem carregar diretamente os modelos ERNIE 4.5, carregar conjuntos de dados e executar tarefas de treinamento. A plataforma oferece uma interface visual para simplificar o ajuste de hiperparâmetros e a avaliação de modelos. Os usuários podem seguir as etapas abaixo:
- Faça login no AIStudio e crie um novo projeto.
- Selecione o modelo ERNIE 4.5 e importe o conjunto de dados.
- Execute uma tarefa de treinamento ou inferência usando um modelo pré-criado para visualizar registros e resultados em tempo real.
Funções em destaque
- Arquitetura de especialização mista (MoE)Os modelos MoE do ERNIE 4.5 (por exemplo, 300B-A47B) melhoram o desempenho da tarefa multimodal por meio de uma combinação de compartilhamento de parâmetros e parâmetros dedicados. Em comparação com os modelos densos tradicionais, a arquitetura MoE reduz o custo computacional ativando apenas alguns dos parâmetros durante a inferência.
- Suporte a sequências longasComprimento da sequência de 8K para suportar o processamento de documentos complexos e o diálogo em várias rodadas, adequado para tarefas como análise de documentos jurídicos e geração de histórias longas.
- Implementação eficienteFastDeploy: O FastDeploy oferece colaboração paralela de vários especialistas e técnicas de quantificação para garantir que os modelos sejam executados com eficiência em hardware de baixo custo. Por exemplo, um modelo de 0,3B pode ser executado em um Raspberry Pi com 16 GB de RAM.
advertência
- Certifique-se de que o hardware atenda aos requisitos mínimos (consulte a documentação no repositório do GitHub para obter detalhes).
- Verifique regularmente se há atualizações no Hugging Face e no GitHub para obter os modelos e as ferramentas mais recentes.
- O AIStudio oferece aritmética gratuita, mas tarefas de alta carga podem exigir uma atualização paga.
cenário do aplicativo
- pesquisa acadêmica
Os pesquisadores podem usar o ERNIE 4.5 para processar artigos acadêmicos, gerar resumos ou responder a perguntas profissionais. O modelo suporta entradas sequenciais longas e pode analisar documentos complexos para melhorar a eficiência da pesquisa. - criação de conteúdo
Os criadores de conteúdo podem usar o recurso multimodal para gerar material publicitário ou conteúdo de mídia social que combine gráficos e texto. Por exemplo, insira uma descrição de texto para gerar uma imagem que corresponda ao estilo de uma marca. - Implantação de dispositivos de borda
Os desenvolvedores podem implantar o modelo de 0,3B em dispositivos móveis ou de IoT para implementar recursos de processamento de texto ou assistente de voz off-line para ambientes sem rede. - Aplicativos empresariais
As empresas podem criar rapidamente soluções de IA personalizadas, como chatbots de atendimento ao cliente ou ferramentas de análise de dados, com o AIStudio, reduzindo os custos de desenvolvimento.
QA
- Qual é o hardware compatível com o ERNIE 4.5?
O ERNIE 4.5 oferece uma ampla variedade de tamanhos de modelos, com modelos de 0,3B executados em dispositivos de baixo custo, como o Raspberry Pi, e modelos grandes (por exemplo, 424B) que exigem GPUs de alto desempenho (por exemplo, NVIDIA A100). - Como faço para obter os modelos mais recentes?
Faça o download dos modelos mais recentes por meio do Hugging Face ou carregue modelos pré-treinados diretamente da plataforma AIStudio. Verifique regularmente o repositório do GitHub para ver os registros de atualização. - O AIStudio é gratuito?
O AIStudio fornece aritmética básica gratuita para experimentos de pequena escala. Tarefas de alto desempenho exigem a compra de aritmética adicional; para obter os preços, consulte Site oficial do AIStudio. - Quais são as vantagens do ERNIE 4.5 em relação a outros modelos?
O ERNIE 4.5 se destaca em tarefas multimodais e raciocínio matemático, superando o DeepSeek e o Qwen3 em alguns benchmarks. A arquitetura MoE melhora a eficiência em diversos cenários.