Categories: Cloud

IBM expande a família de modelos Granite com nova IA multimodal

A IBM lançou a próxima geração de sua família de modelos de linguagem (LLM) Granite, Granite 3.2, em um esforço contínuo para fornecer uma IA para negócios pequena, eficiente e prática que gere impacto no mundo real.

Todos os modelos Granite 3.2 estão disponíveis sob a licença Apache 2.0 no Hugging Face. Modelos selecionados estão disponíveis no IBM watsonx.ai, Ollama, Replicate e LM Studio, e são esperados em breve no RHEL AI 1.5 – trazendo recursos avançados para empresas e para a comunidade de código aberto.

Os destaques incluem um novo modelo de linguagem de visão (VLM), para tarefas de compreensão de documentos, “que demonstra desempenho que corresponde ou excede o de modelos significativamente maiores”, como Llama 3.2 11B e Pixtral 12B, nos benchmarks empresariais essenciais DocVQA, ChartQA, AI2D e OCRBen.

Além de dados de treinamento, a IBM usou seu próprio kit de ferramentas Docling de código aberto para processar 85 milhões de PDFs e gerou 26 milhões de pares sintéticos de perguntas e respostas para aprimorar a capacidade do VLM de lidar com fluxos de trabalho complexos e pesados em documentos.

Igualmente em destaque estão as funções de cadeia de pensamento para raciocínio aprimorado nos modelos 3.2 2B e 8B, com a capacidade de ativar ou desativar o raciocínio para ajudar a otimizar a eficiência.

Com esse recurso, o modelo 8B alcança melhorias de dois dígitos em relação ao seu antecessor em benchmarks de acompanhamento de instruções como ArenaHard e Alpaca Eval, sem degradação da segurança ou do desempenho em outros lugares.

Opções de tamanho reduzido para modelos de segurança Granite Guardian que mantêm o desempenho dos modelos anteriores Granite 3.1 Guardian com redução de 30% no tamanho são também destaque neste lançamento IBM.

Os modelos 3.2 também introduzem um novo recurso chamado confiança verbalizada, que oferece uma avaliação de risco mais detalhada que reconhece a ambiguidade no monitoramento de segurança.

A estratégia da IBM de fornecer modelos de IA menores e especializados para empresas continua a demonstrar eficácia em testes, com o modelo Granite 3.1 8B recentemente rendendo altas notas em precisão no Salesforce LLM Benchmark para CRM.

A família Granite Model é apoiada por um ecossistema de parceiros, incluindo empresas de software que incorporam modelos Granite em suas tecnologias.

“No CrushBank, vimos em primeira mão como os modelos de IA abertos e eficientes da IBM oferecem valor real para a IA empresarial, oferecendo o equilíbrio certo entre desempenho, custo-benefício e escalabilidade”, disse David Tan, CTO do CrushBank.

O Granite 3.2 é um passo na evolução do portfólio e da estratégia da IBM para fornecer IA pequena e prática para empresas.

Embora as abordagens de “cadeia de pensamento” para raciocínio sejam poderosas, elas exigem poder de computação substancial que não é necessário para todas as tarefas. É por isso que a IBM introduziu a capacidade de ativar ou desativar a cadeia de pensamento programaticamente.

“A próxima era da IA é sobre eficiência, integração e impacto no mundo real – onde as empresas podem alcançar resultados poderosos sem gastos excessivos em computação”, disse Sriram Raghavan, VP da IBM AI Research.

Claudia Sargento