Categories: Cloud

IBM expande a família de modelos Granite com nova IA multimodal

A IBM lançou a próxima geração de sua família de modelos de linguagem (LLM) Granite, Granite 3.2, em um esforço contínuo para fornecer uma IA para negócios pequena, eficiente e prática que gere impacto no mundo real.

Todos os modelos Granite 3.2 estão disponíveis sob a licença Apache 2.0 no Hugging Face. Modelos selecionados estão disponíveis no IBM watsonx.ai, Ollama, Replicate e LM Studio, e são esperados em breve no RHEL AI 1.5 – trazendo recursos avançados para empresas e para a comunidade de código aberto.

Os destaques incluem um novo modelo de linguagem de visão (VLM), para tarefas de compreensão de documentos, “que demonstra desempenho que corresponde ou excede o de modelos significativamente maiores”, como Llama 3.2 11B e Pixtral 12B, nos benchmarks empresariais essenciais DocVQA, ChartQA, AI2D e OCRBen.

Além de dados de treinamento, a IBM usou seu próprio kit de ferramentas Docling de código aberto para processar 85 milhões de PDFs e gerou 26 milhões de pares sintéticos de perguntas e respostas para aprimorar a capacidade do VLM de lidar com fluxos de trabalho complexos e pesados em documentos.

Igualmente em destaque estão as funções de cadeia de pensamento para raciocínio aprimorado nos modelos 3.2 2B e 8B, com a capacidade de ativar ou desativar o raciocínio para ajudar a otimizar a eficiência.

Com esse recurso, o modelo 8B alcança melhorias de dois dígitos em relação ao seu antecessor em benchmarks de acompanhamento de instruções como ArenaHard e Alpaca Eval, sem degradação da segurança ou do desempenho em outros lugares.

Opções de tamanho reduzido para modelos de segurança Granite Guardian que mantêm o desempenho dos modelos anteriores Granite 3.1 Guardian com redução de 30% no tamanho são também destaque neste lançamento IBM.

Os modelos 3.2 também introduzem um novo recurso chamado confiança verbalizada, que oferece uma avaliação de risco mais detalhada que reconhece a ambiguidade no monitoramento de segurança.

A estratégia da IBM de fornecer modelos de IA menores e especializados para empresas continua a demonstrar eficácia em testes, com o modelo Granite 3.1 8B recentemente rendendo altas notas em precisão no Salesforce LLM Benchmark para CRM.

A família Granite Model é apoiada por um ecossistema de parceiros, incluindo empresas de software que incorporam modelos Granite em suas tecnologias.

“No CrushBank, vimos em primeira mão como os modelos de IA abertos e eficientes da IBM oferecem valor real para a IA empresarial, oferecendo o equilíbrio certo entre desempenho, custo-benefício e escalabilidade”, disse David Tan, CTO do CrushBank.

O Granite 3.2 é um passo na evolução do portfólio e da estratégia da IBM para fornecer IA pequena e prática para empresas.

Embora as abordagens de “cadeia de pensamento” para raciocínio sejam poderosas, elas exigem poder de computação substancial que não é necessário para todas as tarefas. É por isso que a IBM introduziu a capacidade de ativar ou desativar a cadeia de pensamento programaticamente.

“A próxima era da IA é sobre eficiência, integração e impacto no mundo real – onde as empresas podem alcançar resultados poderosos sem gastos excessivos em computação”, disse Sriram Raghavan, VP da IBM AI Research.

Claudia Sargento

Recent Posts

Programa Mais Ciência na Escola chega no Ceará

Iniciativa vai implantar laboratórios maker em 75 escolas públicas, estaduais e municipais distribuídas por todo…

20 horas ago

CXone Mpower Copilot tem aumento de 400% nas interações em 2024

Solução da NICE possibilitou 6 bilhões de interações e a análise de 2 trilhões de…

2 dias ago

Anatel e Insper firmam parceria estratégica

Protocolo de Intenções entre o órgão e a instituição promove colaboração em áreas de interesse…

2 dias ago

Trend Micro lidera ranking da Canalys como fornecedora de segurança

A empresa foi reconhecida pela "inovação e o engajamento consistente de parceiros".

2 dias ago

Como as marcas podem conquistar a geração Alpha?

Gauge traz dicas para que as empresas se conectem e fidelizem os consumidores mais jovens…

4 dias ago

Aquecimento da renda fixa impulsiona tecnologia em bancos

Popularização de modalidade requer soluções robustas para que as aplicações possam ser feitas de forma…

4 dias ago