A IBM lançou a próxima geração de sua família de modelos de linguagem (LLM) Granite, Granite 3.2, em um esforço contínuo para fornecer uma IA para negócios pequena, eficiente e prática que gere impacto no mundo real.
Todos os modelos Granite 3.2 estão disponíveis sob a licença Apache 2.0 no Hugging Face. Modelos selecionados estão disponíveis no IBM watsonx.ai, Ollama, Replicate e LM Studio, e são esperados em breve no RHEL AI 1.5 – trazendo recursos avançados para empresas e para a comunidade de código aberto.
Os destaques incluem um novo modelo de linguagem de visão (VLM), para tarefas de compreensão de documentos, “que demonstra desempenho que corresponde ou excede o de modelos significativamente maiores”, como Llama 3.2 11B e Pixtral 12B, nos benchmarks empresariais essenciais DocVQA, ChartQA, AI2D e OCRBen.
Além de dados de treinamento, a IBM usou seu próprio kit de ferramentas Docling de código aberto para processar 85 milhões de PDFs e gerou 26 milhões de pares sintéticos de perguntas e respostas para aprimorar a capacidade do VLM de lidar com fluxos de trabalho complexos e pesados em documentos.
Igualmente em destaque estão as funções de cadeia de pensamento para raciocínio aprimorado nos modelos 3.2 2B e 8B, com a capacidade de ativar ou desativar o raciocínio para ajudar a otimizar a eficiência.
Com esse recurso, o modelo 8B alcança melhorias de dois dígitos em relação ao seu antecessor em benchmarks de acompanhamento de instruções como ArenaHard e Alpaca Eval, sem degradação da segurança ou do desempenho em outros lugares.
Opções de tamanho reduzido para modelos de segurança Granite Guardian que mantêm o desempenho dos modelos anteriores Granite 3.1 Guardian com redução de 30% no tamanho são também destaque neste lançamento IBM.
Os modelos 3.2 também introduzem um novo recurso chamado confiança verbalizada, que oferece uma avaliação de risco mais detalhada que reconhece a ambiguidade no monitoramento de segurança.
A estratégia da IBM de fornecer modelos de IA menores e especializados para empresas continua a demonstrar eficácia em testes, com o modelo Granite 3.1 8B recentemente rendendo altas notas em precisão no Salesforce LLM Benchmark para CRM.
A família Granite Model é apoiada por um ecossistema de parceiros, incluindo empresas de software que incorporam modelos Granite em suas tecnologias.
“No CrushBank, vimos em primeira mão como os modelos de IA abertos e eficientes da IBM oferecem valor real para a IA empresarial, oferecendo o equilíbrio certo entre desempenho, custo-benefício e escalabilidade”, disse David Tan, CTO do CrushBank.
O Granite 3.2 é um passo na evolução do portfólio e da estratégia da IBM para fornecer IA pequena e prática para empresas.
Embora as abordagens de “cadeia de pensamento” para raciocínio sejam poderosas, elas exigem poder de computação substancial que não é necessário para todas as tarefas. É por isso que a IBM introduziu a capacidade de ativar ou desativar a cadeia de pensamento programaticamente.
“A próxima era da IA é sobre eficiência, integração e impacto no mundo real – onde as empresas podem alcançar resultados poderosos sem gastos excessivos em computação”, disse Sriram Raghavan, VP da IBM AI Research.
Iniciativa vai implantar laboratórios maker em 75 escolas públicas, estaduais e municipais distribuídas por todo…
Solução da NICE possibilitou 6 bilhões de interações e a análise de 2 trilhões de…
Protocolo de Intenções entre o órgão e a instituição promove colaboração em áreas de interesse…
A empresa foi reconhecida pela "inovação e o engajamento consistente de parceiros".
Gauge traz dicas para que as empresas se conectem e fidelizem os consumidores mais jovens…
Popularização de modalidade requer soluções robustas para que as aplicações possam ser feitas de forma…