A IBM lançou o Granite 3.2, uma nova geração de modelos de IA empresarial, mais eficientes e acessíveis, disponíveis sob licença Apache 2.0
A IBM lançou a nova geração da sua família de Large Language Models (LLM), Granite, com a versão Granite 3.2, num esforço para fornecer Inteligência Artificial (IA) empresarial mais pequena, eficiente e prática, com impacto no mundo real. Todos os novos modelos Granite 3.2 estão disponíveis sob licença permissiva Apache 2.0 na plataforma Hugging Face. Estão também acessíveis no IBM watsonx.ai, Ollama, Replicate e LM Studio. Os principais destaques da nova versão dos modelos de linguagem de visão (VLM) e segurança da IBM incluem avanços significativos no desempenho e novas funcionalidades. A IBM apresentou um modelo de VLM para tarefas de compreensão de documentos, que demonstra um desempenho comparável ou superior a modelos muito maiores, como Llama 3.2 11B e Pixtral 12B. O modelo foi aprimorado com 85 milhões de PDFs processados e 26 milhões de pares sintéticos de pergunta-resposta. Além disso, os modelos 3.2 de 2B e 8B incluem capacidades de Chain of Thought, melhorando o raciocínio e otimizando a eficiência, com destaque para o modelo 8B. Com novos métodos de escalabilidade, o modelo Granite 3.2 8B rivaliza com modelos maiores em raciocínio matemático, como o Claude3.5-Sonnet e o GPT-4. Os modelos Granite Guardian 3.2, de tamanho reduzido, mantêm o desempenho da versão anterior e introduzem uma funcionalidade de confiança verbalizada, melhorando a avaliação de risco na monitorização de segurança. “No CrushBank, testemunhámos em primeira mão como é que os modelos de IA abertos e eficientes da IBM entregam valor real para a IA empresarial, oferecendo o equilíbrio certo entre desempenho, custo-benefício e escalabilidade”, refere David Tan, CTO do CrushBank. O Granite 3.2 é um passo essencial para a evolução do portfólio e da estratégia da IBM, com o objetivo de fornecer IA mais pequena e prática às empresas. Juntamente com os modelos de instrução, visão e proteção do Granite 3.2, a IBM está a lançar a próxima geração dos seus modelos TinyTimeMixers, com capacidades para previsões de longo prazo de até dois anos no futuro. “A próxima era da IA é sobre eficiência, integração e impacto no mundo real – onde as empresas podem alcançar resultados poderosos sem gastos excessivos em computação”, afirma Sriram Raghavan, VP da IBM AI Research. “Os últimos desenvolvimentos do Granite da IBM focam-se em soluções abertas, demonstrando um passo à frente para tornar a IA mais acessível, rentável e valiosa para as empresas modernas”. |