Bengaluru, 8 de fevereiro: Embora a conversa global sobre IA seja frequentemente dominada pelos EUA e pela China, a Índia está a começar a afirmar-se nas principais inovações da IA, e a startup Sarvam AI, sediada em Bengaluru, está a liderar essa mudança. A empresa está construindo o que chama de “inteligência artificial soberana”, desenvolvendo modelos centrais inteiramente na Índia. Suas ferramentas mais recentes, Sarvam Vision e Bulbul V3, estão atraindo agora a atenção global por seu forte desempenho.
Sarvam Vision, o modelo de reconhecimento óptico de caracteres (OCR) da empresa, supera os principais sistemas de IA, como ChatGPT, Google Gemini e Anthropic Claude em métricas importantes. De acordo com Sarvam AI, o modelo alcançou uma pontuação de precisão de 84,3 por cento no olmOCR-Bench, superando Gemini 3 Pro e DeepSeek OCR v2, enquanto ChatGPT teve classificação significativamente inferior. Cúpula de Impacto da IA na Índia 2026: O secretário-geral da ONU, António Guterres, dá as boas-vindas à liderança da Índia antes do evento importante.
No OmniDocBench v1.5, que avalia quão bem os sistemas de IA leem e entendem documentos do mundo real, a Sarvam Vision obteve impressionantes 93,28% no geral. O modelo mostrou um desempenho particularmente forte em layouts complexos, tabelas técnicas e fórmulas matemáticas, áreas onde os sistemas tradicionais de OCR muitas vezes enfrentam dificuldades devido à formatação confusa e ao conteúdo denso.
O cofundador da Sarvam AI, Pratyush Kumar, compartilhou detalhes dessas conquistas em uma série de postagens no X, destacando o progresso dos modelos internos de IA da empresa. Os fortes resultados de benchmark ajudaram a Sarvam a obter reconhecimento global, especialmente depois de críticas anteriores pelo seu foco em modelos de língua indiana. ‘O uso ético da IA não é negociável’: o primeiro-ministro Narendra Modi se reúne com CEOs para impulsionar a missão de IA da Índia antes da Cúpula AI Impact India 2026
O comentarista técnico Deedy Das, que anteriormente questionou o valor de treinar modelos menores na língua indiana, admitiu publicamente que subestimou a IA Sarvam. Em uma postagem no Xu, Das elogiou o OCR e os modelos de fala da empresa para as línguas indianas, chamando-os de muito valiosos e observando que os grandes laboratórios globais de IA ignoraram amplamente esse espaço. Os usuários expressaram sentimentos semelhantes, com muitos elogiando a precisão e confiabilidade das ferramentas do Sarvam.
Junto com a Sarvam Vision, a startup lançou o Bulbul V3, um novo modelo de conversão de texto em fala de IA projetado para idiomas indianos. A ferramenta visa gerar vozes naturais e expressivas, competindo com players globais como a ElevenLabs. Atualmente, o Bulbul V3 suporta mais de 35 vozes em 11 idiomas indianos, com planos de expansão para 22 idiomas no futuro.
Bulbul também recebeu fortes elogios ao ecossistema. Pratik Desai, fundador da KissanAI, disse que Bulbul é o modelo de conversão de texto em fala para casos de uso indianos e observou que melhora a cada lançamento, enquanto as alternativas globais permanecem caras e menos práticas para os idiomas indianos.
(A história acima apareceu pela primeira vez em LatestLY em 08 de fevereiro de 2026 às 21:22 IST. Para mais notícias e atualizações sobre política, mundo, esportes, entretenimento e estilo de vida, acesse nosso site Latestly.com).









