- Claude é usado muito mais por desenvolvedores do que por atendimento ao cliente, vendas, finanças ou comércio eletrônico
- Agora funciona de forma mais autônoma do que nunca, incluindo tarefas complexas
- Claude ilumina mais os detalhes do que interrompe os humanos
A Anthropic revelou que metade de todas as chamadas de ferramentas de API públicas vêm da engenharia de software, enquanto outros setores, como atendimento ao cliente, vendas, finanças e comércio eletrônico, representam apenas alguns pontos percentuais.
Junto com isso, descobriu-se que Claude Code estava trabalhando mais do que nunca em modo autônomo, agora mais de 45 minutos em comparação com menos de 25 minutos há três meses.
A OpenAI afirma que o aumento na autonomia não se correlaciona com os seus mais recentes modelos de alto desempenho, sugerindo uma mudança mais ampla para a IA do agente do que os testes do seu novo modelo.
A Agentic AI está aqui, e o mais comum é a codificação
Em uma nova postagem no blog, a OpenAI observou como os usuários estão começando a construir confiança com a IA à medida que as tarefas se tornam mais ambiciosas, no entanto, ainda há “sobrecarga de implantação”, onde os modelos ainda são capazes de fazer mais do que os usuários podem suportar. Avaliações externas também demonstram que os modelos podem realizar tarefas muito mais longas em condições ideais.
Claude também está ajudando na área de confiança, com os humanos parando para fazer perguntas esclarecedoras em vez de interromper.
Quando se trata de codificação, parece que quanto mais complexa a tarefa, menos supervisão humana existe. Tarefas complexas como descoberta de exploits e escrita de compiladores recebem cerca de 67% de supervisão humana, em comparação com 87% de supervisão para tarefas simples de API.
Claude também faz o dobro de perguntas do que em tarefas simples de alta complexidade.
Olhando para o futuro, a Anthropic discutiu a importância dos modelos de treinamento para reconhecer a incerteza e fazer perguntas esclarecedoras de forma proativa. A empresa também não recomenda a exigência de aprovação manual para cada ação, dizendo que isso aumenta o atrito sem aumentar a segurança.
Siga o TechRadar no Google Notícias e adicione-nos como sua fonte padrão para receber notícias, opiniões e opiniões de nossos especialistas em feeds. Certifique-se de clicar no botão Continuar!
E é claro que você também pode Siga o TechRadar no TikTok para receber novidades, análises, unboxings em formato de vídeo e receber atualizações constantes nossas WhatsApp também










