Gavin McNamara abandonou o teclado e passa o dia todo conversando em vez de digitar.
Ele fala com seu computador e telefone por horas, enviando e-mails, escrevendo apresentações, postando no LinkedIn e até codificando conversas usando um aplicativo de ditado de IA da Wispr Flow, uma startup de São Francisco.
A IA pontua, formata e adapta essa divagação em uma cópia coerente. McNamara tem uma média de 125 palavras por minuto, o dobro da velocidade média de digitação.
“Neste momento, qualquer coisa que possa ser feita digitando, eu faço falando”, disse o fundador da agência de software Why Not Us, de 32 anos. “Estou apenas conversando.”
Em 77 aplicativos, ele escreveu quase 300 mil palavras nos últimos cinco meses – o equivalente a escrever três romances.
Os titãs e startups da tecnologia da Califórnia estão na vanguarda do movimento para usar a IA e os grandes modelos de linguagem em que se baseiam para encorajar as pessoas a interagir com a tecnologia usando a voz em vez dos dedos.
“AI e LLMs mudaram a dinâmica”, disse CJ Pace, desenvolvedor baseado em San Diego do aplicativo gratuito de ditado de voz para texto Handy. “Usar sua voz é mais rápido do que digitar.”
Uma mistura de desenvolvedores independentes e startups, incluindo Handy, Whisperflow e Velo de São Francisco e outros, surgiu para oferecer interação de voz precisa com inteligência artificial.
Grandes nomes da tecnologia também estão criando novas maneiras de as pessoas interagirem com a IA. Os mais recentes óculos inteligentes da Meta dependem de voz. OpenAI e Meta criaram personalidades separadas para os chats de voz de seus bots. Até a Alexa, da Amazon, e a Siri, da Apple, estão passando por atualizações de IA, que as empresas esperam que façam com que todos falem mais com sua tecnologia.
Esses métodos gratuitos e pagos de uso de palavras faladas em computadores atraem milhões de usuários, incluindo programadores, assistentes executivos, advogados, criadores de conteúdo e profissionais médicos. Alguns otimistas pensam que o teclado pode ficar obsoleto.
“Estou animado em anunciar que removemos os teclados dos prêmios de televisão mais prestigiados do mundo”, disse o fundador da Willow, Alan Guo, em uma postagem no LinkedIn, observando que a equipe do Emmy Awards usou o comando de voz da Willow para enviar mensagens do Slack e limpar rapidamente as caixas de entrada em preparação para a premiação de 2026.
Ao longo dos anos, as principais empresas de tecnologia adaptaram muitos de seus produtos com recursos de voz por conveniência. Longe de ser o pivô de hoje como um recurso de acessórios para uma ferramenta de produção.
No final de 2022, o criador do ChatGPT começou a fornecer acesso contínuo ao seu modelo de reconhecimento automático de fala chamado Whisper, treinado em 680.000 horas de dados multilíngues. OpenAI compartilhou tecnologia para transmissão de áudio precisa, que já foi um grande segredo tecnológico bem guardado. Qualquer pessoa agora pode baixar e executar transições de IA de alta qualidade em seu laptop gratuitamente.
A nova onda de aplicativos de ditado de IA usa o Whisper como base e se desenvolve para oferecer ditado ao vivo. Embora existam alternativas gratuitas, as assinaturas pagas custam entre US$ 8 e US$ 12 por mês.
A arbitragem alimentada por IA está agora ganhando terreno entre programadores e usuários regulares – e incentivando as pessoas a falarem com seus laptops. Seja escrevendo e-mails, enviando SMS, projetando sites ou atribuindo tarefas a IAs, os primeiros usuários dizem que o ditado lhes permite trabalhar mais rápido, pensar com mais clareza e ser mais produtivo.
“As pessoas que optaram por mais voz não vão voltar atrás. Quando você fala em seu laptop 20 horas por semana, digitar parece uma tarefa árdua”, disse Naveen Naidu, gerente geral do aplicativo de ditado de voz Monologue, em Nova York. “Onde eu acho que está no topo: a voz se torna uma camada de delegação. Você fala a sua vontade e as coisas acontecem.”
Esses novos aplicativos de ditado de IA se beneficiam da Apple Fichas avançadas Para executar o comando Dispositivo Pessoal em iPhones e Macs.
Jeffrey Huntley, um desenvolvedor de software independente, mudou quase completamente sua voz para o trabalho em junho.
Freqüentemente, ele inicia projetos abrindo um prompt de voz e pedindo à IA que o entreviste sobre suas preocupações e necessidades do projeto antes que qualquer código seja gerado.
“Estou falando com ele, como se estivesse tocando em uma banda de jazz, para trás, para frente, para trás, para frente”, disse Huntley. Essa dança vocal ajuda a melhorar os recursos, então a IA assume o controle e constrói o software.
Além da codificação, Huntley usa a voz para “saltar” ao debater ideias para postagens em blogs ou mensagens, usando aplicativos como SuperWhisper ou WhisperFlow para obter um “primeiro despejo” de pensamentos antes de ir ao teclado para as edições finais.
Um número crescente de desenvolvedores de software no Vale do Silício dita instruções de codificação por horas a fio, em vez de digitar. A combinação de agentes de IA em rápida evolução, que podem codificar durante horas, absorvendo pensamentos mais rapidamente do que digitar com entradas de voz, aumentou a sua produtividade.
Autodenominado “codificador da web”, McNamara construiu mais de 25 aplicativos da web em questão de meses, uma velocidade de desenvolvimento que teria sido impossível sem a orientação por voz.
“Não acho que (a digitação) vá pegar tão rápido e rápido quanto eu falei”, disse McNamara.
Ele usou algumas horas de conversa e horas para fazer com que a IA criasse o Sprout Gifts, um aplicativo para as crianças registrarem presentes e avaliarem qualquer item por meio de fotos.
É certo que a IA pode cometer erros e o seu trabalho deve ser verificado.
Ao mesmo tempo, a adoção generalizada trouxe novos inconvenientes, já que até mesmo os usuários avançados se sentem desconfortáveis ao falar com seus laptops. Escritórios abertos e lotados não foram projetados para muitas pessoas conversando com seus computadores ao mesmo tempo.
“Adoro o som, mas não em um ambiente de escritório”, disse um usuário do X. “Não gosto de conversar com outras pessoas. Farei isso em um escritório fechado ou irei trabalhar no meu carro”.
McNamara usa fones de ouvido para que as pessoas presumam que ele está em uma ligação.
“É como um hack social que eu tenho”, disse ele.
Embora seja muito cedo para saber se os teclados Qwerty podem acompanhar a obsolescência dos aparelhos de fita e fax, o ritmo em direção à voz está se acelerando, disse Dylan Fox, fundador da Assembly AI, com sede em São Francisco, que oferece módulos de áudio para empresas.
“Estamos definitivamente no início do que acreditamos que será um aumento de 10 a 100 vezes na demanda por voz, aplicativos e interfaces de IA”, disse ele.
Para o programador McNamara, conversar muito com chatbots fez dele um amigo melhor.
Ele era ruim em responder a mensagens de texto. Agora ele vai direto para os amigos.
Ele disse: “Eu respondo tão rápido, quem é esse homem?”






