“Aprender com dados protegidos por direitos autorais é roubo”, diz o fundador da Pleias, Stasenko| Notícias da Índia

Anastasia Stasenko, fundadora do Pleias, um laboratório europeu de inteligência artificial, descreveu sem rodeios a forma como as grandes empresas de IA treinam os seus modelos em dados protegidos por direitos de autor como “roubo”. Falando à HT antes do India AI Impact Summit 2026 em Nova Delhi, Stasenko defendeu sistemas locais “soberanos” em vez dos modelos dependentes da nuvem criados pelos gigantes da tecnologia dos EUA.

Anastasia Stasenko (HT)

“É roubo, ok? Não é uma opinião, é apenas um fato”, disse Stasenko, referindo-se às recentes disputas de direitos autorais envolvendo empresas como OpenAI e Anthropic. Os seus comentários reflectem um crescente debate global sobre se copiar livros, artigos e websites para ensinar sistemas de IA é “uso justo” ou violação de direitos de autor.

Stasenko é um dos fundadores internacionais convidados para a Cúpula de Nova Delhi, que será realizada no Bharat Mandapam de 16 a 20 de fevereiro. Embora muitos dos participantes representem laboratórios de ponta fortemente financiados, competindo para construir modelos maiores, como Google DeepMind, OpenAI, Meta, Microsoft e Anthropic, Pleias seguiu um caminho diferente. A empresa constrói sistemas menores treinados apenas em material de código aberto ou disponível publicamente, projetados para funcionar localmente, em vez de por meio de APIs de nuvem caras.

As críticas de Stasenko surgiram num momento em que os políticos indianos estudam activamente estas questões. O Departamento de Promoção da Indústria e do Comércio Interno (DPIIT) do Ministério do Comércio e Indústria criou um painel de especialistas para determinar se as leis de direitos de autor para a formação em IA precisam de ser alteradas. Num documento de trabalho publicado em dezembro, a comissão propôs um “sistema híbrido” ao abrigo do qual as empresas de IA poderiam obter uma licença geral obrigatória de aprendizagem sobre o acesso legal ao conteúdo. A proposta inclui royalties pagos na fase de utilização comercial através de um mecanismo centralizado.

Abordagem “rebelde”

Stasenko disse que Pleias decidiu deliberadamente testar se grandes conjuntos de dados coletados na Internet eram realmente necessários. “Estávamos um pouco rebeldes porque Sam Altman disse a certa altura que não se pode ensinar boa IA sem realmente roubar a propriedade intelectual de outras pessoas, e pensamos, vamos tentar”, disse ela.

A empresa treina “modelos de linguagem compactos” com 3 bilhões de parâmetros, em vez dos sistemas multibilionários desenvolvidos pelos principais laboratórios dos EUA. Pleias também divulgou o Common Corpus, que Stasenko descreve como o maior conjunto de dados abertos do mundo para treinamento LLM, com mais de 2 trilhões de tokens, acrescentando que tem sido usado por vários modelos de linguagem “soberanos” ou desenvolvidos nacionalmente.

Foco no Sul Global

Ao contrário dos chatbots baseados em nuvem, os sistemas Pleias são projetados para funcionar offline. “Na verdade, em produção, isso significa que o modelo pode rodar em um dispositivo sem conexão com a internet”, disse Stasenko.

A empresa pilotou implantações no Senegal e na República Democrática do Congo, construindo assistentes de IA em saúde e educação que funcionam completamente offline em telefones Android de baixo custo e hardware básico como dispositivos Raspberry Pi. Em vez de enviar solicitações para data centers remotos, o sistema recupera respostas de documentos armazenados localmente, reduzindo custos e requisitos de conectividade.

Stasenko argumentou que tal abordagem é prática para países como a Índia, onde a prestação de serviços públicos e o acesso à Internet continuam a ser desafios. “Acho que a Índia experimentou em primeira mão como a distribuição de poder é realmente desigual na IA”, disse ela. “Precisamos de descentralizar… não só em termos da sua concentração económica, mas também em termos de competências tecnológicas e infra-estruturas.”

Stasenko espera explorar parcerias com organizações sem fins lucrativos indianas e grupos de pesquisa como o Wadhwani AI durante a cúpula.

Expectativas de Nova Delhi

Às vésperas da cimeira, Stasenko espera que as discussões vão além das declarações. Ela comparou as suas expectativas para Nova Deli com a cimeira de Paris do ano passado, que disse ser “muito orientada para os negócios”.

“Para a cúpula da Índia… trata-se realmente mais de impactar o bem público”, disse ela. Ela espera “mais diversidade para a IA, mais descentralização que conduza à democratização”, permitindo que os países construam localmente sem depender inteiramente de alguns fornecedores globais.

Link da fonte

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui