Profissionais de marketing, agências e publicações devem prestar atenção à recente posição do Google sobre o uso de conteúdo para treinamento de modelos de inteligência artificial. A empresa defende que o treinamento com dados disponíveis publicamente é um uso “transformativo e não-expressivo”, o que a coloca sob a proteção do uso justo nos Estados Unidos. Essa discussão é essencial, pois impacta diretamente como as empresas devem gerenciar seu conteúdo na era da IA.
Em um documento de políticas publicado em 25 de junho, o Google apresenta suas soluções para as preocupações dos editores, destacando opções de exclusão e a importância da legislação de direitos autorais. A empresa propõe que, para proteger seu conteúdo, os proprietários de sites utilizem controles legíveis por máquina, como Google-Extended, em seus arquivos robots.txt. Assim, o foco não está em filtrar se uma saída é “muito similar”, mas em seguir os processos de notificação e remoção já estabelecidos.
O Google compara o treinamento de IA a “um estudante de arte se inspirando ao percorrer uma galeria”, sugerindo que a mesma proteção deve se estender internacionalmente por meio de exceções para mineração de texto e dados. A empresa está trabalhando em novas formas de agregar valor, como parcerias que asseguram que as respostas geradas pela IA permaneçam atualizadas e precisas, além de acordos para acesso a conteúdo especializado não público.
No cenário internacional, o CMA do Reino Unido introduziu uma nova exigência que permite que sites optem por não participar de recursos de busca relacionados à IA e exige que o Google atribua conteúdo de editores. Essa medida visa aumentar o poder de negociação dos publicadores, embora a implementação ainda dependa de dados mais específicos.
Nos Estados Unidos, publicadores estão reforçando sua posição. A Digital Content Next enviou uma carta de cessar e desistir à Common Crawl Foundation, afirmando que “a lei de direitos autorais não é um regime de exclusão”. Isso sugere que os robôs que coletam dados devem pedir permissão antes de usar conteúdo, desafiando o modelo de exclusão discutido no documento do Google.
As políticas apresentadas pelo Google refletem um desejo de manter seu modelo atual de operação. Contudo, editores e reguladores estão buscando garantias mais robustas, como compensação, permissão prévia para scraping e dados detalhados sobre cliques. O Google, por sua vez, oferece controles e busca conduzir negociações de forma individual.
Essas posições são apenas diretrizes políticas, sem compromissos de produtos concretos. Novas parcerias e acordos mencionados pelo Google podem mudar como o valor é entregue a editores, mas os detalhes permanecem vagos. É importante monitorar se a empresa vinculará programas, termos ou valores ao que está sendo discutido em seus documentos de políticas.
Essa situação é um reflexo das tensões crescentes entre o uso de tecnologia emergente e os direitos dos criadores de conteúdo, o que demanda que todas as partes envolvidas adotem uma postura proativa em relação à proteção e valorização de seus ativos digitais.
Crédito da imagem: divulgação/reprodução

