A OpenAI admitiu, em documento por escrito, que é impossível treinar modelos de linguagem como o GPT-4 (essencialmente, a “base” para chatbots como o ChatGPT), sem o uso de materiais protegidos por direitos autorais.
O documento, publicado no Reino Unido em meio a um processo respondido pela empresa na Câmara dos Comuns, expressa sumariamente uma posição de que, sem usar materiais criados por outras pessoas, recursos tecnológicos como o ChatGPT, DALL-E e outras inovações da inteligência artificial (IA) generativa nunca existiriam.
Pelo trecho do documento:
“Os modelos de linguagem da OpenAI, incluindo aqueles que servem de base para o ChatGPT, são desenvolvidos por meio de três fontes primárias de dados: informações disponíveis no domínio público, informações que licenciados de terceiros e, finalmente, informações trazidas por treinadores humanos.
Pelo fato de que direitos autorais, hoje, protegem virtualmente todo tipo de expressão humana – incluind
Créditos: TecMasters