Tecnologia

Inteligência artificial falha (miseravelmente) ao criar imagens de controle de PS5

Imagem de controle do PS5 feita por inteligência artificial generativa

Apesar de demonstrarem grandes potenciais, os geradores de imagens baseados em inteligência artificial (IA) ainda precisam de uma boa refinada. E uma boa prova disso foi vista em uma dessas ferramentas que não foi capaz de atender a simples “pedidos gamer”.

Controle de Chernobyl?

A história começou quando um entusiasta de IA generativa resolveu testar a ferramenta Midjourney, que basicamente gera imagens com base em texto. E o pedido do usuário do Reddit @theloudestlion foi relativamente simples: “uma influenciadora relaxando jogando PlayStation 5 e se divertindo muito”.

Justiça seja feita, o Midjourney fez um bom trabalho até certo ponto: uma jovem, com roupas casuais, com número certo de dedos e usando headsets similares ao de influencers. O grande problema foi que os controles passaram longe dos manetes que estamos acostumados a ver na vida real.

Resultados da ferramenta de inteligência artificial generativa Midjourney

Imagem: reprodução/theloudestlion

Desnecessário comentar que os resultados repercutiram fortemente no fórum. Outra chance à ferramenta foi dada, e dessa vez, ela teria que gerar imagens de “alguém jogando videogame enquanto come um espaguete”. Mas novamente, o resultado não foi bem o que era esperado.

Resultados da ferramenta de inteligência artificial generativa Midjourney 2

Imagem: reprodução/pinkdreamery

[–quebra–]

IA carece de refinamentos

Muitos comentaram sobre um prompt excessivamente amplo, uma vez que um termo intuitivo pode ser vago para o sistema de IA. Mas ao que parece, o grande problema pode estar relacionado à uma fraqueza da inteligência artificial generativa: ela é ótima para criar variações de algo que já existe, mas não se atenta muito a detalhes de coisas que estão faltando.

No exemplo do controle, o maior culpado pode ser a falta de imagens da parte traseira do acessório. E talvez a ferramenta só detecte o controle com imagens da parte da frente. Sobre o outro caso, é possível especular que não existam tantas fotos de pessoas comendo espaguete e jogando ao mesmo tempo. Daí a confusão.

Isso significa que os novos sistemas de inteligência artificial não prestam? Longe disso. Mas fica claro que, como são baseados e treinados com coisas que já existem, precisam de um refinamento e de mais bancos de dados para criações de cenários hipotéticos ou inéditos.

Do contrário, resultados como controles inversos e com múltiplos botões serão replicados — e de formas ainda mais bizarras.

Via: Kotaku


Créditos: TecMasters