Pesquisa faz ‘chef robô’ aprender receitas apenas assistindo a vídeos

Paulo Carmino

2 anos atrás

A noção de que a inteligência artificial (IA) vai tirar o emprego de alguém é algo bastante nulo segundo especialistas, mas isso não impede que estudos viabilizem formas de evoluir a tecnologia. Na Universidade de Cambridge, no Reino Unido, pesquisadores conseguiram desenvolver um “chef robô” capaz de aprender receitas de saladas apenas “assistindo” a vídeos descritivos de culinária no YouTube.

Segundo o texto, a ideia foi alimentar a rede neural – um componente do que chamamos de “inteligência artificial” – com oito receitas distintas de saladas. Eventualmente, o “chef robô” foi capaz de identificar qual era a receita visualizada, os ingredientes usados e a forma de prepará-los com 93% de precisão.

Imagem: PaO_STUDIO/Shutterstock

Como o ‘chef robô’ aprendeu a fazer saladas usando inteligência artificial

Ao todo, os pesquisadores exibiram 16 demonstrações em vídeo, com uma ou outra variação, as quais renderam ao objeto do estudo uma série de tarefas que o “chef” poderia executar.

Como vetor de aprendizado, os cientistas usaram tecnologias como OpenPose e YOLOv5m. Unindo ambos os recursos, o objeto foi capaz de identificar, no vídeo, onde estavam as mãos do cozinheiro, os utensílios e os ingredientes.

A partir daí, os pesquisadores empregaram uma técnica conhecida como “Modelo Escondido de Markov” (HMM, na sigla em inglês) para “entender” as ações de preparação dos pratos.

O HMM é, de uma forma bem resumida, o emprego tecnológico do conceito matemático da “Cadeia de Markov” que por sua vez é definido como um modelo estatístico que descreve a sequência de possíveis eventos, onde a probabilidade de cada evento depende do estado atingido no evento anterior.

Em termos práticos: se durante a execução de uma tarefa, você conseguiu um resultado “X”, então o que vem a seguir só pode ser um resultado “Y”.

No caso em mãos, o modelo serviu para que o “chef robô” fosse capaz de determinar o que viria depois de, por exemplo, cortar um pepino, além de também “adivinhar” com bom grau de certeza as proporções usadas para cada ingrediente.

Imagem: cutie_pie/Pixabay

Com tudo isso, os cientistas apresentaram uma receita completamente diferente, apenas para que o objeto conseguisse determiná-la como algo inédito.

A partir disso, e ainda que de forma levemente reduzida, a tecnologia também conseguisse trabalhar com a receita mesmo tendo-a visto apenas uma vez, já que alguns padrões de execução se repetiam.

Vale citar: os vídeos das receitas foram filmados pelos próprios cientistas, que não empregaram qualquer recurso de edição. Isso é uma necessidade técnica já que redes neurais que aprendem por observação precisam de um campo de visão que contemple todos os ingredientes a todo tempo.

Esse tipo de tecnologia, de aprendizado por observação, também não está apta a interpretar movimentos e transições rápidas como aquelas que vemos nos vídeos cheios de cortes secos (os “jump cuts”) publicados no TikTok.

A ideia, segundo o chefe da equipe de pesquisa, Grzegorz Sochaki, é justamente a de treinar IAs para que, um dia, elas aprendam a executar receitas a partir de vídeos postados na internet.

A questão do vídeo não editado é um entrave neste momento, mas é algo que o time está confiante de que será eventualmente superado.

Créditos: TecMasters