Simulando fala e emoçõesE parece falar realmente, graças a um sistema inédito que os pesquisadores criaram que permite que a imagem projetada acompanhe a voz do tele-palestrante.
Para ser prática, a máscara-robô precisa funcionar sem exigir uma transmissão em tempo real do palestrante. Isso foi feito com um programa que ajusta em tempo real a imagem projetada para fornecer as expressões faciais e fazer a mímica da voz.
Para isso, os pesquisadores criaram um engine para uma cabeça animada falante. O sistema deve ser alimentado com uma série de imagens da pessoa - geralmente um pequeno trecho de um filme que a mostre falando.
A seguir, o próprio programa seleciona as expressões faciais que melhor equivalem a cada som - na verdade, a cada fonema que está sendo falado.
O mesmo ocorre com o mecanismo de "síntese de emoções", que mostra nuances emocionais capazes de indicar, por exemplo, alegria, tristeza ou raiva.
Máscaras personalizadas
Um sistema de sintetização de voz converte texto em áudio - incluindo texto digitado em um teclado - produzindo uma voz masculina ou feminina, que também pode ser ajustada para demonstrar emoções.
O sistema permite que se use uma máscara genérica feminina e outra masculina.
"Ou você pode fornecer uma máscara personalizada para cada pessoa," diz Kuratate.
O próximo passo é colocar todo o sistema em um robô assistente móvel.
Os pesquisadores afirmam que o sistema inteiro da máscara-robô custou cerca de 3.000 euros, mas o custo do Mask-bot II deverá ficar por volta dos 400 euros.
Além da videoconferência, "esses sistemas logo poderão ser usados como companhia para pessoas idosas que passam muito tempo sozinhas," disse Kuratate.