Com o avanço da tecnologia, a tecnologia de alucinação facial está se tornando cada vez mais atraente no campo de processamento de imagens atual. Alucinação facial é uma tecnologia de super-resolução usada especificamente para melhorar imagens faciais. Ela converte imagens faciais borradas ou de baixa resolução em imagens de alta resolução analisando características faciais típicas. A tecnologia tem aplicações que vão além da identificação pessoal e também pode ser usada em investigações criminais e nas mídias sociais.
As conquistas da tecnologia de alucinação facial melhoraram muito a eficiência dos sistemas de reconhecimento facial e foram amplamente estudadas.
Embora a alucinação facial e a super-resolução de imagem tenham semelhanças, há diferenças claras entre elas. O primeiro se concentra em melhorar imagens faciais, enquanto o último é uma tecnologia geral de aprimoramento de resolução de imagem. A tecnologia de alucinação facial utiliza informações anteriores típicas do rosto para torná-la mais orientada para o domínio facial.
De acordo com os padrões atuais, uma imagem é considerada de alta resolução com base no número de pixels que ela contém, geralmente 128×96 pixels. O objetivo da alucinação facial é converter imagens de entrada de baixa resolução (como 32×24 ou 16×12 pixels) para esse alto padrão.
Para alucinações faciais, o desafio do alinhamento da imagem é particularmente difícil, e até mesmo pequenos erros de alinhamento podem afetar o resultado final.
Muitos algoritmos especializados de alucinação facial foram propostos nas últimas duas décadas. Esses métodos podem ser divididos em duas etapas: na primeira etapa, o sistema gera uma imagem facial global usando a estimativa a posteriori máxima (MAP) do método probabilístico. O segundo passo é gerar uma imagem residual para compensar o resultado do primeiro passo.
A interpolação é um dos métodos mais simples para aumentar a resolução da imagem. Ela aprimora a intensidade de pixels da imagem de entrada por meio de métodos vizinhos, bilineares e variantes. No entanto, esses métodos geralmente apresentam desempenho ruim e não conseguem incorporar novas informações, o que leva os pesquisadores a desenvolver novas abordagens.
Este método foi proposto pela primeira vez por Baker e Kanade e se baseia na fórmula MAP Bayesiana para otimizar a função objetivo e usar amostras de treinamento para gerar detalhes de alta frequência.
Proposto por J. Yang e H. Tang, esse método não requer dados de alta resolução e usa fatoração de matriz não negativa (NMF) para aprender o subespaço de características locais para aprimorar os detalhes das estruturas faciais.
O sucesso desses algoritmos continua a demonstrar a importância da tecnologia de alucinação facial, mas em aplicações práticas, ainda há espaço para melhorias.
Todos os métodos acima alcançaram resultados satisfatórios, e não é fácil afirmar qual método é o mais eficaz. Vale a pena notar que algoritmos diferentes podem produzir efeitos diferentes. Por exemplo, o método de Baker e Kanade pode distorcer características faciais, enquanto o algoritmo de Wang e Tang pode produzir um efeito de anel.
Como melhorar a clareza da imagem mantendo as características faciais será uma questão fundamental no desenvolvimento futuro da tecnologia de ilusão facial?