A computação afetiva é a disciplina que estuda e desenvolve sistemas e dispositivos que podem reconhecer, interpretar, processar e simular emoções humanas. É um campo interdisciplinar que abrange ciência da computação, psicologia e ciências cognitivas. As primeiras discussões sobre emoção remontam ao pensamento filosófico humano sobre emoção, mas o ramo moderno da ciência da computação começou com o artigo "Affective Computing" de Rosalind Pickard em 1995 e seu livro de mesmo nome publicado em 1997. Uma grande motivação neste campo é dar às máquinas inteligência emocional, incluindo empatia simulada, para que as máquinas possam compreender os estados emocionais humanos e ajustar o seu comportamento com base nessas emoções, para que possam dar respostas emocionais adequadas.
O objetivo da computação afetiva é melhorar a interação entre pessoas e máquinas e torná-la mais humana.
A detecção de informações emocionais geralmente começa com sensores passivos que capturam o estado físico ou comportamento do usuário sem interpretar os dados de entrada. Esses dados são semelhantes às dicas que os humanos usam para sentir as emoções dos outros. Por exemplo, as câmeras de vídeo capturam expressões faciais, posturas corporais e gestos, enquanto os microfones gravam a fala. Outros sensores detectam sinais emocionais medindo diretamente dados fisiológicos, como temperatura da pele e resposta eletrocutânea.
Outra área importante reside no design de dispositivos de computação que possam exibir emoções intrínsecas ou que possam simular emoções de forma convincente. As tecnologias atuais são capazes de simular emoções, especialmente em agentes conversacionais, o que potencializa e facilita as interações homem-máquina. Em The Emotional Machine, o pioneiro da ciência da computação Marvin Minsky conectou as emoções a questões mais amplas da inteligência da máquina, observando que as emoções "não são particularmente estranhas ao processo que chamamos de 'pensamento'". dimensão, incluindo reações a certos estímulos emocionais e expressões faciais e gestos correspondentes.
A emoção nas máquinas muitas vezes envolve as emoções dos sistemas de computação, o que deu origem aos termos "IA emocional" e "IA emocional".
Na psicologia, na ciência cognitiva e na neurociência, existem duas maneiras principais de descrever como os humanos percebem e classificam as emoções: a abordagem contínua e a abordagem categórica. No processo de reconhecimento de emoções, o uso de várias tecnologias de modelo de classificação e regressão de aprendizado de máquina também é crítico.
Mudanças no sistema nervoso autônomo podem alterar indiretamente a fala de uma pessoa, e a tecnologia emocional pode usar essas informações para identificar emoções. Por exemplo, a fala em estados de medo, raiva ou alegria tende a ser rápida, alta e clara, com um tom mais alto e mais amplo, enquanto o cansaço, o tédio ou a tristeza geralmente resultam em uma fala lenta, grave e arrastada. . A tecnologia de processamento de fala emocional pode identificar o estado emocional do usuário por meio de análise computacional das características da fala.
O processo de detecção de emoções de fala/texto requer a criação de um banco de dados confiável e uma base de conhecimento, e a seleção de um classificador eficaz para obter um reconhecimento de emoções rápido e preciso. Com o desenvolvimento da tecnologia, diferentes algoritmos foram propostos um após o outro. O uso de classificadores apropriados pode melhorar significativamente o desempenho geral do sistema.
A escolha de um classificador apropriado pode melhorar significativamente a precisão e a eficiência do reconhecimento de emoções.
A detecção e o processamento de expressões faciais são geralmente implementados através de métodos como fluxo óptico, modelos ocultos de Markov e redes neurais. Além da expressão facial em si, o reconhecimento multimodal pode ser realizado combinando melodia de voz, gestos e outras informações para avaliar com maior precisão o estado emocional do sujeito. Construir um banco de dados de emoções é uma tarefa que requer tempo e esforço, e a maioria dos bancos de dados públicos de emoções inclui apenas expressões gestuais, o que torna o reconhecimento de emoções faciais um desafio.
Os gestos podem ser efetivamente usados como uma forma de identificar o estado emocional específico de um usuário, especialmente quando combinados com o reconhecimento de fala e de expressões faciais. Os métodos de reconhecimento de gestos são divididos principalmente em duas abordagens baseadas em modelos 3D e na aparência. O computador deve ser capaz de compreender essas ações e dar respostas adequadas para promover a eficiência da interação humano-computador.
Isto pode detectar o estado emocional de um usuário monitorando e analisando seus sinais fisiológicos. Os sinais fisiológicos incluem alterações na frequência cardíaca, respostas de condução da pele, contração de pequenos músculos faciais, alterações no fluxo sanguíneo, etc. Esta área tem recebido mais atenção recentemente, e agora vemos alguns produtos reais já adotando estas tecnologias.
À medida que a tecnologia se desenvolve, a computação afetiva desempenha um papel cada vez mais importante na vida diária. Serão as máquinas do futuro capazes de verdadeira empatia?