Для каждой части аудиосообщения нужно определить преобладающую эмоцию, а затем сопоставить ее со статистикой произнесенных слов.