Сопоставлять эмоции в каждой части аудиосообщения со статистикой сказанных слов

Для каждой части аудиосообщения нужно определить преобладающую эмоцию, а затем сопоставить ее со статистикой произнесенных слов.