Contribución al estudio de selección de parámetros para identificación de estrés en la voz

  1. Palacios Alonso, Daniel
Dirigida por:
  1. V. Rodellar Biarge Director/a

Universidad de defensa: Universidad Politécnica de Madrid

Fecha de defensa: 14 de julio de 2017

Tribunal:
  1. Carlos García Puntonet Presidente/a
  2. Victor Nieto Lluis Secretario/a
  3. Agustin Alvarez Marquina Vocal
  4. José Manuel Ferrández Vicente Vocal
  5. Athanasios Tsanas Vocal

Tipo: Tesis

Resumen

En este trabajo se presenta un estudio de la caracterización de emociones y más concretamente del estrés a través de la voz, haciendo hincapié en la obtención de muestras de calidad espontáneas, en el conjunto de parámetros que mejor determinen la presencia de estrés y en aquellos algoritmos matemáticos que por un lado mejor validen unos conjuntos de datos, y por otro lado, aquellos que ofrezcan unas tasas de reconocimiento más elevadas con niveles de cómputo asequibles y extrapolables para su posible implementación en interfaces hombre-máquina. En el primer capítulo se ofrece una introducción al estudio de las emociones realizando una retrospectiva sobre el tema y ofreciendo los avances paulatinos a lo largo de la historia, empezando por los antiguos filósofos griegos, pasando por los racionalistas y llegando hasta los mayores exponentes en nuestros días. Por otro lado, se muestra el concepto de estrés, sus posibles estados, qué estímulos lo provocan, etc. Además, se explica de manera somera la producción de la voz, qué órganos participan y las funciones que realiza cada uno de ellos. Finalmente, se ofrece una serie de potenciales aplicaciones que derivarían como consecuencia de este trabajo. En el siguiente capítulo se presentan los datos de voz que expresan emociones. Primeramente, se menciona la disponibilidad actual de las diferentes bases de datos emocionales o de estrés que maneja la comunidad científica. A continuación, se formaliza la estructura propuesta en este trabajo con la presentación de las principales características recogidas en nuestra base de datos y se presenta la metodología utilizada para la obtención de datos espontáneos. Finalmente, se introduce una aplicación web diseñada e implementada para obtener y validar muestras de voz espontáneas y los diversos conjuntos de datos o corpora utilizados a lo largo de este estudio. En el capítulo 3, se comentan los parámetros más comunes para la detección de emociones a través de la voz y además los utilizados para la detección de estrés. Estos parámetros, que podrían denominarse “clásicos”, son comentados y definidos de forma sucinta. Se presenta la herramienta utilizada para la extracción de los parámetros en este trabajo y la definición de los mismos de forma detallada, dando especial relevancia a aquellos que tienen un significado biométrico. A continuación, el capítulo 4 introduce los métodos de clasificación más comunes en la literatura. Seguidamente, se presentan los métodos utilizados a lo largo de este trabajo, organizados como métodos paramétricos y no paramétricos. Además, se presentan las técnicas utilizadas para la separación de fuentes y reducción de parámetros o dimensionalidad del problema y finalmente se muestran los métodos de clasificación y validación usados. Algunas de las principales aportaciones de este estudio se ofrecen en el capítulo 5, Resultados, donde se discute la relevancia de unos parámetros frente a otros, las tasas de clasificación de estrés a partir de diferentes técnicas, algunas individuales y otras con proceso de concatenación de varias técnicas de forma iterativa y un método para validar nuestro conjunto de datos inicial eliminando posibles datos anómalos. En el último capítulo, se resaltan las principales conclusiones a las que se ha llegado a partir de los objetivos planteados y los resultados obtenidos y también las líneas futuras de investigación que se pueden derivar de este trabajo.