Reconocimiento de Voz


El Reconocimiento Automático del Habla (RAH) o Reconocimiento Automático de Voz es una parte de la Inteligencia Artificial que tiene como objetivo permitir la comunicación hablada entre seres humanos y computadoras electrónicas. El problema que se plantea en un sistema de RAH es el de hacer cooperar un conjunto de informaciones que provienen de diversas fuentes de conocimiento (acústica, fonética, fonológica, léxica, sintáctica, semántica y pragmática), en presencia de ambigüedades, incertidumbres y errores inevitables para llegar a obtener una interpretación aceptable del mensaje acústico recibido.

Un sistema de reconocimiento de voz es una herramienta computacional capaz de procesar la señal de voz emitida por el ser humano y reconocer la información contenida en ésta, convirtiéndola en texto o emitiendo órdenes que actúan sobre un proceso. En su desarrollo intervienen diversas disciplinas, tales como: la fisiología, la acústica, el procesamiento de señales, la inteligencia artificial y la ciencia de la computación.

Características

Los sistemas comerciales han estado disponibles desde 1990. A pesar del aparente éxito de estas tecnologías, muy pocas personas utilizan el sistema del reconocimiento del habla en sus computadoras. Parece ser que muchos de los usuarios utilizan el ratón y el teclado para guardar o redactar documentos, porque les resulta más cómodo y rápido a pesar del hecho de que todos podemos hablar a más velocidad de la que tecleamos. Sin embargo, mediante el uso de ambos, el teclado y el reconocimiento del habla, nuestro trabajo sería mucho más efectivo.

Este sistema donde está siendo más utilizado es en aplicaciones telefónicas: agencias de viajes, atención al cliente, información etc. La mejoría de estos sistemas de reconocimiento del habla han ido aumentando y su eficacia cada vez es mayor.

Ventajas

Algunas de las ventajas que se tienen al utilizar un reconocedor de voz son: una manera más rápida para la introducción de datos, comodidad al no tener que estar utilizando el teclado o el ratón (mouse), no es necesario tener una parte visual es decir no hay que estar pegados viendo un monitor, poder estar realizando otras actividades manuales o visuales mientras se utiliza la computadora.

Desventajas

Algunas de las desventajas que se podrían presentar en el reconocimiento de voz pueden ser los problemas de entendimiento en ambientes en donde existe ruido, la pérdida de frecuencias del sonido en el ancho de banda del canal de audio, la fluidez en el habla de las personas ya que esto puede afectar el entendimiento de las palabras y específicamente en el caso de reconocedores de voz de propósito general el vocabulario puede ser inmensamente extenso, sobre todo en el español y existen muchos modismos lo cual puede crear confusión de palabras.