Publication:
Pattern recognition and text dependent voice recognition system for a biped robot

Thumbnail Image
Authors
González-Solano, Natalia F.
Embargoed Until
Advisor
Torres-Muñiz, Raúl E.
College
College of Engineering
Department
Department of Electrical and Computer Engineering
Degree Level
M.S.
Publisher
Date
2006
Abstract
Pattern Recognition and Audio Processing are important aspects in the control and behavior of mobile robots; their action depends on the recognition of visual and audio stimuli in order to reflect intelligent behavior. This work presents an economic intelligent recognition system developed in an integrated manner for a biped robot. It consists of two main parts: one is the isolated word and pitch recognition, using Backpropagation Neural Networks (BNN) in which input signals are out coming from a Linear Predictive Coding (LPC) processing method that characterizes each voice signal. The second consists of an intelligent, artificially vision based, tracking system that will be activated with a specified voice command which tracks the moving body in front of it, keeping it in the field of view. Consecutive images must be acquired and processed in the time domain as well as in the frequency domain. The objective is to design a person tracking system for a mobile robot with text dependent pitch recognition and a visual pattern recognition mechanism. The BNN will awake the robot from the idle position, while the visual stimulation will be used to track the person when given the command in real time.

Tanto el reconocimiento de patrones como el procesamiento de señales de audio son algunos de los aspectos más importantes para el control de robots móviles; las acciones del sistema dependerán de la detección de estímulos visuales y de sonido con el fin de presentar un comportamiento inteligente. Esta investigación presenta el desarrollo e implementación de un sistema inteligente completamente integrado a un robot bípedo de manera económica y confiable. El sistema está constituido por dos secciones: una de ellas consiste en reconocer voz y palabras predeterminadas utilizando el algoritmo de retropopagación de redes neuronales (BPN por siglas en inglés), el cual se alimenta de la respuesta del sistema de codificación lineal predictiva que caracteriza cada señal de voz; de esta manera, se reconoce la voz del maestro y la palabra predeterminada que se está pronunciando para así ejecutar los distintos comandos. La segunda parte, consta de un sistema de rastreo inteligente utilizando una cámara incorporada en el robot, que se active con una de las señales de voz predeterminadas, y detecte el movimiento de la persona en frente suyo y sea capaz de mantenerlo en perspectiva. Se adquirirán imágenes consecutivas que serán procesadas tanto en el espacio de tiempo como en el espacio en frecuencia. Luego de esto, se plantearán operaciones lógicas para el posterior análisis del objeto en movimiento utilizando sistemas inteligentes de lógica difusa. El sistema funciona en tiempo real de tal forma que estará atento y listo para que reconozca en cualquier momento las palabras y actúe como se desea.
Keywords
Cite
González-Solano, N. F. (2006). Pattern recognition and text dependent voice recognition system for a biped robot [Thesis]. Retrieved from https://hdl.handle.net/20.500.11801/2387