gpyVozControl – El sistema de órdenes de voz en software libre

Hola amigos, les comparto mi proyecto de grado que fue el requisito final para obtener el titúlo de Ingeniero de sistemas, el cual consistió en el desarrollo de un software de órdenes de voz con las bibliotecas de reconocimiento de voz como lo son Julius y CMUSphinx con una licencia GNU Affero, a continuación les coloco el resumen del proyecto:
 
“En este proyecto se desarrolló, bajo tecnologías libres, un software o sistema que permite a una persona interactuar con el sistema operativo y su interfaz gráfica mediante órdenes de voz (como: abrir programas, cerrar, maximizar o minimizar ventanas, entre otros) con las aplicaciones instaladas. El sistema, al que se ha denominado “gpyvozControl”, también permite manejar los programas como el Evince (visualizador de PDF) y el reproductor de música (Rhythmbox). Estas fueron las características que se alcanzaron en el proyecto, pero teniendo presente que la finalidad superior es continuar con el desarrollo del Sistema de órdenes de voz que permita a cualquier persona en un futuro realizar todas las tareas del sistema solo con la voz.
 
El proyecto se decantó por el uso de tecnologías libres, después de una revisión de la oferta disponible y una estimación del esfuerzo y recursos requeridos en otras plataformas, además de las ventajas que ofrece al utilizar las mismas. Se revisó las bibliotecas de desarrollo de uso libre, creadas por un par de proyectos de procesamiento de voz como lo son Julius y CMUSphinx y que se adaptaron en la tarea especifíca de la transmición al computador de un subconjunto, seleccionado cuidadosamente, de los comandos que se transmiten con el teclado de un computador personal estándar. En el ejercicio, se identificó debilidades, ventajas y posibilidades de desarrollo, al tiempo que se terminó con un prototipo funcional personal para cada unade las bibliotecas.
 
La metodología usada, es el método ágil Scrum, que permite el desarrollo progresivo de ese prototipo, planificando los requisitos por prioridad de desarrollo, la duración de cada sprints y las actividades definidas por las historias de usuario que fueron diseñadas.
Este proyecto, además, fue un ejercicio interdisciplinario que combinó la experiencia de vida del propio desarrollador con generosas “donaciones de voz”, con herramientas para el procesamiento de voz y con el conocimiento de una experta en lingüística computacional.”(Ortega, J. 2016).
 
Puede verse una presentación en youtube:
https://www.youtube.com/watch?v=MzteJI9djm4
 
Todo el desarrollo esta disponible en:
http://bitbucket.org/gproyectogrado/gpyvozcontrol
y el wiki en:
http://bitbucket.org/gproyectogrado/gpyvozcontrol/wiki/Home
 
Aunque falta mucho por desarrollar, ya contamos con un piloto para seguir desarrollando y hacer que este sistema reconozca la voz del usuario para realizar cualquier actividad en el computador. Toda colaboración, sugerencia u opinión es bienvenida, anímate a dejarla en los comentarios y decir que te parece!.
 
Saludos a todos!!!

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s