Crisol

Una revolución en la comunicación por celular

La frase “tengo años de no verte”
podría pasar al olvido, cuando
las pantallas de los teléfonos
celulares puedan desplegar
la imagen de las

By Elizabeth Rojas Arias
Nov 18, 2004 21:38pm

La frase “tengo años de no verte”

podría pasar al olvido, cuando

las pantallas de los teléfonos

celulares puedan desplegar

la imagen de las personas

con las que hablamos.

Un joven científico costarricense

estableció un algoritmo

matemático más eficiente,

para lograr la transmisión

de la imagen de la cabeza

y hombros de una persona

por medio de compresión

de video.

Se trata del ingeniero eléctrico Mauricio Hess Flores, quien elaboró en su proyecto de maestría un nuevo algoritmo para adaptar el modelo tridimensional genérico de la cara de una persona al contenido de la primera imagen de una señal de video. Dicho algoritmo será incorporado en un complejo sistema de compresión de videotelefonía celular, que esta siendo desarrollado por el Dr. Geovanni Martínez Castillo, catedrático e investigador universitario, en el Laboratorio de Investigación en Procesamiento de Imagen y Visión por Computador de la Escuela de Ingeniería Eléctrica de la Universidad de Costa Rica.

Esta innovación permitiría también la transmisión de videoconferencias en forma comprimida empleando únicamente cuatro mil bits por segundo.

El nuevo algoritmo no tiene precedente en el mundo y es por eso que los resultados de este estudio se darán a conocer en el Picture Coding Simposium, que se realizará en San Francisco, California del 15 al 17 de diciembre próximos.

El algoritmo establecido por el M.Sc. Hess tiene un 85% de éxito, mientras que los que se había intentado anteriormente por otros investigadores tenían de un 30 o 60% de efectividad.

El investigador dijo que el trabajo realizado durante un año a tiempo completo fue muy arduo, y requirió muchas horas de programación que dieron como resultado unas 10 mil líneas de código.

AGOTAR EL ESTADO DEL ARTE

El aspecto más valioso de esta investigación tecnológica es precisamente que el estudiante de maestría debió superar la información existente y proponer un nuevo algoritmo más eficiente. Para ello el ingeniero Hess identificó las deficiencias de los algoritmos de adaptación actuales y luego las atacó. Su principal contribución fue haber empleado el algoritmo de detección de bordes y esquinas SUSAN (“Smallest Univalue Segment Assimilating Nucleos”), para extraer características faciales, en sustitución de dos algoritmos que hasta la fecha se habían empleado para ese propósito, denominados “artificial template matching” y “deformable template matching”.

En el nuevo algoritmo de adaptación desarrollado por Hess, primero se encuentra la región de la cara en la imagen. Para ello se subdivide la silueta de la persona en hombros y cabeza y luego se elimina la tercera parte superior para obtener la cara.

La silueta se supone conocida o que fue previamente estimada mediante un detector de cambios. Luego, se determinan ciertos puntos característicos sobre la cara como fueron las esquinas de la boca, las esquinas de afuera de los ojos, de la nariz y los contornos de las mejillas ahí fue donde empleó el algoritmo SUSAN.

Finalmente, se adapta la escala, posición y orientación del modelo genérico de la cara de una persona al rostro real de la persona en frente de la cámara, haciendo uso de las características faciales extraídas. La adaptación es muy difícil de realizar porque al hablar se mueven los ojos y la boca y la cabeza puede moverse hacia arriba, hacia abajo y de medio lado.

El nuevo algoritmo de adaptación ha sido probado con señales típicas de videotelefonía como la denominada Claire. Otro aporte importante del nuevo algoritmo, es que a diferencia de otros, también permite realizar la adaptación del modelo aún cuando la persona tiene los ojos cerrados o está mirando hacia abajo.

UN PASO ADELANTE

El Ing. Hess considera que este trabajo es valioso porque en él se generó conocimiento y se creó un nuevo algoritmo que hizo dar un paso hacia delante a la comunidad científica internacional dedicada a la adaptación automática de modelos genéricos de la cara de una persona al contenido de la primera imagen de una señal de video. Dicha comunidad científica podrá conocer con detalles, consultar, analizar y probar el invento una vez que el trabajo se presente en el Picture Coding Symposium que reúne a cientos de investigadores en el tema.

Hess espera más adelante cursar un doctorado en una universidad en el extranjero, que le permita especializarse en robótica o visión por computador.

[delipress_optin id="134623"]

Una revolución en la comunicación por celular

AGOTAR EL ESTADO DEL ARTE

UN PASO ADELANTE

Otros Artículos

INFORMACIÓN