El
nuevo estándar MPEG-7 abre la puerta a las aplicaciones
multimedia avanzadas
El lenguaje describe la representación estándar
de la información audiovisual. Ayuda a las herramientas
de indexación a crear grandes bases de material multimedia.
Potenciará los ingresos de la industria de contenidos.
Funcionamiento
del lenguaje MPEG-7
Varias compañías
experimentan las primeras soluciones con el lenguaje
TEXTO:
JOAN CARLES AMBROJO
¿En
qué escenas George Clooney hace morritos?; ¿hay que obtener
una lista de grabaciones y videoclips a partir de un extracto
de la voz de Pavarotti?; ¿necesitamos comprar en una teletienda
ropa similar a la que luce la estrella favorita en una foto?;
¿queremos filtrar imágenes para que el vídeo no grabe noticias
de deportes? Son algunas de las múltiples aplicaciones multimedia
que se beneficiarán del nuevo lenguaje estándar de descripción
de contenidos audiovisuales MPEG-7, que la organización internacional
de estandarización ISO ha aprobado recientemente.
MPEG-7 es una representación estándar de la información audiovisual.
Permite la descripción de contenidos por palabras clave y
por significado semántico (quién, qué, cuándo, dónde) y estructural
(formas, colores, texturas, movimientos, sonidos). El formato
MPEG-7 se asocia de forma natural a los contenidos audiovisuales
comprimidos por los codificadores MPEG-1 (almacena y descarga
archivos audiovisuales), MPEG-2 (televisión digital) y MPEG-4
(codifica audio y vídeo en forma de objetos), pero se ha diseñado
para que sea independiente del formato del contenido.
El nuevo estándar ayuda a las herramientas de indexación a
crear grandes bases de material audiovisual (imágenes fijas,
gráficos, modelos tridimensionales, audio, discursos, vídeo
e información sobre cómo esos elementos están combinados en
una presentación multimedia) y buscar en estas bases de materiales
manual o automáticamente.
El
PostScript del multimedia
MPEG-7 es al multimedia lo que PostScript es al papel. Este
último describe a un programa de textos el formato que debe
tener la página; MPEG-7 hace lo mismo, pero sobre el contenido
audiovisual. El MPEG-7 se basa en el popular lenguaje de metadatos
XML, "que dominará Internet dentro de poco; habrá un montón
de herramientas y eso favorecerá la interoperabilidad y la
creación de aplicaciones", afirma Philippe Salembier, investigador
de la Universidad Politécnica de Cataluña, que ha participado
en el proyecto MPEG-7 durante los últimos tres años.
Sin embargo, una descripción en XML puede ser muy voluminosa.
Es un problema para las aplicaciones en las que el espacio
de almacenamiento o el ancho de banda de transmisión son insuficientes
(discos con capacidad limitada, transmisión por módem, etcétera).
Para estos casos se ha desarrollado el compresor BIM (Binary
Format for MPEG-7).
En un escenario tipo, una aplicación genera la descripción
MPEG-7 del contenido de, pongamos, un millón de películas;
luego se pasa al formato XML, se almacena en servidores con
discos de gran capacidad y ya está listo para su uso. Si la
información de la descripción es demasiado grande para los
servidores o si se tiene que mandar en un canal de transmisión
con poco ancho de banda, el XML se compacta en un espacio
hasta 100 veces menor con el codificador BIM. Al final del
proceso se puede decodificar otra vez en XML y ya se pueden
utilizar esos datos. "Además, el BIM es más robusto que el
XML frente a los errores de transmisión", añade Salembier.
MPEG-7 incluye, además de la descripción de los contenidos,
información sobre el tipo de compresión utilizada (JPEG, en
dibujos; MPEG-2, en imágenes), las condiciones para acceder
(derechos, precio), clasificación (adultos, por ejemplo),
enlaces a otros materiales relevantes (para acelerar la búsqueda)
y el contexto (final de los 200 metros femeninos de los Juegos
Olímpicos de Verano de 2000).
El lenguaje MPEG-7 puede generar grandes ingresos al sector
audiovisual (producción, posproducción, distribución y consumo).
A juicio de Goldman Sachs, el mercado de herramientas informáticas
para la gestión de contenidos pasará de los 378 millones de
dólares (7.100 millones de pesetas) del año 2000 a los 4.500
millones de dólares (850.000 millones de pesetas) en 2005.
La industria también prepara el estándar MPEG-21, que propone
la creación de un marco tecnológico para todo el proceso multimedia,
explica Jose M. Martínez, científico de la Universidad Politécnica
de Madrid, que también ha participado en el desarrollo del
MPEG-7. El MEPG-21 debe abarcar desde los terminales utilizados
al tipo de redes. También será importante para proteger legalmente
los contenidos para todas las variedades de uso. En la primera
fase, intentará definir las diferentes opciones tecnológicas
de extremo a extremo en la cadena multimedia. Por ejemplo,
se enviará un esquema MPEG-7 adecuado a un portátil.
¿Quién
ganará la partida audiovisual? Seguramente, el creador de
aplicaciones que tengan mayor capacidad de actuar entre los
diversos agentes del proceso industrial. "La industria tiene
ahora la última palabra", afirma José Martínez. Puede mirarse
en el espejo del MPEG-2, formato digital adoptado por las
cadenas de televisión.
Varias
compañías experimentan las primeras soluciones
con el lenguaje
Las
primeras aplicaciones del MPEG-7 están viendo la luz. Serán
importantes en sectores como el entretenimiento, la medicina,
la educación, la industria, la seguridad o la arquitectura.
La biblioteca del Congreso de Estados Unidos es un gran cliente
potencial: recibe 10.000 entradas multimedia a la semana y necesita
clasificarlas, archivarlas y ponerlas fácilmente a disposición
de los ciudadanos en formato digital.
El Fraunhofer Institute, creador del MP3, ha desarrollado
el AudioID, un sistema para la identificación automática de
una canción en cinco segundos entre más de 30.000, afirma
Eric Allamanche, investigador del instituto alemán. Utilidades:
venta por catálogo o control de los derechos; incluso podrá
servir para buscar desde el móvil piezas en las que el piano
sea el instrumento protagonista. A finales de 2001 aparecerá
la licencia de la tecnología, posiblemente para la empresa
Thomson.
Telematica Institut e IBM prueban en Holanda servicios personalizados
de vídeo sobre IP (educación y negocios), y LG Electronics,
un buscador de información audiovisual para proveedores de
contenidos y usuarios; Ricoh experimenta un software
para la recuperación y distribución de videoclips a través
de una interfaz Web; NEC ha desarrollado un equipo de identificación
de vídeos en tiempo real, y Expway, el codificador Bin-XML
y TV Anytime, en su proyecto de televisión interactiva.
|