Red de información TI para profesionales ITMedia NetWork

Búsqueda avanzada

Publicidad

Publicidad

Centro de recursos

Análisis

Web Semántica: ha llegado el momento, «es hora de entender la semántica de la Web», sugiere Tim Berners-Lee

27 Agosto 2008por Ángel González

Página 1 de 2 de Web Semántica: ha llegado el momento, «es hora de entender la semántica de la Web», sugiere Tim Berners-Lee

Tim Berners-Lee, el creador de la World Wide Web y del W3C, ve el futuro de la Web como un repositorio gigante de datos con acceso a todos y que aportará una nueva manera de interactuar y servirse de la red, en todos los sentidos

En 1991, Tim Berners-Lee creó la World Wide Web y cambió para siempre la manera de informarse, negociar, comprar, educar e interactuar. Pocos años más tarde, empezó a hablar de su próxima visión de la Web, una que forjaría para los datos lo que la Web original hizo para los contenidos estáticos.

Tim Berners Lee

Tim Berners Lee

Berners-Lee designó esta visión como la Web Semántica (WS). En general, la Web Semántica plantea el tratamiento de Internet como una enorme base de datos.

De la misma manera que un desarrollador puede consultar una base de datos local y crear aplicaciones basadas en estos, los usuarios podrán consultar datos procedentes de distintas fuentes y crear aplicaciones customizadas en función de la información que se encuentra en la Web.

En la Web Semántica, no será necesario realizar múltiples búsquedas para inferir la relevancia de un dato con otro porque toda la información estará etiquetada y marcada. Estos indicadores proporcionarán la información específica del dato.

No obstante, la WS ha requerido muchos años para poner todo esto en práctica. Algunos componentes claves, como el lenguaje de consultas, sólo se han estandardizado recientemente por la W3C (World Wide Web Consortium). Muchos estiman que la Web Semántica es una tecnología emergente que tarda demasiado en emerger.

Sin embargo, la WS está tomando forma y contenido. Los negocios, las páginas Web y aplicaciones empiezan a definir, conectar y crear modelos de datos que aprovechan las tecnologías de la WS con el fin de proporcionar nuevas funcionalidades. Ahora es la hora y nos tenemos que preparar. La Web Semántica ha llegado.

TechWeek ha tenido oportunidad de entrevistar a Tim Berners-Lee y conocer sus previsines respecto a la Web Semántica. Asimismo, hablamos con Eric Miller, jefe de esta iniciativa en W3C y presidente de Zepheira, una compañía que facilita el despliegue de las tecnologías semánticas de la Web.

Durante los últimos diez años hemos estado definiendo la base de la Web Semántica desde el punto de vista de formatos de datos y el lenguaje de ontología Web

Tim Berners-Lee

Y para hacernos una idea de las implicaciones de la WS en el mundo real, evaluamos algunas implementaciones de tecnologías semánticas. Hemos analizado los retos con respecto a la seguridad, los islotes de datos propietarios y la curva de expectaciones (hype curve) de la Web Semántica. Stephen Downes, un investigador del Consejo de Investigación Nacional de TI de Canadá, piensa que la WS fracasará porque la mayoría de empresas no están dispuestas a abrir el acceso a los datos propietarios.

Con esta información, es nuestro deseo proporcionar un conocimiento general de la Web Semántica, dónde se encuentra actualmente, cuáles son las previsiones del futuro y cómo nos afectará personal y profesionalmente.

En construcción

Hasta cierto punto, la Web Semántica ha sido un proyecto en desarrollo desde que se formuló. Según Berners-Lee, “durante los últimos diez años hemos estado definiendo la base de la WS desde el punto de vista de formatos de datos y el lenguaje de ontología Web”.

La Web Semántica depende de varias tecnologías clave que facilitan contenidos que incorporan la capacidad de reconocimiento de datos. La primera de éstas tecnologías proviene directamente de la Web original: el URI (identificador universal de recursos). Cada dirección URL es un tipo de URI, y son importantes porque el usuario debe poder identificar las fuentes de datos y así acceder a ellos, igual que en una página Web.

De mayor importancia en la WS es el RDF (marco de descripción de recursos), que fue el primer estándar definido para la Web Semántica. El RDF posibilita la descripción de contenidos Web de manera que sean descifrables por las máquinas. Un modelo típico de archivos RDF son los archivos FOAF (amigo de un amigo en inglés).

Por ejemplo, un archivo FOAF con el nombre ‘Mónica’ facilita que el programa perciba que hay una persona con el nombre de Mónica que dispone de páginas Web, contactos, afiliaciones profesionales y amigos. Estos últimos disponen de sus propios archivos RDF y FOAF facilitando que la máquina registre todos estos vínculos. Este tipo de seguimiento y correlación es la clave de la Web Semántica.

En la Web Semántica no será necesario realizar múltiples búsquedas para inferir la relevancia de un dato con otro porque toda la información estará etiquetada y marcada

Durante un tiempo, el RDF fue el único estándar de la Web Semántica. Aunque se crearon unas implementaciones RDF muy interesantes, la WS no progresaba. Cuando el W3C reanimó el proyecto del lenguaje ontológico Web, u OWL, puso en marcha la solución del desarrollo de aplicaciones para el entorno profesional, ya que la definición de ontologías es una función básica para la clasificación de grupos de datos relacionados.

Aún así, la WS era deficiente porque no había establecido un lenguaje de consultas. Cómo comentaba Berner-Lee, “imagínese bases de datos sin SQL”. Para resolver este problema, el W3C propuso la adopción de SPARQL (el protocolo SPARQL y el lenguaje de consultas RDF) que incorpora las consultas de tipo SQL y las capacidades de RDF en la WS.

La Web Semántica en acción

Existen varios ejemplos de tecnologías WS que ya solucionan ciertas problemáticas, como las aplicaciones de ciencias médicas y faramaceuticas que proporcionan las búsquedas, accesos y entendimiento de la relación que existe entre enfermedades y medicamentos. No obstante, existen ejemplos con aplicaciones más cotidianas.

DBpedia.org es un proyecto que aplica la tecnología semántica en los datos e información de Wikipedia.org. A través de las consultas SPARQL, DBpedia ofrece una capacidad de búsqueda mucho más potente que la de Wikipedia.

Por ejemplo, una búsqueda en Wikipedia de series cómicas de televisión en Nueva York produce un resultado poco útil que muestra la relevancia de todos los aciertos encontrados. Sin embargo, con DBpedia, aparece un listado de todas las series de televisión de Nueva York como si de una consulta SQL de base de datos, y no una consulta semántica, se tratase.

Otro ejemplo es el de Joost, un servicio de televisión online, que utiliza la tecnología semántica para mejorar las relaciones que existen entre los contenidos de programación televisiva facilitando la búsqueda de programas o series en función de contenidos.

Hay ejemplos de tecnologías WS que ya solucionan ciertas problemáticas, como las aplicaciones de ciencias médicas y farmacéuticas que proporcionan las búsquedas, accesos y entendimiento de la relación que existe entre enfermedades y medicamentos

 

Según Eric Miller de W3C, una de las razones por la creación de Zepheira fue para ofrecer a los negocios una comprensión exhaustiva de cómo superar los obstáculos de despliegue de tecnologías semánticas.

Uno de los aspectos clave que Miller identificó tras desplegar tecnologías semánticas en varias industrias fue que la mayoría de negocios disponían de datos semánticos en sus sistemas aunque estuvieran inconscientes de ello, desde aplicaciones de correos a herramientas de calendarios a bases de datos y directorios LDAP. “Las empresas se dieron cuenta que contaban con un enorme capital intelectual que no estaban aprovechando”, asegura Miller.

Miller afirma que ahora los trabajos se centran en liberar los datos de sistemas propietarios para que puedan ser utilizados en aplicaciones semánticas. Asimismo, las tecnologías se están utilizando como medio de integración de negocios y que cumple con el objetivo propuesto por Berners-Lee: la integración de datos de todas las aplicaciones.

ShareThis

Publicidad

Newsletter gratuita

Suscribase ahora a nuestra Newsletter gratuita.
Le enviaremos periodicamente información sobre nuevos WhitePapers, Webcasts, casos de éxito e información de novedades de productos y noticias.

Publicidad

Destacamos

  • El Data Fabric, clave para impulsar la digitalización del sector público

    La digitalización de las organizaciones públicas es una cuestión crucial en un mundo cada vez más conectado y avanzado tecnológicamente. Para Julio Campoy, vicepresidente de Appian, una transformación esencial para facilitar y simplificar tanto los procesos internos como para los que se dirigen a los ciudadanos y en la que el Data Fabric cobra singular importancia

Envío de artículos por email de IT CIO.es

Por favor, introduzca la siguiente información











Cerrar

Envío de artículos por email de IT CIO.es

Procesando envíos...

Envío de artículos por email de IT CIO.es

Email enviado. Cerrar

Envío de artículos por email de IT CIO.es

Error en el envio. Pulse aqui para cerrar.Cerrar