Semantic Web Services o la Web activa
Publicado el Septiembre 25, 2008 por Javier Carbonell
Archivado bajo General, Sociedad de la Información, Tendencias
Si hasta ahora el reto fundamental en el mundo de los sistemas de información era hacer transparente el hardware, permitiendo que el software que corremos en un ordenador no tenga porque estar enterado de lo que pasa en ese nivel, sin duda alguna la nueva era viene marcada por el intento de hacer transparente el software, de tal manera que los servicios no estén “enterados” del software sobre el que funcionan. A nivel de usuario esto ya empieza a ser una realidad con el auge de conceptos como cloud computing, software as a service, computación online que permiten que los usuarios accedan a los servicios despreocupándose del software. A nivel de interoperabilidad entre aplicaciones todavía esta desconexión entre software y servicios no está tan avanzada.
Los Web Services nacieron hace ya algunos años con la intención de poder compartir servicios utilizando para ello las tecnologías Web. De esta forma un servicio creado por cualquier empresa podría ser utilizado por cualquier otra, no importa en que lenguaje estuviera creado y que plataforma utilizara. Así se podría generar un ecosistema de servicios que evitara duplicar esfuerzos. Esto lleva todo un proceso con diferentes etapas como descubrimiento de servicios, adaptación, ranking, mediación, invocación, que hacen necesaria la intervención humana.
La arquitectura de estos servicios que se muestra en la figura supone la existencia de un broker que haga la “negociación” entre los servicios, lo que supone que debe haber una serie de normas que permitan el entendimiento entre ellos. Es necesario por tanto un lenguaje común, para que cuando un servicio pide una información de otro, realmente sepa lo que se va a encontrar.
Se han hecho esfuerzos en este sentido con la plataforma XML UDDI que trata de servir de repositorio con listados de los servicios incluyendo taxonomías e información técnica. No obstante la heterogeneidad es un gran obstáculo:
• Heterogeneidad en terminología
• Heterogeneidad en lenguas y formalismos
• Heterogeneidad en funcionalidades
• Heterogeneidad en procesos de negocio
El simple intento de utilizar un servicio que calcula rutas de trenes entre provincias por parte de un servicio de una agencia de viajes que trata de buscar la opción más económica de un viaje, necesita una serie de convencionalismos sobre lo que significa cada uno de los campos, lo que hace en muchos casos se comentan errores a pesar de la intervención humana.
Dado el crecimiento exponencial de servicios accesibles a través de la Web, la búsqueda de alternativas que faciliten la interoperabilidad se hace algo necesario para aprovechar todo su potencial. Por este motivo se están desarrollando los Semantic Web Services que tratan de utilizar tecnologías semánticas en la interoperabilidad de servicios como siguiente paso en la evolución de la Web.
Básicamente el fundamento es la utilización de ontologías para introducir una capa semántica que facilite la comunicación o mejor dicho el “entendimiento” entre servicios. Esta ontología posibilita que los servicios se auto-describieran haciendo más sencilla la publicación, descubrimiento, composición y ejecución en la red. Esto permitirá que los servicios puedan relacionarse con otros servicios de forma autónoma según las necesidades de cada momento lo que supone un primer paso para convertir la Web pasiva actual en una Web más activa.
Tags: Añadir nueva etiqueta, ontologías, semantic web services
Tecnologías Semánticas: situación y tendencias actuales
Publicado el Junio 30, 2008 por Javier Carbonell
Archivado bajo Sociedad de la Información, Tendencias
Sin duda alguna las tecnologías semánticas están empezando a dar sus frutos y son ya muchos los que desde los más diferentes ámbitos: empresas usuarias, organismos públicos, comunidad científica, desarrolladores de aplicaciones… defienden su incorporación en los sistemas de información. El motivo fundamental que está impulsando este movimiento procede de la sensación bastante generalizada de que nos estamos ahogando en datos y de que el grado de madurez que están alcanzando estas tecnologías es suficiente para entregar resultados.
En estos momentos el concepto tan abstracto de “tecnologías semánticas”, muy utilizado pero que muchas veces poco comprendido, es visto como una posible salvación para abordar el reto de una Web más estructurada. Tanto es así, que algunos expertos como Richard MacManus lo considera como la tendencia más importante de la Web para los próximos años
El primer problema que surge es definir que son las tecnologías semánticas, ya que dependiendo del área en el que se trabaje, la visión puede ser completamente diferente. En cierto modo sucede como en el cuento de los seis ciegos y el elefante, que dependiendo de que parte palpe cada uno, la imagen que se construye sobre como es el elefante es diferente.
Una definición genérica de tecnologías semánticas es: aquellas tecnologías que tratan de manejar las relaciones entre datos para proporcionar un acceso inteligente a los recursos que sirva para mediar entre las intenciones de los usuarios y la información disponible. El gran reto es crear, codificar y extraer significados y ofrecer una organización estructurada de conocimiento para manipular, reutilizar y direccionar la información. En el presente post trataremos de repasar la situación actual y tendencias actuales de las tecnologías semánticas. Como se ha comentado, la situación actual viene marcada por la sensación de que las piezas fundamentales para construir aplicaciones semánticas ya están ahí, y eso se plasma en la estabilidad de estándares y bases de conocimiento.
- Estándares:
El problema de los estándares a la hora de comunicar información es tan antiguo como la propia civilización, siendo el ejemplo más recurrido sobre la falta de entendimiento entre las personas por la falta de un sistema común de información el caso de la “Torre de Babel”.
Por este motivo, desde que se empezó a hablar de tecnologías semánticas, los aspectos relacionados con los estándares han tenido gran relevancia. Según comentó Ivan Herman (líder de la actividad semántica de W3C) en la Conferencia Semántica SemTech 2008, ya se ha alcanzado un grado elevado de desarrollo en los estándares sobre los cuales pueden edificarse los servicios de tecnologías semánticas. Las principales conclusiones de su conferencia relativas a los estándares fueron:
- Existe una estabilidad en los estándares RDF y OWL.
- En el año 2008 aparece un nuevo estándar para hacer consultas, el SPARQL
- Existen tecnologías para acceder/crear RDF datos: GRDDL, RDFa, POWDER
- Algunos vocabularios empiezan a ser pervasivos: Dublin Core, FOAF…
- Bases de conocimiento
Las ontologías y las tripletas de datos RDF tratan de representar formalmente los conceptos dentro de un dominio y también las relaciones entre estos conceptos. Son por tanto la base del conocimiento estructurado y uno de los pilares sobre los que se basa las tecnologías semánticas. Tras varios años de trabajo en el campo de las tecnologías semánticas, el número de datos, ontologías y su tamaño ha ido creciendo, constituyéndose como verdaderas bases de datos de conocimiento.
Estas bases de datos semánticamente preparadas tienen un ámbito vertical: Geonames Ontology tiene más de 6 millones de datos, Ontology for Biomedical Investigations, RDF Book mashup…
Llama en este sentido la atención el reto de la 7th International SemanticWeb Conference que se define como “Billion Triple Challenge 2008“.
Una vez que existe una base firme y con un buen grado de madurez, conviene repasar cuales son las áreas en las que hay más movimiento y empiezan a marcar tendencia:
- Buscadores semánticos:
Sin duda alguna este es el campo que más expectativas ha levantado en los últimos años. El incremento en la cantidad de información en la Web, sobre todo desde que la Web 2.0 se ha asentado convirtiendo a los usuarios en generadores de contenidos, hace que una gran cantidad de empresas se haya planteado modelos alternativos a Google, el cual se basa únicamente en estadísticas.
Durante el año 2008 se produce el lanzamiento de dos herramientas en este sentido Hakia y Powerset. No obstante, tras realizar pruebas comparativas con Google se ha comprobado que la utilización de tecnologías semánticas no mejora la calidad con respecto a los resultados ofrecidos por Google.
Tal y como se ha comentado en otro post, algunas empresas como Yahoo están apostando por un planteamiento botton-up como manera de mejorar la calidad de las búsquedas, para ello están indexando etiquetas semánticas de toda la Web con la intención de ofrecer resultados más estructurados. Según este planteamiento, los editores tendrán que introducir metadatos en sus WebSites si desean que un buscador semántico pueda entender el contenido. Esto conlleva un esfuerzo por parte de los creadores de contenido que según ellos se verá recompensado por las posibilidades que ofrecen las búsquedas semánticas.
- Web Services semánticos
Los web services añaden una capa de funcionalidad a los sitios web, suponiendo un primer paso para la integración de componentes distribuidos de software. Se basan en estándares y tecnologías como Soap, UDDI, y WSDL. A pesar del progreso que se ha realizado para facilitar la interoperabilidad, todavía es necesaria la intervención humana, por ejemplo tanto el proceso de encontrar un servicio relevante como de los datos que necesitan ser intercambiados entre los servicios, requieren de un trabajo manual.
El concepto de Semantic Web Services trata de solucionar el problema de la interoperabilidad entre los Web Services, intentando introducir además una interoperabilidad semántica ya que por ahora los web services se basan en XML lo que permite una interoperabilidad sintáctica. De esta manera se podrán automatizar las tareas relacionadas con los Web Services como descubrimiento, publicación, mediación, invocación y adaptación de servicios. En este sentido existe un gran número de iniciativas como OWL-S, METEROR-S, WSMO, WSDL-S, IRS, que han sido dirigidas a W3C, organismo que ha realizado ya las primeras recomendaciones sobre semántica para Web Services.
Como una primera aproximación de este concepto, la empresa Reuters ha lanzado la API Open Calais, que permite transformar texto desestructurado en metadatos, y que está centrada en “Personas”, “Compañías”, “Lugares”, y “Eventos” como se muestra en la siguiente figura:
Otro caso de API basada en tecnologías semánticas es la SemanticHacker API de la companía Textwise, que se centra en el descubrimiento de servicios y que ofrece un millón de dólares por la mejor aplicación comercial que la utilice. Este enfoque es diferente al de la simple extracción de datos o el uso de metadatos, ya que va más lejos tratando de encontrar el tema sobre el que giran los documentos.
Otro intento en este ámbito proviene de Dapper que trata de convertir una Web Site en una especie de Web Service o más bien en un data service que permita a los internautas acceder a información de forma estructurada. Para ello recurre a anotaciones de los editores.
- Personalización según contexto
En un gran número de ocasiones los servicios tienen mucha dependencia con el contexto en el que se utilizan. En estos casos la personalización de contenidos juega un papel fundamental en su aceptación. Las tecnologías semánticas pueden ofrecer soluciones con ontologías específicas que permitan descubrir los contextos y utilizar esta información para enriquecer la experiencia del usuario.
Sezwho es una empresa especializada en utilizar el contexto en aplicaciones de social Web, para ello analiza diferentes tipos de medios sociales, reputaciones y perfiles y trata de introducir información relevante en el contexto de una conversación.
En el campo de la navegación utilizando diferentes dispositivos, el hecho de conocer el contexto del usuario es un aspecto importante para mejorar la usabilidad de los servicios. Este concepto de contexto es amplio y tiene en cuenta: perfil del usuario, lugar desde el que se accede, características del dispositivo de acceso… Un ejemplo de como afrontar este desafío mediante las tecnologías semánticas se encuentra en la iniciativa OpenSource de la comunidad Morfeo, que en sus especificaciones incluye una ontología sobre la utilización del contexto en la navegación desde dispositivos móviles.
Tags: buscadores semánticos, ontologías, personalización contexto, RDF, tecnologías semánticas, Web services semánticos
Ordenadores y personas condenados a entendernos. Aproximaciones a la Web Semántica
Publicado el Junio 23, 2008 por Javier Carbonell
Archivado bajo General, Sociedad de la Información, Tendencias
Desde que Sir Tim Berners-Lee apuntó que el futuro de la Web pasaría por que los ordenadores podrían comprender el contenido y las asociaciones de la información que existe en la Web, dando lugar al concepto de Web Semántica, han pasado muchos años. No obstante, la dificultad de esta idea ha provocado que este concepto se haya ido posponiendo muchas veces, hasta el punto de levantar una cierta incredulidad en la comunidad científica.
Y ya no sólo de incredulidad, sino que muchos se plantean ¿Merece la pena que los ordenadores nos entiendan?. Los que piensan que realmente no merece la pena utilizan frecuentemente como argumento que Google, que no utiliza tecnologías semánticas por ahora, es capaz de dar tan buenas soluciones como otras herramientas especializadas. (Respecto a esto es muy interesante la siguiente prueba: escribir “United States president at present” en diferentes herramientas. Se puede observar como Google en su segunda entrada apunta a George Bush directamente, mientras que Powerset, buscador semántico lanzado a bombo y platillo hace poco y que sólo busca en la Wikipedia, no hace referencia al actual presidente, al menos en las primeras entradas. Es curioso que la primera entrada es una lista de alumnos de GeorgeTown en la que hay una foto del príncipe Felipe y de Clinton pero nada del actual presidente)
Sin embargo algo parece estar cambiando en este campo de investigación y empieza a haber un consenso de que estas tecnologías están alcanzando un nivel suficiente para empezar la transformación de la Web hacia un nuevo paradigma de relación hombre-máquina, al menos así lo afirma Tim Berners-Lee , y esa idea también quedó patente en la última conferencia semántica que se celebró en San Jose y sobre la que escribimos hace unas semanas.
Por una parte el crecimiento exponencial de la información en Internet y sobre todo de contenidos multimedia, y por otra el buen grado de madurez de las piezas fundamentales para construir aplicaciones robustas de Web Semánticas hacen que “ordenadores y humanos debamos entendernos mejor de lo que hemos hecho hasta ahora”
Para abordar este desafío existen dos tendencias claramente definidas:
- El enfoque Botton-Up:
La aproximación clásica de la Web semántica consiste en un enfoque de abajo-arriba. Esto consiste en que si realmente queremos que los ordenadores puedan entender lo que nosotros deseamos transmitir no hay más remedio que realizar anotaciones, utilizando RDF en las paginas. Con este enfoque se ganaría en eficiencia a cambio de trasladar a los usuarios la tediosa tarea de introducir información adicional como RDF, Microformats, and Meta Headers.
Esta aproximación ha recibido varias victorias últimamente, como con el anuncio de Yahoo del lanzamiento de su buscador basado en este concepto, o Dapper que trata de convertir una Web Site en una especie de Web Service o más bien en un data service que permita a los internautas acceder a información de forma estructurada, para lo que recurre a anotaciones de los editores.
En definitiva este enfoque es un ejemplo de modelo win-win, ya que propone un esfuerzo al usuario a cambio de que la información será mejor entendida por buscadores, con un gran número de ventajas como publicidad mejor dirigida a los usuarios.
- Enfoque Top-Down:
A pesar de las ventajas que supone el enfoque clásico, el esfuerzo de añadir etiquetas, además de problemas añadidos como el mantenimiento futuro cuando cambia la información, está provocando el asentamiento de un nuevo modelo que tiene una filosofía muy clara: dejar la información tal y como está, y aplicar un conocimiento específico vertical para entregar resultados al usuario mediante una aplicación. En este caso no se necesita ningún tipo de etiquetas RDF, sino que el reconocimiento es algorítmico.
Este es el modelo del buscador de personas Spock que actúa según esta filosofía. Este buscador no necesita que los usuarios hagan reanotaciones de la información en RDF y OWL, sino que utiliza algoritmos heurísticos. A pesar de que este buscador no tiene un gran conocimiento semántico, si que es capaz de ofrecer servicios de usuario interesantes, basados en una semántica simple.
Otro servicio que funciona bajo esta filosofía es el Map+ add-on para Firefox. Esta aplicación reconoce direcciones y proporciona pops-up usando Yahoo! Maps. Igual que la aplicación anterior, utiliza unos conocimientos básicos semánticos que le llevan a distinguir cuando algo es una dirección. Es cierto que comete alguna vez errores pero en una gran mayoría de los casos la solución es adecuada.

Conclusiones:
Dada la gran cantidad de información y la velocidad a la que se expande el Universo Digital, PCs y personas estamos condenados a entendernos, por lo que la Web semántica es el gran reto que se plantea para el futuro en el campo de los sistemas de información. Es cierto que ya existen las piezas fundamentales sobre las que edificar este concepto. No obstante, lo ambicioso del objetivo hacen que las dos aproximaciones distintas: botton-up y top-down sean posibles y puedan convivir. De hecho los motores de búsqueda que utilicen el enfoque top-down, también podrían beneficiarse de las etiquetas RDF, aunque sean contrarios a la filosofía de etiquetas.
Durante los próximos años las tecnologías semánticas irán penetrando en casi todos los ámbitos de los sistemas de información, aunque no se espera una “Killer application”, sino que habrá muchas soluciones parciales que convivirán. Lo que si es seguro es que no habrá una gran ontología que todo lo “entienda” y que probablemente nunca pueda llegar a existir basándose en los principios de incompletitud de Godel: Ningún sistema lógico puede ser a la vez consistente y completo. Este principio tiene una consecuencia muy clara, hay que aprender a vivir con la incertidumbre cosa que también tendremos que enseñar a los ordenadores que por ahora están orientados a ofrecer soluciones precisas.
Tags: godel, ontologías, RDF, web semantica














