Ordenadores y personas condenados a entendernos. Aproximaciones a la Web Semántica
Desde que Sir Tim Berners-Lee apuntó que el futuro de la Web pasaría por que los ordenadores podrían comprender el contenido y las asociaciones de la información que existe en la Web, dando lugar al concepto de Web Semántica, han pasado muchos años. No obstante, la dificultad de esta idea ha provocado que este concepto se haya ido posponiendo muchas veces, hasta el punto de levantar una cierta incredulidad en la comunidad científica.
Y ya no sólo de incredulidad, sino que muchos se plantean ¿Merece la pena que los ordenadores nos entiendan?. Los que piensan que realmente no merece la pena utilizan frecuentemente como argumento que Google, que no utiliza tecnologías semánticas por ahora, es capaz de dar tan buenas soluciones como otras herramientas especializadas. (Respecto a esto es muy interesante la siguiente prueba: escribir “United States president at present” en diferentes herramientas. Se puede observar como Google en su segunda entrada apunta a George Bush directamente, mientras que Powerset, buscador semántico lanzado a bombo y platillo hace poco y que sólo busca en la Wikipedia, no hace referencia al actual presidente, al menos en las primeras entradas. Es curioso que la primera entrada es una lista de alumnos de GeorgeTown en la que hay una foto del príncipe Felipe y de Clinton pero nada del actual presidente)
Sin embargo algo parece estar cambiando en este campo de investigación y empieza a haber un consenso de que estas tecnologías están alcanzando un nivel suficiente para empezar la transformación de la Web hacia un nuevo paradigma de relación hombre-máquina, al menos así lo afirma Tim Berners-Lee , y esa idea también quedó patente en la última conferencia semántica que se celebró en San Jose y sobre la que escribimos hace unas semanas.
Por una parte el crecimiento exponencial de la información en Internet y sobre todo de contenidos multimedia, y por otra el buen grado de madurez de las piezas fundamentales para construir aplicaciones robustas de Web Semánticas hacen que “ordenadores y humanos debamos entendernos mejor de lo que hemos hecho hasta ahora”
Para abordar este desafío existen dos tendencias claramente definidas:
- El enfoque Botton-Up:
La aproximación clásica de la Web semántica consiste en un enfoque de abajo-arriba. Esto consiste en que si realmente queremos que los ordenadores puedan entender lo que nosotros deseamos transmitir no hay más remedio que realizar anotaciones, utilizando RDF en las paginas. Con este enfoque se ganaría en eficiencia a cambio de trasladar a los usuarios la tediosa tarea de introducir información adicional como RDF, Microformats, and Meta Headers.
Esta aproximación ha recibido varias victorias últimamente, como con el anuncio de Yahoo del lanzamiento de su buscador basado en este concepto, o Dapper que trata de convertir una Web Site en una especie de Web Service o más bien en un data service que permita a los internautas acceder a información de forma estructurada, para lo que recurre a anotaciones de los editores.
En definitiva este enfoque es un ejemplo de modelo win-win, ya que propone un esfuerzo al usuario a cambio de que la información será mejor entendida por buscadores, con un gran número de ventajas como publicidad mejor dirigida a los usuarios.
- Enfoque Top-Down:
A pesar de las ventajas que supone el enfoque clásico, el esfuerzo de añadir etiquetas, además de problemas añadidos como el mantenimiento futuro cuando cambia la información, está provocando el asentamiento de un nuevo modelo que tiene una filosofía muy clara: dejar la información tal y como está, y aplicar un conocimiento específico vertical para entregar resultados al usuario mediante una aplicación. En este caso no se necesita ningún tipo de etiquetas RDF, sino que el reconocimiento es algorítmico.
Este es el modelo del buscador de personas Spock que actúa según esta filosofía. Este buscador no necesita que los usuarios hagan reanotaciones de la información en RDF y OWL, sino que utiliza algoritmos heurísticos. A pesar de que este buscador no tiene un gran conocimiento semántico, si que es capaz de ofrecer servicios de usuario interesantes, basados en una semántica simple.
Otro servicio que funciona bajo esta filosofía es el Map+ add-on para Firefox. Esta aplicación reconoce direcciones y proporciona pops-up usando Yahoo! Maps. Igual que la aplicación anterior, utiliza unos conocimientos básicos semánticos que le llevan a distinguir cuando algo es una dirección. Es cierto que comete alguna vez errores pero en una gran mayoría de los casos la solución es adecuada.

Conclusiones:
Dada la gran cantidad de información y la velocidad a la que se expande el Universo Digital, PCs y personas estamos condenados a entendernos, por lo que la Web semántica es el gran reto que se plantea para el futuro en el campo de los sistemas de información. Es cierto que ya existen las piezas fundamentales sobre las que edificar este concepto. No obstante, lo ambicioso del objetivo hacen que las dos aproximaciones distintas: botton-up y top-down sean posibles y puedan convivir. De hecho los motores de búsqueda que utilicen el enfoque top-down, también podrían beneficiarse de las etiquetas RDF, aunque sean contrarios a la filosofía de etiquetas.
Durante los próximos años las tecnologías semánticas irán penetrando en casi todos los ámbitos de los sistemas de información, aunque no se espera una “Killer application”, sino que habrá muchas soluciones parciales que convivirán. Lo que si es seguro es que no habrá una gran ontología que todo lo “entienda” y que probablemente nunca pueda llegar a existir basándose en los principios de incompletitud de Godel: Ningún sistema lógico puede ser a la vez consistente y completo. Este principio tiene una consecuencia muy clara, hay que aprender a vivir con la incertidumbre cosa que también tendremos que enseñar a los ordenadores que por ahora están orientados a ofrecer soluciones precisas.
Comentarios
3 Comentarios to “Ordenadores y personas condenados a entendernos. Aproximaciones a la Web Semántica”
Deja un comentario










[...] y como se ha comentado en otro post, algunas empresas como Yahoo están apostando por un planteamiento botton-up como manera de mejorar [...]
Gracias por el artículo:
Las posibilidades de la web semántica son muchas en cuestiones de búsqueda vertical en entornos cerrados. Así, Powerset se demuestra perfectamente capaz con la wikipedia. Esta herramienta o similares serían una buena solución en intranets o estructuras B2B (comercio electrónico entre empresas) Pero aún le queda mucho trecho por andar hacia la totalidad de la web. Los intereses económicos en el mantenimiento de la estructura actual son abismales y difíciles de sortear si los usuarios no nos implicamos en la potenciación del uso de las herramientas semánticas. Es, así, una cuestión de responsabilidad social.
Creo que este artículo te puede interesar: http://www.dreig.eu/caparazon/2008/07/14/me-interesa-la-web-semantica-porque-no-le-interesa-a-nadie-mas/
Como también estos: http://www.dreig.eu/caparazon/category/web-semantica-2/
Sin ánimo de spammear (conozco pocos entornos menos interesados, los enlaces apuntan directamente a los blogs de los autores) y siguiendo mis propios consejos, cree hace un tiempo un planeta de noticias sobre web semántica en español en http://www.semanticaweb.info
Estáis invitados, si tenéis un feed exclusivo sobre el tema, a participar en él.
Un saludo
[...] Ordenadores y personas condenados a entendernos. Aproximaciones a la Web Semántica [...]