Los empleados deciden en qué idioma publican sus entradas.
Puedes encontrar más contenidos seleccionando el idioma inglés en el enlace superior.

La Cofa, Mayo 2009

1 Malo2 Mejorable3 Normal4 Bueno5 Excelente (Votos: 1. Media: 5,00/5)
Loading ... Loading ...

Bajo estas lineas os adjuntamos una lista de todas las entradas que ha publicado La cofa este último mes de Abril:

WWW2009: 20 años de Web por Sir Tim Berners Lee

1 Malo2 Mejorable3 Normal4 Bueno5 Excelente (Votos: 1. Media: 4,00/5)
Loading ... Loading ...

Estos días estamos en el WWW2009, el Congreso mundial sobre la WWW que se celebra este año en Madrid. Ayer fue la inauguración oficial, a pesar de que empezaron las actividades el lunes, y el plato fuerte era la keynote de Sir Tim Berners-Lee (TBLL) sobre estos 20 años desde que presentó su propuesta en el CERN para un sistema de intercambio de información, lo que se considera el inicio oficial de la WWW, y lo que nos espera en el futuro.

No fue un discurso muy distinto del que viene manteniendo en los últimos años, pero creo que merece la pena reseñar su contenido.

Arrancó su charla con un “cómo pasa el tiempo”, y cómo tras 20 años estamos ahora ante algo maduro, con un enorme peso económico y que ha evolucionado hasta tal punto que áreas como la búsqueda o la publicidad pueden considerarse verdaderas ciencias.

¿Cuáles son los grandes cambios de estos últimos años? Señala una mayor profesionalización de la web, que se manifiesta que ese proceso que está convirtiendo en ciencias áreas antes informales, como ha cambiado la percepción del tiempo, el desplazamiento hacia la movilidad, que las aplicaciones Web se han convertido en verdaderas plataformas, y el movimiento “Linked Open Data“. Sin embargo hay cosas que no cambian: seguimos teniendo documentos estáticos, permanece la necesidad de una web en la que se pueda escribir y no sólo leer, y la unificación por medio de estándares.

Al hablar de las Web Apps, o aplicaciones web, desctaca que son plataformas “serias” de verdad, aunque precisan de un esquema de confianza igualmente serio. En su opinión precisan  una instalación descentralizada y modular, abordar el problema de la privacidad, de la cual la geolocalización es sólo su aspecto más superficial.

Hizo una defensa encendida de la modularidad, como elemento esencial para garantizar la extensibilidad de las aplicaciones, pero donde insistió más fue en la necesidad de no repetir en las redes sociales el esquema de “wallet garden” que se ha vivido en el pasado con AOL y otros servicios cerrados no interoperables. Los usuarios deberían tener control sobre la información que dejan en las redes sociales, lo que incluye poder moverla a su antojo y no dependiendo de servicios de terceros. Es necesario contar con APIs abiertas, y permitir un enlace efectivo de la información. Confrontaba los “Social silos” con un “Open Social Networking”.

Otro punto en el que insistió es el de la Identidad. Aunque OpenID empieza a ser conocido, habló de otras posibilidades como FOAF+SSL, y advirtió de las implicaciones de las “pseudonymity” que ser considerada también en cualquier esquema de identidad futuro.

El entorno está cambiando dramáticamente: los “pixels” sustituyen al papel, sobre todo en carteles, anuncios, avisos en espacios públicos; los móviles se popularizan en países en desarrollo, y el volumen de información disponible crece exponencialmente.

La defensa del Linked Open Data Movement es otro de los puntos habituales en las recientes presentaciones de TBL. Se trata de promover la apertura de fuentes de información de todo tipo de organizaciones, empresas y, sobre todo, gobiernos, para facilitar su acceso, indexación y enlace. Un reto al que se han unido ya bastantes instituciones, no obstante.

Tra revisar las consideraciones sociales de todos estos movimientos, pasó a hablar del futuro que esperaba de la Web:

  • Modularidad a todas las escalas, y un modelo para facilitar la extendesión de la funcionalidad a través de módulos
  • Datos y documentos entrelazados sin distinción, e indexados por mecanismos capaces de responder a preguntas
  • Una mayor integración del interface de usuario y de la gestión de datos en los lenguajes de programación (habría que señalar que frente al modelo de separación vigente)
  • Un nuevo modelo de seguridad para las aplicaciones Web

La presentación de TBL está disponible en la Web del W3C, organismo que preside y en el que se mantiene muy activo promoviendo su visión de web semántica, comunicaciones sin personas, apertura, … Al contrario que otros personajes destacados en la historia de Internet, sigue en la brecha. TBL creó todo el armazon de la WWW, y sigue empujando su desarrollo. Todo un ejemplo de espíritu emprendedor e innovador.

El futuro de la Web y la Web Science

1 Malo2 Mejorable3 Normal4 Bueno5 Excelente (No valorado aún)
Loading ... Loading ...

Technology Review ha publicado un curioso artículo (“The Future of the Web“) en el que pide a trece personas distintas una breve visión del futuro de la Web de aquí a unos cinco o diez años. Claro está, no se trata de trece personas cualquiera, si no de aquellas que podríamos calificar como “opiniones autorizadas”: desde los ubicuos Tim Berners-Lee y Vinton Cerf (que de creadores del WWW y TCP/IP han pasado a “evangelistas” casi universales sobre Internet), Richard Stallman (Linux), Bjarne Stroustrup (C++) a personas menos conocidas pero también influyentes como la presidenta de Six Appart, el CEO de Salesforce, o el director del India Times.
Las opiniones recogidas (y los comentarios, también destacables), aún en su brevedad, contienen visiones singulares, originales y ricas. Por ejemplo, Cerf tiene una visión continuista: alta velocidad, IPv6 implantado, móviles mayoritariamente conectados, IPTV y hogares conectados con dispositivos que se descubren e interactúan automáticamente.

Stallman habla del Gran Hermano, y la pérdida de control sobre aplicaciones y datos. Una visión distópica también compartida por Stroustrup: fin de la privacidad y facilidades para quienes van a medrar con nuestros datos. Esta pérdida de privacidad será en parte inducida por nosotros mismos al tender a publicar buena parte de nuestra vida (Trott, de Six Appart).

Los estándares abiertos, el software multiplataforma, y las APIs basadas en OpenSocial, microformatos y otros estándares abrirán nuevas posibilidades a los programadores (Culver, de Pownce). Una visión no compartida por todos, ya que se defiende el abandono de los estándares (Zittrain, autor de “The Future of the Internet–and How to Stop It“) como medida contra las amenazas mencionadas, a menos que se garantice una continuidad en las plataformas y sus ecosistemas.

El desarrollo software cambiará además por la capacidad de la red para la desintermediación, tal y como ha hecho con los contenidos y el comercio (Benioff de Salesforce), lo que sería potenciado por las plataformas capaces de soportar un modelo cloud computing de aplicaciones de negocio.

El acceso a Internet cambiará radicalmente debido a la movilidad y el abandono del PC (Pearce, de dotMobi). El móvil será el medio usado por Internet para introducirse en mercados tan peculiares como el africano, aunque dependerá de la aparición de dispositivos accesibles para sus potenciales clientes (Hersman, de Whiteafrican). En otros sitios, la web romperá las tradicionales barreras impuestas por el control gubernamental de la información (Nanabhay, de Al Jazeera), y veremos versiones locales, incluso de lenguajes y plataformas, para otros mercados (Hira, de Indian Times).

La extrema movilidad vendrá de la mano de implantes cerebrales directos (Abrams, Socializr), que haran todo más fluido e inmediato.

He dejado para el final a Tim Berners-Lee. Su visión tiene mucho de utopía social (Internet llega a todas partes y ayuda a aliviar la pobreza), política (apertura al público de las bases de datos gubernamentales) y evolución tecnológica (uso de la voz, accesibilidad). Pero sobre todo apuesta por ver funcionando una Web semántica real como parte de una ola de progreso y creatividad en la red.

Otro motivo para dejar al final a TBL, es hablar de “Web Science” (webscience.org), una iniciativa que apadrina junto a un nutrido grupo de personajes relevantes del WWW, y sobre la que se publica un número especial en la “Communications de la ACM” de este mes (en “Web Science: An Interdisciplinary Approach To Understanding the Web“, ¡gracias Xavier por los comentarios!).

Con una orientación más social que técnica, el propósito de la Web Science es la comprensión de lo que supone realmente la web, ayudar a su desarrollo técnico, y asegurar el acceso a los beneficios sociales que representa.

Se trata de una visión de la web como una entidad con vida propia, y que evoluciona y crece de forma independiente, por lo que merece ser estudiada como un fenómeno aparte. Hay una entrevista reciente tras su paso por la Campus Party (Tim Berners-Lee: “La web es la humanidad conectada por la tecnología”) en la que se resume su visión sobre lo que nos deparará la evolución futura de la WWW de la que se le considera “padre” fundador.

¿Qué nos deparará el mañana? Tendencias 2008 (II)

1 Malo2 Mejorable3 Normal4 Bueno5 Excelente (No valorado aún)
Loading ... Loading ...

Continuación del artículo “¿Qué nos deparará el mañana? Tendencias 2008 (I)”

O te mueves o caducas
Esta frase que tan famosa se hizo en un spot publicitario es otra de las claves del mañana. La banda ancha, el aumento de la velocidad, la mejora de la calidad y los múltiples accesos responderán a una inquietud cada vez más presente: la de conectarnos desde cualquier lugar y en todo momento a través de diferentes dispositivos.


Figura1. Fuente: Wikipedia. Licencia GNU

Para ello es crucial la sincronización, reencontrarte en el móvil, el ordenador o la televisión justo donde te dejaste, sin sensación de “deja vu”, lo que te permitirá actualizar tus diferentes “personalidades” digitales y tus conocimientos (novedades, noticias, eventos…) al ritmo que marca la Sociedad de la Información, de ahí que la Nanotecnología también tenga mucho que decir, aligerando nuestras comunicaciones gracias a la tendencia a miniaturizar desde el teléfono al PC e integrar todas las funcionalidades en uno.

La necesidad de acceder a la red y al mundo digital sea cual sea la localización del usuario lleva a hablar necesariamente del coche conectado, una de las máximas expresiones de la conectividad en movimiento mientras viajas, que se está desplazando a su vez a otros medios de transporte como el autobús, el tren o los aviones.

El sexto sentido: la Web Semántica
Desde que la Web Semántica llegó, su despegue parecía haberse quedado a medio camino para volver a ser relanzado en los últimos tiempos gracias a una creciente infraestructura: webs, wikis, redes sociales… e ideas más claras en relación con su futuro conceptual y aplicativo.

¿Podremos realmente entendernos con las “máquinas”? Todavía es pronto para responder afirmativa y rotundamente a esta pregunta, pero lo cierto es que se comienzan a dar pasos firmes hacía una colección de espacios semánticos con iniciativa para obtener información y comunicarse entre sí y con las personas, lo que se ha denominado “Read/Write/Request Web”.

Un aspecto crucial para su desarrollo es la posibilidad de una correcta interpretación del lenguaje a través de la Inteligencia Artificial y el uso de interfaces vocales, así como una nueva forma de interactuar con nuestro entorno a través de los gestos faciales, movimientos de nuestro cuerpo o el contacto directo.

Ordenadores y personas condenados a entendernos. Aproximaciones a la Web Semántica

1 Malo2 Mejorable3 Normal4 Bueno5 Excelente (No valorado aún)
Loading ... Loading ...

Desde que Sir Tim Berners-Lee apuntó que el futuro de la Web pasaría por que los ordenadores podrían comprender el contenido y las asociaciones de la información que existe en la Web, dando lugar al concepto de  Web Semántica, han pasado muchos años.  No obstante, la dificultad de esta idea ha provocado que este concepto se haya ido posponiendo muchas veces, hasta el punto de levantar una cierta incredulidad en la comunidad científica.

Y ya no sólo de incredulidad, sino que muchos se plantean ¿Merece la pena que los ordenadores nos entiendan?. Los que piensan que realmente no merece la pena utilizan frecuentemente como argumento que Google, que no utiliza tecnologías semánticas por ahora, es capaz de dar tan buenas soluciones como otras herramientas especializadas. (Respecto a esto es muy interesante la siguiente prueba: escribir “United States president at present” en diferentes herramientas. Se puede observar como Google en su segunda entrada apunta a George Bush directamente, mientras que Powerset, buscador semántico lanzado a bombo y platillo hace poco y que sólo busca en la Wikipedia, no hace referencia al actual presidente, al menos en las primeras entradas. Es curioso que la primera entrada es una lista de alumnos de GeorgeTown en la que hay una foto del príncipe Felipe y de Clinton pero nada del actual presidente)

Sin embargo algo parece estar cambiando en este campo de investigación y empieza a haber un consenso de que estas tecnologías están alcanzando un nivel  suficiente para empezar la transformación de la Web hacia un nuevo paradigma de relación hombre-máquina, al menos así lo afirma  Tim Berners-Lee , y esa idea también quedó patente en la última conferencia semántica que se celebró en San Jose y sobre la que escribimos hace unas semanas.

Por una parte el crecimiento exponencial de la información en Internet y sobre todo de contenidos multimedia, y por otra el buen grado de madurez de las piezas fundamentales para construir aplicaciones robustas de Web Semánticas hacen que “ordenadores y humanos debamos entendernos mejor de lo que hemos hecho hasta ahora”

Para abordar este desafío existen dos tendencias claramente definidas:

  • El enfoque Botton-Up:

La aproximación clásica de la Web semántica consiste en un enfoque de abajo-arriba. Esto consiste en que si realmente queremos que los ordenadores puedan entender lo que nosotros deseamos transmitir no hay más remedio que realizar anotaciones, utilizando RDF en las paginas. Con este enfoque se ganaría en eficiencia a cambio de trasladar a los usuarios la tediosa tarea de introducir información adicional como RDF, Microformats, and Meta Headers.

Esta aproximación ha recibido varias victorias últimamente, como con el anuncio de Yahoo del lanzamiento de su buscador basado en este concepto, o Dapper que trata de convertir una Web Site en una especie de Web Service o más bien en un data service  que permita a los internautas acceder a información de forma estructurada, para lo que recurre a anotaciones de los editores.

En definitiva este enfoque es un ejemplo de modelo win-win, ya que propone un esfuerzo al usuario a cambio de que la información será mejor entendida por buscadores, con un gran número de ventajas como publicidad mejor dirigida a los usuarios.

  • Enfoque Top-Down:

A pesar de las ventajas que supone el enfoque clásico, el esfuerzo de añadir etiquetas, además de problemas añadidos como el mantenimiento futuro cuando cambia la información, está provocando el asentamiento de un nuevo modelo que tiene una filosofía muy clara: dejar la información tal y como está, y aplicar un conocimiento específico vertical para entregar resultados al usuario mediante una aplicación. En este caso no se necesita ningún tipo de etiquetas RDF, sino que el reconocimiento es algorítmico.

Este es el modelo del buscador de personas Spock que actúa según esta filosofía. Este buscador no necesita que los usuarios hagan reanotaciones de la información en RDF y OWL, sino que utiliza algoritmos heurísticos. A pesar de que este buscador no tiene un gran conocimiento semántico, si que es capaz de ofrecer servicios de usuario interesantes, basados en una semántica simple.

Otro servicio que funciona bajo esta filosofía es el  Map+ add-on para Firefox. Esta aplicación reconoce direcciones y proporciona pops-up usando Yahoo! Maps. Igual que la aplicación anterior, utiliza unos conocimientos básicos semánticos que le llevan a distinguir cuando algo es una dirección.  Es cierto que comete alguna vez errores pero en una gran mayoría de los casos la solución es adecuada.

 

Conclusiones:

Dada la gran cantidad de información y la velocidad a la que se expande el Universo Digital, PCs y personas estamos condenados a entendernos, por lo que la Web semántica es el gran reto que se plantea para el futuro en el campo de los sistemas de información. Es cierto que ya existen las piezas fundamentales sobre las que edificar este concepto. No obstante, lo ambicioso del objetivo hacen que las dos aproximaciones distintas: botton-up y top-down sean posibles y puedan convivir. De hecho los motores de búsqueda que utilicen el enfoque top-down, también podrían beneficiarse de las etiquetas RDF, aunque sean contrarios a la filosofía de etiquetas.

Durante los próximos años las tecnologías semánticas irán penetrando en casi todos los ámbitos de los sistemas de información, aunque no se espera una “Killer application”, sino que habrá muchas soluciones parciales que convivirán. Lo que si es seguro es que no habrá una gran ontología que todo lo “entienda” y que probablemente nunca pueda llegar a existir basándose en los principios de incompletitud de Godel: Ningún sistema lógico puede ser a la vez consistente y completo. Este principio tiene una consecuencia muy clara, hay que aprender a vivir con la incertidumbre cosa que también tendremos que enseñar a los ordenadores que por ahora están orientados a ofrecer soluciones precisas. 

Expectativas de evolución en los buscadores

1 Malo2 Mejorable3 Normal4 Bueno5 Excelente (Votos: 9. Media: 3,33/5)
Loading ... Loading ...

Las búsquedas pueden pasar por una funcionalidad humilde frente a otros servicios con un mayor despliegue de recursos e interactividad. A fin de cuentas, el interface de Google es un ejemplo de simplicidad, y frente a él, los nuevos servicios y aplicaciones son cada vez más complejos, coloristas y llenos de recursos gráficos.

Pero esa sencilla ventana de búsqueda está detrás de los mayores lanzamientos empresariales de los últimos años. Si Google ha llegado a ser lo que es, es gracias a su sistema de búsquedas; Yahoo! también debe mucho a su -desde nuestra perspectiva- primitivo sistema de catálogo. Y no son los únicos.

Motores de búsqueda

Esas simples ventanas de entrada de texto con su botón “Buscar” esconden algoritmos muy complejos, grandes sistemas de respaldo, enormes cantidades de recursos puestos al servicio de usuarios que no pagan por acceder a servicios de gran calidad. No pagan directamente, claro está, pero sí por medio de la ubicua publicidad que ha convertido a los buscadores en los pilares de la rentabilidad en Internet.

La mejora de los servicios de búsqueda es una especie de “guerra fría” en la que se están invirtiendo considerables recursos, y se realizan mejoras dramáticas, aunque externamente todo siga igual: la misma caja de entrada de texto, la misma lista de resultados. La preeminencia como buscador ha dado a Google el tamaño y músculo de que disfruta ahora, por lo que hay muchos a su alrededor tratando de heredar su corona. Eso hace que la propia Google dedique buena parte de su inversión a mejorar lo que ya sabe hacer mejor que nadie. Si las previsiones se cumplen, el volumen económico tras las búsquedas de Google puede acabar superando al que supone Office para Microsoft. Ambos con vocación monopolística, ambos muy lucrativos, ambos incrustados en nuestras vidas hasta extremos difíciles de creer hace unos poco.

En los dos últimos años se han ido definiendo tecnologías y tendencias en el mundo de las búsquedas que ahora se están haciendo realidad. Esas nuevas técnicas podrían suponer una mejora dramática en las búsquedas, y provocar cambios en el lucrativo primer puesto de este competitivo mercado. A continuación, vamos a revisar someramente algunas de las principales tendencias en el mundo de las búsquedas.

Búsqueda semántica. La extracción del significado para adquirir un mayor nivel de abstracción se presenta como el Santo Grial de las búsquedas. Cuando se puede extraer, abstraer y manejar el significado de los objetos indexados, las búsquedas pueden afinarse mucho más que con los mecanismos convencionales. Sin embargo esa es sólo una parte del problema: también hay que ser capaces de extraer el significado (y aún diríamos que la “intención”) de lo que quiere decir el usuario.

Aunque la tecnología semántica se presenta como el elemento clave en la evolución de la Internet del futuro (incluso se propone como el sustrato sobre el que se asentaría la llamada Web 3.0), aún es difícil encontrarla en servicios reales. Todos aquellos que claman basarse en el uso de tecnología semántica, se dedican a mercados verticales, muy orientados a aplicaciones muy concretas como la búsqueda de personas (como Spock), sin que los resultados sean tan espectacularmente precisos como cabría esperar.

Los buscadores verticales, especializados, y centrados en un tipo concreto de contenidos están tendiendo un gran desarrollo, aunque por su propia naturaleza es difícil que supongan una alternativa generalista.

La semántica de las búsquedas puede tener su origen en dos fuentes distintas. La primera es la evolución natural de los algoritmos de indexación y catalogación de contenidos. Es decir, se trata de potenciar aún más la automatización del tratamiento de la información, lo que llevaría a que buena parte de la comunicación en Internet sea entre máquinas y no entre personas. Esta es la visión de (Sir) Tim Berners-Lee, compartida por buena parte de la industria, una distopía de vigilancia permanente y automatizada, capaz de conocer todo sobre las personas, e incluso de anticiparse a sus acciones.

Búsqueda personal. En el otro extremo está la tendencia hacia incorporar un matiz más humano en las búsquedas. En realidad es basa en que el análisis y clasificación semántica se realicen por medio de personas, o al menos complementado con su visión. Se trata de una acción que tiene relación con la llamada Inteligencia Artificial Artificial, que pone a personas reales a realizar procesos generalmente mecanizados insatisfactoriamente: desde clasificar imágenes, hasta interpretar el sentido de la búsqueda de un usuario. Con las limitaciones propias de un sistema con una fuerte componente manual (por ejemplo, una menor escalabilidad), ejemplos como Mahalo están para demostrar las carencias de los algoritmos automáticos.

El etiquetado es una primera acción que ayuda a una clasificación más precisa. La anotación, el comentario sobre contenidos (como el reciente ejemplo de Google Reader) amplia los horizontes del análisis automático partiendo de acciones personales.

El matiz personal en las búsquedas está siempre presente en el análisis de la interacción de los usuarios que da lugar a la generación automática de perfiles, y la inclusión de recomendaciones. La corrección de resultados en función de la reacción y preferencias abre la puerta a otra modalidad que combina uno de los movimientos más poderosos en la red:

Búsqueda social. Los principios de esta modalidad son la identificación de perfiles afines a partir de la red social (amigos, conocidos, otras personas con intereses similares) y modular los resultados de acuerdo con las acciones previas de los miembros de esa red. Se trata, como se ve, de una forma de complementar los algoritmos con un matiz personal, si bien en este caso el toque humano tiene una procedencia más diluida. Google, aparentemente investigando en esta línea, no ha creado una red social alternativa, pero sí trabaja en herramientas de identificación y análisis de la red de un usuario. Otras herramientas tratan de construir automáticamente (y no explícitamente) esa red, partiendo del análisis del intercambio de correo, por ejemplo. Esas redes sociales implícitas, y generadas por medio de algoritmos, pueden ser la pieza que ayude a complementar a los sistemas automáticos y de gran capacidad aunque aún con pobre calidad.

Búsqueda y referencia. Es difícil encontrar un término que defina esa combinación de Wikipedia y Google que para muchos tiene el potencial de cambiar el mundo de las búsquedas. Wikipedia tiene una enorme cantidad de información, generada por sus propios usuarios, y que pese a polémicas, disputas y controversias, es asumida como una fuente de referencia por muchísimas personas. ¿Y si las búsquedas mostraran no miles de resultados que exigen una labor adicional de investigación y depuración, si no que apuntaran a resultados completos, elaborados y sintetizados como los de la Wikipedia? Para muchos usuarios este escenario define a la herramienta que están esperando.

Wikia Search o Wikiasari sería un movimiento en este sentido, proporcionado un sistema de búsquedas apoyado fundamentalmente en los contenidos de la Wikipedia. El servicio Knol de Google, aún en construcción, sería una respuesta en forma de una Wikipedia con autores reconocidos y contenidos fiables. La principal limitación está en el volumen de información, ya que es imposible competir con expertos a la legión de voluntarios que contribuyen en la Wikipedia. Cuando se haga público podremos valorar lo acertado de este concepto, nada novedoso si consideramos otras “enciclopedias” en la red, como Encarta o la versión electrónica de la Britanica.

Otros frentes en el desarrollo de las búsquedas tienen que ver con el lenguaje natural y la traducción automática de contenidos. En ambos Google está haciendo una fuerte inversión dada su vocación de servicio global. La traducción automática ampliaría notablemente los contenidos disponibles, y un lógico movimiento de futuro ahora que el país con más usuarios conectados es China, y cabe esperar una reducción en el peso relativo de los contenidos en inglés. Sin embargo, la traducción automática tiene un largo y frustrante historial y ha engullido enormes inversiones sin alcanzar resultados satisfactorios. El factor diferencial introducido por Google (el análisis comparativo de una enorme base de textos en varios idiomas) es muy novedosa y siendo realistas algo que sólo está en manos de este empresa.

El lenguaje natural mejora las posibilidades de interacción con el usuario, y cuando se trata de la interpretación vocal amplía los horizontes de las aplicaciones preparando su salto al móvil y entornos donde el uso de pantallas está muy restringido, como en el caso del coche. A día de hoy, los proyectos de lenguaje natural y traducción automática son los que están recibiendo más atención en Google Research.

La presentación de los resultados es otro área de mejora. Si bien es cierto que aparentemente se sigue manteniendo la misma simplicidad a la hora de presentar resultados, en realidad se han ido introduciendo cambios significativos. Para empezar es cada vez más frecuente la integración de resultados de distinta naturaleza como imágenes, vídeos, noticias o artículos de blogs. Se añade información adicional como thumbnails de las páginas referenciadas, o términos complementarios y etiquetas que ayudas a valorar el resultado que se ofrece. Google está experimentando con vistas alternativas que permiten localizar puntos geográficos relacionados con los términos, o delimitar las fechas.

Otros experimentos más rupturistas con los interfaces han sido protagonizados por Microsoft, incorporando avatares que atienden al usuario.

Búsqueda móvil. Las limitaciones de interface de los teléfonos móviles han hecho que se hayan construido páginas adaptadas a estos dispositivos (si bien la tendencia actual es a ofrecer una similar experiencia de navegación en PC y móvil), y se haya usado el texto predictivo y los interfaces vocales para la entrada de información. Sin embargo buena parte de los teléfonos móviles cuenta con un dispositivo adicional de entrada de datos al que se puede sacar mucho partido: la cámara. Más allá del uso códigos de barras, códigos QR, o los Bidi de Movistar, las funcionalidades de reconocimiento de imágenes permiten a obtención de información asociada a la portada de un disco o un libro (e incluso desencadenar la compra). Los servicios experimentales de realidad aumentada van en esa dirección: utilizar la cámara como entrada de datos para localizar información asociada al contenido de la imagen captada.

El mundo de las búsquedas está inmerso desde hace años en un profundo proceso de innovación. Las inversiones que acometen los distintos agentes implicados son enormes, pero también lo es el premio para que el consiga el favor del público: el cetro que ostenta desde hace años y de forma indiscutible Google.

Citando a:

Giant Global Graph, by timbl

1 Malo2 Mejorable3 Normal4 Bueno5 Excelente (No valorado aún)
Loading ... Loading ...

(por Eduado Villoslada)

En su último post, Tim Berners-Lee comenta acerca de la forma de recoger la relación entre las personas y la relación entre personas y sus intereses, como el camino a seguir para evolucionar la web (hacia la Web Semántica)

La idea subyacente lleva ya cierto tiempo sonando, es una apuesta de gran interés: tener una identidad (única) en la web, reconocible por cualquier aplicación. El ejemplo claro, no tener que indicar nuevamente todos los datos personales y establecer los contactos al darse de alta en una nueva comunidad.

Considera que el Graph ocupa el tercer nivel como capa de abstracción. Es decir:
1. Internet: enlaces entre computadoras
2. Web: enlaces entre documentos
3. Gráfico: enlaces relacionados entre las personas y los documentos.

Resulta gracioso el GGG, como superación del WWW :-)

Las tecnologías clave serían FOAF (y RDF) y OpenID

Hay cierta relación con la idea de Open Social de Google, pero parece una visión más abierta

La Web estructurada

1 Malo2 Mejorable3 Normal4 Bueno5 Excelente (Votos: 1. Media: 5,00/5)
Loading ... Loading ...

Otra visión de la Web futura (y van …): desde luego no será “3.0″ y se construirá en torno a la personalización, la semántica, y la atención (Attention, que se refiere más bien al comportamiento implícito que ese recurso del que andamos tan escasos).
Todo ello se sustentaría gracias a información estructurada, lo que nos daría una web estructurada, descrita en un reciente artículo en Read/Write Web (“The Structured Web – A Primer“) de Alex Iskold. Un artículo que ha recibido mucho ecos y comentarios favorables.
Esa Web estructurada, en la información estaría formateada de forma que sería fácilmente legible y procesable automáticamente. En el fondo está hablando del abandono del venerable HTML por formas más cercanas a XML:

Web Desestructurada y Estructurada

Cuatro serían los elementos clave que ayudarían en el cambio hacia la web estructurada:

  • Las APIs construidas para explotar externamente otros servicios. Es uno de los elementos básicos en la actual Web 2.0.
  • Aplicaciones semánticas “Top-Down” que extraen el significado del contenido convencional para generar información estructurada.
  • Microformatos y las aplicaciones semánticas “clásicas”. Los microformatos añaden estructuración a la información actual y son, desde el punto de vista del autor, un paso intermedio hacia la web estructurada procesable por aplicaciones capaces de tratar con la semántica de la información.
  • RSS como mecanismo de distribución, aunque sería un RSS extendido, enriqueciendo la estructura de los mecanismos utilizados actualmente. De esa forma, RSS podría ser la fuente para distribuir la información estructurada.

Todos estos elementos darían lugar a una Web estructurada como paso previo a la Web semántica:

Transición hacia la Web Estructurada

En opinión del autor no tiene especial importancia que el resultado final se aleje de los estándares. Una Web semántica y estructurada facilitaría el tratamiento y conversión entre formatos, algo inviable en el modelo actual. Este tratamiento automático es el que abriría las puertas a aplicaciones impensables actualmente en forma de búsquedas más efectivas, y combinaciones de servicios –mashups- muy por encima de lo que conocemos.
Eso sí, la falta de “killer applications” puede alejar esta web futura -olvidemos el término “3.0″- de los medios y el conocimiento del público.

Citando a:

¿Ya tenemos aplicaciones Web 3.0?

1 Malo2 Mejorable3 Normal4 Bueno5 Excelente (Votos: 1. Media: 4,00/5)
Loading ... Loading ...

Tan pronto como un término empieza a popularizarse, arranca la carrera por dejarlo obsoleto y encontrar un sustituto. Ahora que hasta nuestros políticos hablan de la Web 2.0 es el momento de buscar otro término que sea más de actualidad y para iniciados. La verdad es que hace un tiempo que se habla de una Web 3.0 sin aclarar muy bien su contenido. O´Reilly ("La web 2.0 es sobre …"), que ha contribuido decisivamente a popularizar el concepto de Web 2.0, cree que el nuevo salto no tiene porqué pasar por un aumento de numeral.

Después de varios vaivenes, parece que hay cierto acuerdo en que la incorporación de tecnología semántica en los servicios actuales sería el siguiente salto que de momento se ha denominado, con evidente falta de imaginación, “Web 3.0”. Siguiendo ese razonamiento, una posterior evolución con la incorporación de la Inteligencia Artificial sería la Web 4.0.

Ahora bien, ¿estamos lejos o cerca de esa web semántica que preconiza Tim Berners-Lee? Este año hemos visto varios candidatos a merecer esta etiqueta, esencialmente buscadores que usan el complemento de lenguaje natural, o aplicaciones verticales, como la búsqueda de personas.

El Web 2.0 Fall ha sido, como era de esperar, un evento muy importante, que ha reunido a la industria (al menos a la de aquel lado del Atlántico) y que ha dado mucho de sí, y sobre la que haremos una reseña pronto. Uno de los servicios presentados ha sido Twine, que rápidamente ha sido asignada a esa nueva e inminente Web 3.0.

Twine

Desarrollado por Radar Networks, Twine se ha definido como la “sabiduría de las masas unida a la de las máquinas”. El porqué de esta definición está en el modo de funcionamiento y en los fundamentos de Twine: por un lado se trata de un servicio social que permite subir piezas de información (textos, posts, ficheros, …), que Twine analiza para –y ahí está la novedad- generar automáticamente una serie de tags que definen el contenido. Estos tags pueden estar presentes en el texto analizado, o inferirse derivando información asociada a ellos (por ejemplo generar “Movistar” como tag en un texto en el que aparezca “Telefónica” y “móviles”, si hay conocimiento previo suficiente).

Los tags tienen una serie de relaciones que constituyen el llamado “gráfico semántico”. Este es otro de los elementos con los que Twine enriquece el contenido suministrado, lo que es, finalmente, su cometido. Aunque podría ser un buscador generalista encargado de indexar semánticamente toda la Web, han arrancado con el objetivo más modesto de hacerse cargo de aquellas partes que la gente considera valiosas.

Con una estructura semejante a la de una Wiki, Twine trata de establecer una “red de conocimiento” que ponga en contacto a personas de acuerdo con el conocimiento extraído de sus contribuciones. La infraestructura utilizada por Twine contiene todos los elementos propios de la Web semántica: RDF, OWL, SPARQL, o XSL.

Por cierto, y por cerrar la discusión sobre la Web 3.0, el creador de Twine (Nova Spivack, muy conocido en el mundo de la Web semántica y la IA, colaborador de Ray Kurzweil) defienden que el término “Web 2.0” representa una era y no una tecnología, de la misma forma que “punto com” define mejor el entorno económico y social que el técnico. Lamentablemente nunca ha estado en manos de los técnicos el fijar la nomenclatura de las cosas.

Citando a:

CLR III: vaciando la lista de referencias

1 Malo2 Mejorable3 Normal4 Bueno5 Excelente (No valorado aún)
Loading ... Loading ...

Periódico saneamiento de memoria. Una lista de artículos interesantes que corren el peligro de caer en el olvido:

Olvido