Google y el lenguaje natural
Publicado el Agosto 21, 2007 por Alonso Alvarez
Archivado bajo Futuro de Internet, Ideas de negocio, Tendencias
Hay varias señales que apuntan a que Google está preparando servicios relacionados con el lenguaje natural, un área que a pesar del mucho tiempo y esfuerzo invertido, aún no ha sido capaz de alcanzar un nivel suficientemente satisfactorio para los usuarios finales.
No hace tanto que han presentado su propio producto (en beta, claro) basado en “traducción automática estadística“, pero otras acciones parecen en camino. Ese concepto de traducción estadística saca partido de dos de los mayores activos de Google: una enorme capacidad de proceso agregada de sus colosales data centers, y un volumen de datos igualmente descomunal. Las palabras de Peter Norvig, Director de Investigación de Google, lo expresan perfectamente: “no hacemos mejores algoritmos. Sólo tenemos más datos”.
La traducción estadística de Google se basa pues en la búsqueda de cadenas de texto equivalentes en los idiomas origen y destino a partir de traducciones consideradas fiables (para lo que se están basando en documentos oficiales de la ONU y la Unión Europea). Los resultados empiezan a ser reconocidos, por ejemplo por el prestigioso medio Nature que les asigna un valor cercano al del traductor humano (habiendo probado el servicio, sorprende esta valoración).
No obstante, el resultado de estas inversiones no parece estar dirigido hacia la traducción, sino más bien hacia mejorar su core, las búsquedas, de forma que sea posible atender usando lenguaje natural, al estilo del servicio Chacha, ya mencionado en otro post de este blog, pero sin necesidad de tener personas para atender las peticiones de los usuarios.
Este esfuerzo en favor de la traducción se manifiesta en ofertas de trabajo específicas, anuncios de más idiomas añadidos a sus sistemas de traducción y acciones adicionales menos directas pero igualmente relacionadas. Por ejemplo, Google está financiando actividades relacionadas con el reconocimiento de escritura en Alemania por parte de grupos dedicados a Inteligencia Artificial.
Otra señal de estos movimientos de Google podría ser la puesta en marcha del servicio de búsqueda vocal automática. Para Tim O’Reilly (entre otras cosas, responsable de la acuñación del término “Web 2.0” y del muy discutido “Código del blogger“) hay una clara relación entre este servicio y la adquisición de Tellme por parte de Microsoft, como movimientos hacia la creación de servicios automatizados capaces de usar lenguaje natural. Para O’Reilly, el 411 de Google es por encima de todo un medio para recopilar datos, en este caso frases y acentos, para enriquecer uno de sus mayores activos, los datos, y poder utilizarlos para respaldar sus servicios.
Vía: Dirson, El Navegante, Cnet, y O’Reilly Radar
Entradas relacionadas:
Tags: Google, Inteligencia Artificial, lenguaje natural, traduccion automatica, Web 2.0
Comentarios
Deja una respuesta


