La Sabiduría de las Minorías
En el libro “La Sabiduria de las Masas” (Wisdom of the Crowds), James Surowiecki explica como, en muchos casos, la opinión de grupos es más acertada que la de individuos, por muy expertos que estos últimos sean. Esta idea de Surowiecki se encuentra detrás de multitud de sistemas y servicios de la “nueva web”. Un claro ejemplo son los sistemas de recomendación que, en su gran mayoría, están basados en técnicas del llamado Filtrado Colaborativo. Este tipo de técnicas se basan en la premisa de que para hacer una recomendación a un usuario en cuestión, basta con encontrar usuarios similares y recomendar elementos que dichos vecinos encontraron satisfactorios.
La idea de que podemos extraer conocimiento valioso a partir de usuarios “normales” tiene un gran atractivo. En ciertos ámbitos parece intuirse un mensaje de que dada una gran cantidad de datos de usuario, no importa la calidad de los mismos. No obstante, el propio Surowiecki advierte en su libro de que, para que se dé esta “sabiduría”, el grupo en cuestión debe observar unas ciertas propiedades: debe ser diverso, los individuos que lo forman deben tener opiniones independientes y especializadas, y debe existir un mecanismo de agregación. En otras palabras, si no se cumplen ciertas condiciones es posible que tengamos muchos datos pero el ruido inherente a ellos distorsione o incluso oculte la señal de información. Con esta idea en mente, nuestro grupo de investigación realizó un estudio para medir el ruido que los usuarios introducen al dar su opinión respecto a elementos de consumo como películas. En nuestro estudio detectamos que si preguntábamos varias veces sobre la misma película al mismo usuario podíamos medir diferencias notables. Por ejemplo, para películas con valoraciones medias (2 o 3 estrellas sobre 5) se producían errores alrededor del 50% de las veces (Ver detalles en la siguiente gráfica).
Resulta evidente que en ciertas situaciones nos puede interesar limitar el volumen de datos de usuario a utilizar, a cambio de poder garantizar su calidad y eficiencia para alguna aplicación. Por esta razón nos propusimos replantear el paradigma del filtrado colaborativo, reemplazando los usuarios por expertos del dominio. De esta manera, en vez de encontrar usuarios parecidos (vecinos) al usuario en cuestión, nuestro objetivo es ahora encontrar expertos parecidos. A partir de esta sencilla idea, nació nuestra propuesta de filtrado colaborativo basado en expertos, método también conocido como “La Sabiduría de las Minorías” (The Wisdom of the Few). Es importante recalcar que en nuestro caso la definición de experto es la de “aquel que podemos confiar en que produce evaluaciones coherentes y consistentes en un dominio concreto”.
El método de filtrado colaborativo basado en expertos se basa en los siguientes pasos:
- Identificar un conjunto de “expertos” con evaluaciones disponibles para el dominio en cuestión
- Para cada usuario calcular el subconjunto de expertos similares
- A partir de ese conjunto de expertos similares, generar las recomendaciones de forma similar al filtrado colaborativo tradicional.
Realizamos un estudio de usuario con más de cien voluntarios a los cuales presentamos recomendaciones basadas en varios métodos, incluido el filtrado colaborativo tradicional y el basado en expertos. Los resultados se presentan en la siguiente figura:
El filtrado colaborativo basado en expertos (Experts CF en la gráfica) fue el único método con una valoración mayor de 3. Y aunque cabe destacar que el estudio se realizó con pocos datos de los usuarios (y eso contribuye al mal resultado el filtrado colaborativo tradicional), esto no hace más que corroborar la potencia del método para generar recomendaciones personalizadas a partir de un volumen de datos muy reducido. Además, es importante resaltar que el método tiene varias ventajas añadidas con respecto al filtrado colaborativo. Por ejemplo, nuestro método permite garantizar una privacidad del 100% ya que no es necesario transmitir la información de los usuarios a un servidor central. También resulta más escalable ya que no es necesario realizar cálculos con grandes matrices que contienen los datos de todos los usuarios del sistema.
A partir de estos estudios iniciales, hemos realizado varios prototipos en diversos dominios. Primero, realizamos una aplicación de recomendación de música distribuida. Para ello utilizamos valoraciones de críticos de Metacritic. La aplicación implementa una arquitectura totalmente distribuida basada en REST y Linked Open Data. El siguiente diagrama resume los principales componentes de la aplicación.

Arquitectura de la aplicación de recomendación musical utilizando filtrado colaborativo basado en expertos
Posteriormente, utilizamos el mismo método basado en expertos para implementar un sistema de recomendación de películas para iPhone. El sistema no sólo genera recomendaciones personalizadas sino que también es capaz de tener en cuenta el contexto del usuario para recomendar películas que están en cartelera en cines cercanos a la posición actual. Esta implementación resulta un caso de uso muy ejemplificador de algunas de las ventajas de nuestro método. El cálculo de la recomendación se realiza en la CPU del dispositivo móvil, lo cual resultaría impensable en otros métodos. Además, las valoraciones del usuario en ningún momento salen del móvil, garantizando una privacidad total. A continuación os incluimos algunas capturas de la pantalla de la aplicación.
Esta investigación del grupo científico, con Xavier Amatriain a la cabeza, ha dado lugar a varias publicaciones científicas y una patente. Para más información, podéis consultar el blog del autor.







(Votos: 8. Media: 4,38/5) 











