Filtrado colaborativo
Un filtrado colaborativo es el proceso de predecir los intereses de un usuario mediante la identificación de preferencias e información de muchos usuarios. Esto se hace filtrando datos en busca de información o patrones utilizando técnicas que involucran la colaboración entre múltiples agentes, fuentes de datos, etc. La intuición detrás del filtrado colaborativo es que, si los usuarios «A» y «B» tienen gustos similares en un producto, entonces es probable que «A» y «B» tienen un gusto similar en otros productos también.
La principal ventaja de usar modelos de filtrado colaborativo es su simplicidad de implementación y el alto nivel de cobertura que brindan. También es beneficioso porque captura características sutiles y no requiere la comprensión del contenido del ítem.
La principal desventaja de este modelo es que no es amigable para recomendar nuevos artículos, esto se debe a que no ha habido interacción usuario/artículo con él. Esto se conoce como el problema de arranque en frío (anteriormente explicado).
Algunos ejemplos de algoritmos de filtrado colaborativo:
- Recomendación de contenido de «YouTube» a los usuarios: recomendarle videos en función de otros usuarios que se han suscrito o visto videos similares a los suyos.
- Recomendación de curso de «Coursera»: recomendarle cursos en función de otras personas que han terminado los cursos existentes que usted ha terminado.
¿Cómo funciona?
Una vez que se ha explicado en el aula el concepto y contexto de un filtro colaborativo en un sistema de recomendación, el siguiente paso es entender de manera práctica como se puede observar esa similitud enfocada en el usuario.
Se realiza un ejercicio como se muestra en la Imagen 6, donde se permite una intuición de cuál puede ser la similitud de gustos por películas de cada usuario.
Observaciones:
- Columna Izquierda: Se observar una similitud basada en la elección del producto por parte del usuario 1 y el usuario 2.
- Columna derecha: Se observa la similitud de los usuarios 1 y 2 como consecuencia de elecciones muy similares en sus productos.
Caso real
Se crea una tabla como la que se muestra en la Imagen 7, en las filas tenemos los usuarios y en las columnas las películas que ha visto o no. Las películas están marcadas por una puntuación de 0 a 10, que marca la «similitud o cercanía».
Esas puntuaciones se pueden explicar que provienen de la unión de varias interacciones, por ejemplo, la veces que ha visto esa película, si le ha dado a «me gusta» dentro de la plataforma, si al recomendaría, etc. Para el caso de esta actividad simplemente daremos un valor por concretar las operaciones matemáticas.
Objetivo de la actividad.
Conocer el valor de similitud de nuestro usuario 4 en esas dos películas rodeadas con un circulo en rojo y signo de interrogación.
Son valores que no se conocen debido a que no ha existido ninguna interacción entre ese usuario y esa película, por lo tanto, el objetivo es conocer ese valor para recomendar esa película en mayor o menor grado.
Debemos recordar que la importancia de un sistema de recomendación no está solo en saber que recomendar, si no en que grado hacerlo.