Resumen
1 Introducción
2 Trabajo relacionado
2.1 Justicia y sesgo en las recomendaciones
2.2 Cuantificación de asociaciones de género en representaciones de procesamiento de lenguaje natural
3 Planteamiento del problema
4 Metodología
4.1 Alcance
4.3 Bandera
5 Caso de estudio
5.1 Alcance
5.2 Implementación
5.3 Bandera
6 Resultados
6.1 Visualizaciones del espacio latente
6.2 Direcciones de sesgo
6.3 Métricas de amplificación de sesgo
6.4 Escenarios de clasificación
7 Discusión
8 Limitaciones y trabajo futuro
9 Conclusión y referencias
\
La investigación sobre recomendaciones de factores latentes desvinculados se ha vuelto cada vez más popular, ya que se ha demostrado que los algoritmos LFR entrelazan atributos del modelo en sus embeddings de usuarios e ítems entrenados, lo que conduce a resultados de recomendación inestables e inexactos [44, 58, 62, 65]. Sin embargo, la mayoría de esta investigación está centrada en los resultados, proporcionando métodos de mitigación para mejorar el rendimiento, pero sin abordar el potencial de sesgo de representación en el espacio latente. Como resultado, pocas técnicas de evaluación existentes analizan cómo los atributos son capturados explícitamente (debido al uso distinto como atributo del modelo) o implícitamente en el espacio latente de recomendación. Para las que existen, las métricas se centran en evaluar los niveles de desvinculación para atributos del modelo explícitamente utilizados e independientes, en lugar de investigar posibles asociaciones de sesgo implícitas entre vectores de entidad y atributos sensibles o sesgo sistemático capturado dentro del espacio latente [44]. Aunque el sesgo de representación latente se ha convertido en un fenómeno bien estudiado en otros tipos de aprendizaje de representación, como el procesamiento de lenguaje natural e imágenes, sigue siendo relativamente poco examinado en comparación con la gran cantidad de investigación sobre el sesgo de exposición y popularidad [23].
\ El trabajo presentado en este artículo busca cerrar la brecha de investigación actual sobre la evaluación del sesgo de representación en algoritmos LFR proporcionando un marco para evaluar el sesgo de asociación de atributos. Identificar el potencial sesgo de asociación de atributos codificado en los embeddings de usuarios e ítems (entidades) es esencial cuando se convierten en características descendentes en sistemas de recomendación híbridos de múltiples etapas, frecuentemente encontrados en entornos industriales [6, 14]. Evaluar la justicia composicional de estos sistemas, o el potencial de que el sesgo de un componente se amplifique en componentes descendentes, es un desafío si no se comprende cómo este tipo de sesgo ocurre inicialmente dentro del componente del sistema [59]. Comprender el estado actual del sesgo es imperativo al auditar e investigar el sistema antes de la mitigación en la práctica [9]. Nuestros métodos propuestos buscan reducir la barrera para profesionales e investigadores que desean entender cómo el sesgo de asociación de atributos puede infiltrarse en sus sistemas de recomendación. Estas técnicas de evaluación permitirán a los profesionales determinar con mayor precisión qué atributos desvincular en la mitigación y proporcionar líneas base para considerar exitosa la mitigación.
\ Aplicamos estos métodos a un caso de estudio de la industria para evaluar el sesgo de asociación de atributos de género de usuario en un modelo LFR para recomendaciones de podcasts. La investigación previa se ha centrado principalmente en evaluar el sesgo de género del proveedor debido a la falta de datos públicamente disponibles sobre el sesgo de género del usuario; según nuestro conocimiento, nuestro trabajo proporciona una de las primeras miradas a la cuantificación del sesgo de género del usuario en recomendaciones de podcasts. Esperamos que nuestras observaciones ayuden a otros profesionales de la industria a evaluar el género del usuario y otros sesgos de asociación de atributos sensibles en sus sistemas, proporcionen información cuantitativa sobre la escucha de podcasts más allá de los estudios cualitativos de usuarios anteriores, y fomenten la discusión futura y una mayor transparencia de temas sensibles dentro de los sistemas industriales.
\
:::info Autores:
:::
:::info Este artículo está disponible en arxiv bajo la licencia CC by 4.0 Deed (Atribución 4.0 Internacional).
:::
\

