Este artigo apresenta uma estrutura para avaliar o viés de representação em modelos de recomendação de fatores latentes (LFR), focando em como as incorporações de usuários e itens podem codificar associações implícitas com atributos sensíveis como género. Diferentemente de pesquisas anteriores que se concentram em métricas de desempenho ou viés de exposição, este trabalho examina o viés de associação de atributos e demonstra sua medição através de um estudo de caso da indústria em recomendações de podcasts. O objetivo é ajudar profissionais a auditar, interpretar e mitigar a propagação de viés em pipelines de recomendação de múltiplos estágios, promovendo maior justiça e transparência em sistemas de IA.Este artigo apresenta uma estrutura para avaliar o viés de representação em modelos de recomendação de fatores latentes (LFR), focando em como as incorporações de usuários e itens podem codificar associações implícitas com atributos sensíveis como género. Diferentemente de pesquisas anteriores que se concentram em métricas de desempenho ou viés de exposição, este trabalho examina o viés de associação de atributos e demonstra sua medição através de um estudo de caso da indústria em recomendações de podcasts. O objetivo é ajudar profissionais a auditar, interpretar e mitigar a propagação de viés em pipelines de recomendação de múltiplos estágios, promovendo maior justiça e transparência em sistemas de IA.

Deteção de Viés Oculto em Sistemas de Recomendação de IA

2025/11/11 02:54
Leu 4 min
Para enviar feedbacks ou expressar preocupações a respeito deste conteúdo, contate-nos em crypto.news@mexc.com

Resumo

1 Introdução

2 Trabalho Relacionado

2.1 Justiça e Viés em Recomendações

2.2 Quantificação de Associações de Género em Representações de Processamento de Linguagem Natural

3 Declaração do Problema

4 Metodologia

4.1 Âmbito

4.3 Sinalização

5 Estudo de Caso

5.1 Âmbito

5.2 Implementação

5.3 Sinalização

6 Resultados

6.1 Visualizações do Espaço Latente

6.2 Direções de Viés

6.3 Métricas de Amplificação de Viés

6.4 Cenários de Classificação

7 Discussão

8 Limitações e Trabalho Futuro

9 Conclusão e Referências

\

3 Declaração do Problema

A pesquisa sobre recomendação de fatores latentes desemaranhados tornou-se cada vez mais popular, pois os algoritmos LFR demonstraram entrelaçar atributos do modelo nas suas incorporações treinadas de utilizadores e itens, levando a resultados de recomendação instáveis e imprecisos [44, 58, 62, 65]. No entanto, a maioria desta pesquisa é focada em resultados, fornecendo métodos de mitigação para melhorar o desempenho, mas não abordando o potencial de viés de representação no espaço latente. Como resultado, poucas técnicas de avaliação existentes analisam como os atributos são explicitamente (devido ao uso distinto como atributo do modelo) ou implicitamente capturados no espaço latente de recomendação. Para aquelas que existem, as métricas concentram-se em avaliar níveis de desemaranhamento para atributos de modelo explicitamente utilizados e independentes, em vez de investigar possíveis associações de viés implícitas entre vetores de entidade e atributos sensíveis ou viés sistemático capturado dentro do espaço latente [44]. Embora o viés de representação latente se tenha tornado um fenómeno bem estudado noutros tipos de aprendizagem de representação, como processamento de linguagem natural e imagem, permanece relativamente pouco examinado em comparação com as grandes quantidades de pesquisa sobre viés de exposição e popularidade [23].

\ O trabalho apresentado neste artigo procura fechar a lacuna de pesquisa atual relativa à avaliação do viés de representação em algoritmos LFR, fornecendo uma estrutura para avaliar o viés de associação de atributos. Identificar potencial viés de associação de atributos codificado em incorporações de utilizadores e itens (entidades) é essencial quando se tornam características a jusante em sistemas de recomendação híbridos de múltiplos estágios, frequentemente encontrados em ambientes industriais [6, 14]. Avaliar a justiça composicional destes sistemas, ou o potencial de viés de um componente amplificar para componentes a jusante, é desafiador se não se compreender como este tipo de viés ocorre inicialmente dentro do componente do sistema [59]. Compreender o estado atual do viés é imperativo ao auditar e investigar o sistema antes da mitigação na prática [9]. Os nossos métodos propostos procuram reduzir a barreira para profissionais e investigadores que desejam entender como o viés de associação de atributos pode infiltrar-se nos seus sistemas de recomendação. Estas técnicas de avaliação permitirão aos profissionais definir com mais precisão quais atributos desemaranhar na mitigação e fornecer linhas de base para considerar a mitigação bem-sucedida.

\ Aplicamos estes métodos a um estudo de caso da indústria para avaliar o viés de associação de atributos de género do utilizador num modelo LFR para recomendações de podcasts. A pesquisa anterior concentrou-se principalmente na avaliação do viés de género do fornecedor devido à falta de dados publicamente disponíveis sobre o viés de género do utilizador; até onde sabemos, o nosso trabalho fornece uma das primeiras análises para quantificar o viés de género do utilizador em recomendações de podcasts. Esperamos que as nossas observações ajudem outros profissionais da indústria a avaliar o género do utilizador e outros vieses de associação de atributos sensíveis nos seus sistemas, forneçam insights quantitativos sobre a audição de podcasts além dos estudos qualitativos de utilizadores anteriores, e incentivem discussão futura e maior transparência de tópicos sensíveis dentro dos sistemas da indústria.

\

:::info Autores:

  1. Lex Beattie
  2. Isabel Corpus
  3. Lucy H. Lin
  4. Praveen Ravichandran

:::

:::info Este artigo está disponível no arxiv sob licença CC by 4.0 Deed (Atribuição 4.0 Internacional).

:::

\

Oportunidade de mercado
Logo de Sleepless AI
Cotação Sleepless AI (SLEEPLESSAI)
$0.02264
$0.02264$0.02264
+0.35%
USD
Gráfico de preço em tempo real de Sleepless AI (SLEEPLESSAI)
Isenção de responsabilidade: Os artigos republicados neste site são provenientes de plataformas públicas e são fornecidos apenas para fins informativos. Eles não refletem necessariamente a opinião da MEXC. Todos os direitos permanecem com os autores originais. Se você acredita que algum conteúdo infringe direitos de terceiros, entre em contato pelo e-mail crypto.news@mexc.com para solicitar a remoção. A MEXC não oferece garantias quanto à precisão, integridade ou atualidade das informações e não se responsabiliza por quaisquer ações tomadas com base no conteúdo fornecido. O conteúdo não constitui aconselhamento financeiro, jurídico ou profissional, nem deve ser considerado uma recomendação ou endosso por parte da MEXC.

USD1 Genesis: 0 Fees + 12% APR

USD1 Genesis: 0 Fees + 12% APRUSD1 Genesis: 0 Fees + 12% APR

New users: stake for up to 600% APR. Limited time!