摘要
1 引言
2 相關工作
2.1 推薦系統中的公平性與偏見
2.2 量化自然語言處理表示中的性別關聯
3 問題陳述
4 方法論
4.1 範圍
4.3 標記
5 案例研究
5.1 範圍
5.2 實施
5.3 標記
6 結果
6.1 潛在空間視覺化
6.2 偏見方向
6.3 偏見放大指標
6.4 分類情境
7 討論
8 限制與未來工作
9 結論與參考文獻
\
解耦潛在因子推薦研究變得越來越受歡迎,因為LFR演算法已被證明會在其訓練後的用戶和項目嵌入中糾纏模型屬性,導致不穩定且不準確的推薦輸出[44, 58, 62, 65]。然而,大多數這類研究都專注於結果,提供改進性能的緩解方法,但沒有解決潛在空間中表示偏見的潛在問題。因此,很少有現有的評估技術分析屬性如何在推薦潛在空間中被明確(由於作為模型屬性的明確使用)或隱含地捕獲。對於那些確實存在的評估技術,指標專注於評估明確使用和獨立模型屬性的解耦水平,而不是調查實體向量與敏感屬性之間可能的隱含偏見關聯或潛在空間中捕獲的系統性偏見[44]。儘管潛在表示偏見在其他類型的表示學習中已成為一個被廣泛研究的現象,如自然語言和圖像處理,但與大量關於曝光和流行度偏見的研究相比,它仍然相對未被充分研究[23]。
\ 本文提出的工作旨在通過提供評估屬性關聯偏見的框架來彌補當前關於評估LFR演算法中表示偏見的研究差距。識別編碼到用戶和項目(實體)嵌入中的潛在屬性關聯偏見在它們成為混合多階段推薦系統中的下游特徵時至關重要,這在行業環境中經常遇到[6, 14]。評估這些系統的組合公平性,或一個組件的偏見放大到下游組件的潛力,如果不了解這種偏見最初如何在系統組件中發生,是具有挑戰性的[59]。在實踐中進行審計和調查系統之前,了解偏見的當前狀態是必要的[9]。我們提出的方法旨在降低從業者和研究人員理解屬性關聯偏見如何滲透到他們的推薦系統中的障礙。這些評估技術將使從業者能夠更準確地確定在緩解中需要解耦的屬性範圍,並為判斷緩解成功提供基準。
\ 我們將這些方法應用於一個行業案例研究,以評估播客推薦LFR模型中的用戶性別屬性關聯偏見。先前的研究主要集中於評估提供者性別偏見,因為缺乏關於用戶性別偏見的公開可用數據;據我們所知,我們的工作提供了對播客推薦中用戶性別偏見進行量化的首批研究之一。我們希望我們的觀察能幫助其他行業從業者評估他們系統中的用戶性別和其他敏感屬性關聯偏見,提供超越早期定性用戶研究的播客收聽量化見解,並鼓勵未來對行業系統中敏感話題的討論和更大的透明度。
\
:::info 作者:
:::
:::info 本論文可在Arxiv上獲取,採用CC by 4.0 Deed(Attribution 4.0 International)許可證。
:::
\


