曾寰,李金忠
2025, 46(6): 1358-1364.
在评估排序学习方法的性能优劣时,常用的信息检索评估指标,如NDCG、ERR和AP,都是基于文档列表位置信息的指标.由于这些指标中的位置信息是离散值,难以直接用于生成对抗网络的训练中,使得基于生成对抗网络的排序学习算法的损失函数未能考虑排序列表中文档的位置信息.针对此问题,本文提出一种基于条件生成对抗网络直接优化近似平均精度AP指标的listwise排序学习算法(APGAN-LTR)以进行精细化训练模型.该方法采用Gumbel-softmax重参数化技巧采样,使用梯度可导的Plackett-Luce模型模拟用户对检索出文档的偏好采样过程,对平均精度AP指标进行近似,并将包含近似位置信息的AP指标融入条件生成对抗网络的损失函数中以被直接优化性能指标,用于挖掘排序列表的位置信息,以期更进一步提升性能.在公共排序学习基准数据集上的实验结果表明:对比基于生成对抗网络的排序学习方法IRGAN-List,本文提出的排序学习方法APGAN-LTR在信息检索指标NDCG,P,AP,NERR上都有明显提升.