且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

《中国人工智能学会通讯》——9.28 基于点击顺序的点击模型

更新时间:2022-08-13 11:30:01

9.28 基于点击顺序的点击模型

已有的眼动追踪实验研究工作表明[21] ,搜索引擎用户的浏览习惯可以分为深度优先策略和宽度优先策略两种类型。其中,深度优先策略描述用户的检验顺序是顺着搜索结果列表的结果序列,自上而下浏览搜索结果,并在浏览每个搜索结果的同时决定是否点击;宽度优先策略则是另一种类型,它描述用户在点击搜索结果之前会预先检验一系列的搜索结果,然后再在其中选择自己最中意的若干结果点击。由于根据深度优先假设,用户点击时受到很重要的位置偏执影响能够很容易被模型所考虑进去,因此大多数点击模型[13-15] 都遵从深度优先假设,也就是用户自上而下浏览一遍搜索结果列表。

然而,眼动视线追踪实验研究[22]表明,仅有34% 的搜索用户的浏览序列是顺序(自上而下)的,而有 50% 以上的查询会话中用户会发生回访行为(自下而上的浏览搜索结果)或者略过的行为。因此研究人员有必要对用户的非顺序浏览(点击和检验)行为进行研究。

TCM 模型
Xu et al [23] 最 先 提 出 了 名 为 Temporal ClickModel (TCM) 的模型在广告搜索中描述用户的点击行为。这个模型尝试将所有可能的检验序列全部计算出现概率,因此只能描述仅包含两个结果(广告)的页面,所描述的非顺序点击行为为:用户首先点击了第二个搜索结果,然后再点击了第一个搜索结果。因此这个工作很难像其他点击模型一样扩展到描述整个搜索结果列表。

POM 模型
Wang et al [24] 提出了名为 Partially ObservableMarkov Model (POM) 的点击模型来描述用户的任意浏览行为。POM 模型将用户的检验事件当作一个部分可观测的随机过程进行描述。其流程示意图如图8 所示,对于一个可以观测的点击行为序列,该模型会试图寻找所有可能的检验序列,并分别计算各种检验序列的可能性。《中国人工智能学会通讯》——9.28 基于点击顺序的点击模型
尽管这个模型能够描述用户的非顺序检验行为,但模型仅考虑了用户在不同位置之间的检验跳转概率(也就是说不同用户、不同查询、不同搜索结果下用户的检验跳转行为是一致的),因此该模型并不能针对具体的查询和结果给出点击概率预测和结果相关性预测,并且难以在实际环境中应用,并和已有的点击模型进行比较。

PSCM 模型
Wang et al [25] 利用眼动视线追踪设备对用户的非顺序浏览行为进行了深入分析,在总结了用户浏览行为一般规律后提出了两个用户非顺序浏览行为假设。

(1)局部检验线性假设:在两次点击之间,用户倾向于沿着点击方向检验结果而不再改变检验方向,无论用户的点击方向是向上还是向下。

(2)非一阶检验假设:尽管用户在两次点击之间的检验行为是局部线性有序的,但是用户并不是一个挨着一个检验搜索结果,而是会略过一些搜索结果。

相应的模型示意图如图 9 所示,点击行为首先根据时间信息记录为时间序列,接下来对于每个点击对,根据局部检验线性假设,用户在点击对之间是线性的浏览行为,因此可以用一个基于位置点击模型的子模块来描述这个点击对之间的用户浏览行为。而由于用户可能会略过一些结果,因此点击对之间的所有搜索结果并不是都被用户检验,而是需要模型推断用户检验了哪些搜索结果。《中国人工智能学会通讯》——9.28 基于点击顺序的点击模型