深度学习-点击率预估-研究论文2024-09-14速读

1. Deep Target Session Interest Network for Click-Through Rate Prediction

H Zhong, J Ma, X Duan, S Gu, J Yao - 2024 International Joint Conference on Neural Networks, 2024

深度目标会话兴趣网络用于点击率预测

摘要：
这篇文章提出了一种新的深度学习模型，名为Deep Target Session Interest Network（DT-SIN），用于提高点击率（CTR）预测的准确性。该模型特别关注用户会话中的行为序列，通过捕捉用户在会话期间的动态兴趣变化来预测点击行为。DT-SIN模型利用了注意力机制来加权用户会话中的不同项目，并结合了用户的历史行为和上下文信息来提高预测的准确性。

创新点：

提出了一种新的用户会话表示方法，能够捕捉用户在会话期间的兴趣演变。
引入了注意力机制来加权用户会话中的项目，使得模型能够关注更相关的用户行为。
结合了用户的历史行为和上下文信息，以提供更全面的用户画像，从而提高CTR预测的准确性。

算法模型：
DT-SIN模型包括以下几个关键组件：

会话兴趣提取器：用于从用户会话中提取兴趣表示。
注意力机制：用于加权会话中的不同项目，以突出用户最感兴趣的部分。
用户画像构建器：结合用户的历史行为和上下文信息来构建用户画像。
预测器：基于用户画像和会话兴趣来预测点击行为。

实验效果：
文章中进行了一系列的实验来评估DT-SIN模型的性能。实验结果表明，与现有的CTR预测模型相比，DT-SIN在多个数据集上都取得了更好的性能。具体来说，DT-SIN在AUC（Area Under the Curve）和Logloss等评价指标上均优于其他模型。实验数据和结论证明了DT-SIN在处理复杂的用户行为序列和提高CTR预测准确性方面的有效性。

推荐阅读指数：
★★★★☆

这篇文章对于那些对推荐系统、用户行为分析和深度学习在CTR预测应用感兴趣的研究人员和实践者来说是非常有价值。它提供了一种新的视角来理解和预测用户的点击行为，并且通过实验验证了其有效性。因此，我给予这篇文章较高的推荐指数。

2. DeepFM: A Factorization-Machine based Neural Network for CTR Prediction

Huifeng Guo, Ruiming Tang, Yunming Ye, Zhenguo Li, Xiuqiang He, 2017

DeepFM：一种基于分解机的神经网络用于点击率预测
在这里插入图片描述

摘要：
文章提出了DeepFM模型，这是一个结合了分解机（Factorization Machines, FM）和深度神经网络（Deep Neural Networks, DNN）的端到端学习模型，用于提高推荐系统中的点击率（CTR）预测准确性。DeepFM模型能够同时捕捉低阶和高阶特征之间的复杂交互，并且不需要除了原始特征之外的任何特征工程。通过在基准数据集和商业数据上的全面实验，证明了DeepFM在CTR预测方面的有效性和效率，与现有模型相比有显著提升。

创新点：

提出了DeepFM模型，它整合了FM和DNN，能够同时学习低阶和高阶特征交互。
与Google的Wide & Deep模型相比，DeepFM的“宽”和“深”部分共享相同的输入，无需特征工程。
实现了高效的训练，因为其宽部分和深部分共享相同的输入和嵌入向量。

在这里插入图片描述

算法模型：
DeepFM模型包括两个主要组件：

FM组件：用于捕捉特征之间的二阶交互。
DNN组件：用于捕捉更高阶的特征交互。

这两个组件共享相同的输入特征，并且模型的参数是联合训练的。模型的输出是CTR的预测值，通过sigmoid函数得到。

实验效果：
在Criteo数据集和商业数据集上进行了实验，评估指标包括AUC（Area Under the ROC Curve）和Logloss（交叉熵损失）。实验结果显示，DeepFM在两个数据集上都优于现有的模型，包括FM、FNN、PNN变体、Wide & Deep模型等。具体来说，在商业数据集上，DeepFM在AUC上比LR模型提高了0.86%，在Logloss上降低了0.42%；在Criteo数据集上，DeepFM在AUC上提高了0.37%，在Logloss上降低了0.29%。

推荐阅读指数：
★★★★☆

这是一篇CTR预估领域比较有影响力的论文。该文章对于从事推荐系统、广告技术、机器学习等领域的研究者和工程师来说非常有价值。它不仅提出了一个新的模型，而且在实际数据集上展示了其优越的性能。因此，我给予这篇文章较高的推荐指数。