深度学习-点击率预估-研究论文2024-09-14速读

news/2024/9/19 3:33:09 标签: 深度学习, 人工智能

深度学习-点击率预估-研究论文2024-09-14速读

1. Deep Target Session Interest Network for Click-Through Rate Prediction

H Zhong, J Ma, X Duan, S Gu, J Yao - 2024 International Joint Conference on Neural Networks, 2024

深度目标会话兴趣网络用于点击率预测

摘要:
这篇文章提出了一种新的深度学习模型,名为Deep Target Session Interest Network(DT-SIN),用于提高点击率(CTR)预测的准确性。该模型特别关注用户会话中的行为序列,通过捕捉用户在会话期间的动态兴趣变化来预测点击行为。DT-SIN模型利用了注意力机制来加权用户会话中的不同项目,并结合了用户的历史行为和上下文信息来提高预测的准确性。

创新点:

  1. 提出了一种新的用户会话表示方法,能够捕捉用户在会话期间的兴趣演变。
  2. 引入了注意力机制来加权用户会话中的项目,使得模型能够关注更相关的用户行为。
  3. 结合了用户的历史行为和上下文信息,以提供更全面的用户画像,从而提高CTR预测的准确性。

算法模型:
DT-SIN模型包括以下几个关键组件:

  • 会话兴趣提取器:用于从用户会话中提取兴趣表示。
  • 注意力机制:用于加权会话中的不同项目,以突出用户最感兴趣的部分。
  • 用户画像构建器:结合用户的历史行为和上下文信息来构建用户画像。
  • 预测器:基于用户画像和会话兴趣来预测点击行为。

实验效果:
文章中进行了一系列的实验来评估DT-SIN模型的性能。实验结果表明,与现有的CTR预测模型相比,DT-SIN在多个数据集上都取得了更好的性能。具体来说,DT-SIN在AUC(Area Under the Curve)和Logloss等评价指标上均优于其他模型。实验数据和结论证明了DT-SIN在处理复杂的用户行为序列和提高CTR预测准确性方面的有效性。

推荐阅读指数:
★★★★☆

这篇文章对于那些对推荐系统、用户行为分析和深度学习在CTR预测应用感兴趣的研究人员和实践者来说是非常有价值。它提供了一种新的视角来理解和预测用户的点击行为,并且通过实验验证了其有效性。因此,我给予这篇文章较高的推荐指数。

2. DeepFM: A Factorization-Machine based Neural Network for CTR Prediction

Huifeng Guo, Ruiming Tang, Yunming Ye, Zhenguo Li, Xiuqiang He, 2017

DeepFM:一种基于分解机的神经网络用于点击率预测
在这里插入图片描述

摘要:
文章提出了DeepFM模型,这是一个结合了分解机(Factorization Machines, FM)和深度神经网络(Deep Neural Networks, DNN)的端到端学习模型,用于提高推荐系统中的点击率(CTR)预测准确性。DeepFM模型能够同时捕捉低阶和高阶特征之间的复杂交互,并且不需要除了原始特征之外的任何特征工程。通过在基准数据集和商业数据上的全面实验,证明了DeepFM在CTR预测方面的有效性和效率,与现有模型相比有显著提升。

创新点:

  1. 提出了DeepFM模型,它整合了FM和DNN,能够同时学习低阶和高阶特征交互。
  2. 与Google的Wide & Deep模型相比,DeepFM的“宽”和“深”部分共享相同的输入,无需特征工程。
  3. 实现了高效的训练,因为其宽部分和深部分共享相同的输入和嵌入向量。

在这里插入图片描述

算法模型:
DeepFM模型包括两个主要组件:

  • FM组件:用于捕捉特征之间的二阶交互。
  • DNN组件:用于捕捉更高阶的特征交互。

这两个组件共享相同的输入特征,并且模型的参数是联合训练的。模型的输出是CTR的预测值,通过sigmoid函数得到。

实验效果:
在Criteo数据集和商业数据集上进行了实验,评估指标包括AUC(Area Under the ROC Curve)和Logloss(交叉熵损失)。实验结果显示,DeepFM在两个数据集上都优于现有的模型,包括FM、FNN、PNN变体、Wide & Deep模型等。具体来说,在商业数据集上,DeepFM在AUC上比LR模型提高了0.86%,在Logloss上降低了0.42%;在Criteo数据集上,DeepFM在AUC上提高了0.37%,在Logloss上降低了0.29%。

推荐阅读指数:
★★★★☆

这是一篇CTR预估领域比较有影响力的论文。该文章对于从事推荐系统、广告技术、机器学习等领域的研究者和工程师来说非常有价值。它不仅提出了一个新的模型,而且在实际数据集上展示了其优越的性能。因此,我给予这篇文章较高的推荐指数。


http://www.niftyadmin.cn/n/5664908.html

相关文章

JAVA基础:正则表达式,String的intern方法,StringBuilder可变字符串特点与应用,+连接字符串特点

1 String中的常用方法2 1.1 split方法 将字符串按照指定的内容进行分割,将分割成的每一个子部分组成一个数组 分割内容不会出现在数组中 实际上该方法不是按照指定的简单的符号进行分割的,而是按照正则表达式进行分割 1.2 正则表达式 用简单的符号组合…

linux-系统管理与监控-设备管理

Linux 系统管理与监控:设备管理 在 Linux 系统中,设备管理是操作系统管理硬件资源的重要部分。通过设备管理,系统能够与计算机的硬件组件(如存储设备、网络接口、输入输出设备等)进行交互,并提供一个抽象的…

企业架构如何推动组织中成功的数字化转型

在当今的数字世界中,成功数字化转型的需求比以往任何时候都更加重要。公司越来越多地参与数字化转型,以保持相关性和竞争力。然而,数字化转型不仅仅是技术更新。它需要一种战略方法来整合业务流程、模型和目标。这就是企业架构发挥作用的地方…

基于open-gpu-kernel-modules的p2p vram映射bar1提高通信效率

背景 bar1 Base Address Register 1 用于内存映射的寄存器,定义了设备的内存映射区域,BAR1专门分配给gpu的一部分内存区域,允许cpu通过pcie总线直接访问显存VRAM中的数据。但bar1的大小是有限的,在常规的4090上,bar1只…

dcmtk的自动输入数据纠错模式对DICOMDIR读取的影响

软件版本 dcmtk 3.6.7 自动纠错的全局变量 输入数据的自动纠错是一个全局变量,定义在dcmtk/dcmdata/dcobject.h中,如下所示: /** This flags defines whether automatic correction should be applied to input* data (e.g.\ stripping …

【C语言】带你手把手拿捏指针(3)(含转移表)

文章目录 一、字符指针变量二、数组指针变量1.数组指针变量是什么2.数组指针变量的初始化 三、二维数组传参的本质四、函数指针变量1. 函数指针变量的创建2.函数指针的使用3.案例解析: 五、typedof关键字六、函数指针数组和转移表1.函数指针数组2.转移表 一、字符指…

TypeScript 枚举

枚举: 使用枚举我们可以定义一些带名字的常量。 使用枚举可以清晰地表达意图或创建一组有区别的用例。 TypeScript支持数字的和基于字符串的枚举。 例子: function a(sex: string) {console.log(张三的性别是:${sex});} a(男); a(狗); 用枚举: 1.en…

【大数据方案】智慧大数据平台总体建设方案书(word原件)

第1章 总体说明 1.1 建设背景 1.2 建设目标 1.3 项目建设主要内容 1.4 设计原则 第2章 对项目的理解 2.1 现状分析 2.2 业务需求分析 2.3 功能需求分析 第3章 大数据平台建设方案 3.1 大数据平台总体设计 3.2 大数据平台功能设计 3.3 平台应用 第4章 政策标准保障体系 4.1 政策…