您的位置 首页 > 体育运动

【fm2017 1731 球员名字】特征交叉模型系列之DeepFM

特征交叉模型系列之DeepFM

前言

上一期我们介绍了由Google提出的Wide & Deep Learning (WDL)模型,虽然这款模型把深度学习带入了推荐系统,具有划时代的意义。但是由于这款模型中的特征交叉还是需要expert进行手动设计,这从一定程度上还是跟特征工程的设计一样需要耗费大量的人力。本期将介绍一款由华为和哈工大提出的特征自动组合的模型——DeepFM [1]。

问题背景

之前WDL模型中的宽度模型部分,是需要人工做特征交叉处理的,但是这需要耗费expert大量的知识来做手动设计处理。那么,我们怎么能自动进行特征交叉呢?

DeepFM模型的提出

受到Factorization Machine(FM)的影响,我们可以借助FM实现对特征的自动交叉,即使用FM替代WDL中的特征手动交叉,然后在使用权重矩阵实现对特征重要性的学习。以下是DeepFM模型的架构图。

整体的模型架构是很简单的,并且没有新的设计,只是将以往的理论结合起来的一个简单模型结构。

实验

实验部分,作者使用了公司内部的业务和开源数据集Criteo作为实验数据,以下是对照结果,可以看出DeepFM的效果:

总结

DeepFM在WDL的基础上,将手动的特征交叉替换为FM作为自动二阶特征交叉,实现了模型的特征自动重组,极大地扩充了特征库,增强了模型的泛化能力。由于DeepFM模型的简单性,目前也在很多大型互联网公司的业务中有所部署。

参考文献

[1] H. Guo, R. Tang, Y. Ye, Z. Li, and X. He, "DeepFM: A factorization-machine based neural network for CTR prediction," IJCAI Int. Jt. Conf. Artif. Intell., vol. 0, pp. 1725–1731, 2017, doi: 10.24963.

如果你喜欢我的文章,欢迎关注我的微信公众号【软客圈】(ID:recoquan)

纯手工打造,实属不易,欢迎大家分享和转发~

原创内容,转载需注明出处,否则视为侵权并将被追诉!

关于作者: luda

无忧经验小编鲁达,内容侵删请Email至wohenlihai#qq.com(#改为@)

热门推荐