【fm2017 1731 球员名字】特征交叉模型系列之DeepFM

特征交叉模型系列之DeepFM

前言

上一期我们介绍了由Google提出的Wide & Deep Learning （WDL）模型，虽然这款模型把深度学习带入了推荐系统，具有划时代的意义。但是由于这款模型中的特征交叉还是需要expert进行手动设计，这从一定程度上还是跟特征工程的设计一样需要耗费大量的人力。本期将介绍一款由华为和哈工大提出的特征自动组合的模型——DeepFM [1]。

问题背景

之前WDL模型中的宽度模型部分，是需要人工做特征交叉处理的，但是这需要耗费expert大量的知识来做手动设计处理。那么，我们怎么能自动进行特征交叉呢？

DeepFM模型的提出

受到Factorization Machine（FM）的影响，我们可以借助FM实现对特征的自动交叉，即使用FM替代WDL中的特征手动交叉，然后在使用权重矩阵实现对特征重要性的学习。以下是DeepFM模型的架构图。

整体的模型架构是很简单的，并且没有新的设计，只是将以往的理论结合起来的一个简单模型结构。

实验

实验部分，作者使用了公司内部的业务和开源数据集Criteo作为实验数据，以下是对照结果，可以看出DeepFM的效果：

总结

DeepFM在WDL的基础上，将手动的特征交叉替换为FM作为自动二阶特征交叉，实现了模型的特征自动重组，极大地扩充了特征库，增强了模型的泛化能力。由于DeepFM模型的简单性，目前也在很多大型互联网公司的业务中有所部署。

参考文献

[1] H. Guo, R. Tang, Y. Ye, Z. Li, and X. He, "DeepFM: A factorization-machine based neural network for CTR prediction," IJCAI Int. Jt. Conf. Artif. Intell., vol. 0, pp. 1725–1731, 2017, doi: 10.24963.

如果你喜欢我的文章，欢迎关注我的微信公众号【软客圈】（ID：recoquan）

纯手工打造，实属不易，欢迎大家分享和转发~

原创内容，转载需注明出处，否则视为侵权并将被追诉！

关于作者: luda

热门推荐