DeepFM论文笔记

线性模型不好捕捉交叉特征,FM由于模型复杂性,通常只能捕捉到两维特征交互,NN捕获低维特征能力弱。wide&deep模型能够同时获取低维特征,但是需要低纬、高维两部分特征分开输入模型,而且wide部分的特征也是需要专门的特征工程进行的。

现有模型要么偏重于处理低维度模型,或者高维度模型,或者需要依赖于专门的特征工程。本文我们提出一种end to end的方法可以同时获取高维度和低维度特征,无需额外的特征工程,可以将原有特征直接输入模型,主要贡献如下:

  1. 整合FM和DNN,提出了DeepFM模型,像FM一样学习低维度交互特征,像DNN一样学习高维度交互特征,DeepFM可以endtoend训练不需要额外的特征工程
  2. DeepFM训练高效,因为deep和wide使用同一输入和embedding向量,而在wide&deep模型里,输入向量维度很大,因为有很多人工构造的成对的交叉特征,大大增加了模型的复杂程度
  3. 用benchmark和商用数据集测试后均发现DeepFM效果好于其他CTR预估模型。