图神经网络物品推荐算法中研究与应用论文设计
摘要
随着深度学习和机器学习的发展,在推荐领域中也涌现出很多利用相关技术进行推荐的方法,这些方法往往利用用户以及商品信息实现端到端的推荐系统,提升了推荐的性能和效率。在这个过程中,更多新颖的方法被提出以解决推荐的基本难题,从而拓宽推荐系统的性能边界。其中最重要的一点就是通过引入新的数据或者新的数据处理的方法,来提升原有推荐模型的性能。同时,在自然语言处理中,知识图谱这一种数据存储形式越来越受到研究人员们的重视,许多的研究和工作都证明了在知识图谱上进行表达可以获得许多隐含的信息和内容,从而应用于下游的相关工作。
本文关注图谱以及类似的图数据在推荐领域中的应用,研究图神经网络的方法来实现端到端的推荐系统,并提升推荐性能。具体来说,本文基于前人的研究成果,提出了一种图神经网络模型,结合 tucker 分解进行知识表示,实现基础的物品推荐算法。Tucker 分解是一种针对图谱,添加了关系信息的矩阵分解方法,比普通的矩阵分解能更加有效地提取图谱数据的表达。同时,图神经网络,比一般的方法更适合处理图数据这种非欧式数据,从而能更加有效地整合图上信息,最终实现了对于推荐能力的提升。
为了更加方便有效地评估模型的有效性,本文基于相关的研究成果——KGAT 所使用的公开数据集进行实验和评估,并采用同一套评价指标来说明本文研究的重要性和优越性。实验结果表明,本文所提出的模型在同样的评估标准上超越了其他几个基线模型的表现。
关键词:推荐算法,图数据,图神经网络,tucker 分解
ii Abstract With the development of deep learning and machine learning, there are many methods of recommendation using deep learning technology in the field of recommendation algorithm. These methods use user and item information to realize the end-to-end recommendation system, which greatly promotes the development of recommendation algorithm. In this process, more novel methods are proposed to solve the basic problem of recommendation, so as to broaden the performance boundary of recommendation system. The most important point is to improve the performance of the original recommendation model by introducing new data or new data processing methods. At the same time, in natural language processing, knowledge graph, a data storage form, has been paid more and more attention by researchers. Many researches and works have proved that the expression of knowledge graph can obtain a lot of implicit information and content, which can be applied to the downstream related work. This paper focuses on the application of graph and similar graph data in the field of recommendation, studies the method of graph neural network to realize the end-to-end recommendation system and improve the recommendation performance. Specifically, based on the previous research results, this paper proposes a graph neural network model, combined with Tucker decomposition for knowledge representation, to achieve the basic algorithm of item recommendation. Tucker decomposition is a matrix decomposition method which adds relation information to the graph. It can extract the expression of graph data more effectively than the common matrix decomposition. At the same time, the graph neural network is more suitable than the general method to deal with the non Euclidean data such as graph data, so it can integrate the information on the graph more effectively, and finally achieve the improvement of recommendation ability. In order to evaluate the validity of the model more conveniently and effectively, this paper conducts experiments and evaluations based on the relevant research results - the open data set used by KGAT, and uses the same set of evaluation criteria to illustrate the
iii importance and superiority of this study. Experimental results show that the model used in this paper outperforms other baseline models in the same evaluation criteria. Keywords :
Recommendation algorithm, Graph data, Graph neural network,Tucker decomposition
I 目录
摘要 ............................................................................................................................... i
Abstract ........................................................................................................................ ii
图目录 ........................................................................................................................ III
表目录 ....................................................................................................................... IV
第 1 章 绪论 ................................................................................................................ 1
1.1 课题背景 ............................................................................................................. 1
1.2 国内外相关研究 ................................................................................................. 2
1.2.1 一般推荐任务概述 ...................................................................................... 2
1.2.2 图上推荐方法概述 ...................................................................................... 3
1.2.3 图神经网络在推荐上的应用 ...................................................................... 4
1.3 GNN 进行推荐的挑战 ......................................................................................... 5
1.4 针对挑战所进行的工作 ..................................................................................... 5
1.5 论文的结构安排 ................................................................................................. 6
第 2 章 图推荐相关的背景知识 ................................................................................ 7
2.1 理论的知识背景 ................................................................................................. 7
2.1.1 图神经网络 .................................................................................................. 7
2.1.2 图谱的表示学习 ........................................................................................ 14
2.1.3 推荐算法介绍 ............................................................................................ 18
2.2 开源框架的介绍 ............................................................................................... 20
2.2.1 DGL 开源图神经网络框架 ....................................................................... 20
2.3 本章小结 ........................................................................................................... 21
第 3 章 基于 Tucker 分解增强的 GAT 物品推荐模型 ........................................... 22
3.1 任务的详细定义 ............................................................................................... 22
3.1.1 数据的抽象结构 ........................................................................................ 22
3.1.2 推荐的具体方式 ........................................................................................ 24
3.2 模型方法的说明 ............................................................................................... 24
3.2.1 模型整体介绍与思考 ................................................................................ 25
3.2.2 知识表示进行预处理 ................................................................................ 27
3.2.3 模型结构的具体设计 ................................................................................ 28
3.3 本章小结 ........................................................................................................... 34
第 4 章 实验设计与结果分析 .................................................................................. 35
4.1 基准方法概述 ................................................................................................... 35
4.1.1 其他图神经网络方法 ................................................................................ 35
4.1.2 经典方法 .................................................................................................... 36
4.2 评价指标 ........................................................................................................... 37
4.3 整体代码设计 ................................................................................................... 38
II 4.4 实验流程 ........................................................................................................... 40
4.4.1 数据源的分析介绍 .................................................................................... 40
4.4.2 数据预处理与构图 .................................................................................... 41
4.4.3 模型构建参数选择 .................................................................................... 42
4.5 结果分析 ........................................................................................................... 45
4.6 本章小结 ........................................................................................................... 48
第 5 章 总结与展望 .................................................................................................. 49
5.1 全文总结 ........................................................................................................... 49
5.2 未来展望 ........................................................................................................... 49
参考文献 .................................................................................................................... 51
作者简历 ...................................................................................... 错误! 未定义书签。
致谢 .............................................................................................. 错误! 未定义书签。
III 图目录
图 2.1
GraphSAGE 的基本流程 ............................................................................ 11
图 2.2
图上注意力机制 .......................................................................................... 12
图 2.3
RGCN 的基本工作原理 ............................................................................. 14
图 2.4
三种 Trans 方法的投影 ............................................................................... 16
图 2.5
Tucker 分解的核心计算公式示意图 ......................................................... 17
图 2.6
PinSage 核心伪代码流程 .......................................................................... 19
图 2.7
DGL 框架消息传递基本示意图 ................................................................ 20
图 3.1
CF 侧数据与 KG 侧数据的示意图 ............................................................ 23
图 3.2
三种构图方式结构和所包含信息上的区别 .............................................. 24
图 3.3
模型方法整体概述 ...................................................................................... 25
图 3.4
一阶的共同行为 .......................................................................................... 26
图 3.5
二阶的共同行为 .......................................................................................... 26
图 3.6
采样的策略 .................................................................................................. 34
图 4.1
代码整体框架 .............................................................................................. 39
图 4.2
两种模型初始化与不初始化训练的情况对比图 ...................................... 46
图 4.3
注意力熵值的比较 ...................................................................................... 48
IV 表目录
表 4.1
数据源边数与节点数统计表 ....................................................................... 41
表 4.2
具体数据表 ................................................................................................... 41
表 4.3
TkGAT 与其他 GNN 方法实验结果对比 ................................................... 45
表 4.4
模型在不同超参下的实验对比结果 ........................................................... 45
表 4.5
模型与其他基准模型的实验对比结果 ....................................................... 46
表 4.6
采样做为正则手段的实验对比结果 ........................................................... 47
1 第 第1章 章
绪论 1.1 课题背景 随着电商与网络娱乐产业的快速发展,为用户进行个性化推荐商品或者广告已经是互联网公司最重要的能力之一。在如今的互联网公司,各种推荐算法和工程框架层出不穷,而为了拓宽推荐能力的边界,有越来越多新颖的模型与方法被用于推荐任务。随着近年来图神经网络的发展,对于图这样的非欧式数据的探索也越来越多,自然地也有许多研究人员将图神经网络应用到推荐相关的任务上。同时,利用图神经网络(Graph Nerual NetWork)
[1] 不光从方法上有别于一般的推荐算法,其可用的数据范围也扩展到了所有的图结构数据,而使用 side information来增强推荐的能力,尤其是利用知识图谱的信息更是工业界和学术界都在探索的一个方向。基于此,本文将立足于开源数据集和公司的业务数据,研究如何在知识图谱等图结构数据上,更好地利用图神经网络实现推荐任务。
具体来说,如今的推荐算法,通过这几年的不断发展,已经利用深度学习的技术获得了长足的进步。越来越多的工作也说明了深度学习技术在推荐算法中的可行性和重要性。例如由 YouTube 在 2016 年提出的这一架构 [2] ,可以算是深度学习在推荐中工业落地的一个最佳范例,后来在国内的电商推荐环境中,也基本采用了这种形式。后续更多的推荐模型被提出,这些模型或从经典的 FM [3] 算法脱胎而来;或是引入了注意力机制,例如根据当前用户历史行为对用户的兴趣进行捕捉的DIN [4] 、MIND [5] 等算法;以及利用CNN机制进行推荐的DeepCoCNN [6] 模型。但上述模型的改进更多的是研究模型本身对于推荐性能的提升,并不关注数据本身的特性。
因此,更多的研究开始关注于使用更加新颖、更加先进的深度学习技术来提升现有推荐算法的边界,这其中比较重要的一个工作就是利用图谱数据进行推荐任务。例如,基于图的推荐工作,首先是将用户和物品的交互行为表示为图结构或者网络结构,然后利用图上的表示学习来表达节点或者边的语义信息。更进一步,使用图谱进行推荐比较经典的做法是基于路径的推荐方法 [7][8] 。
在这里,本文选择采用的方法是图神经网络。基于深度学习的方法,在图上进行卷积从而对图数据进行处理,以发掘其规律和特征,这类模型被统称为图神网络(GNN)。GNN 的一个发展方向,是借鉴 CNN 的思路,如何在图上进行卷
2 积从而实现图上的卷积神经网络是 GNN 重点需要解决的问题。而 GNN 的一个很重要的作用和知识表示类似,是图上节点和边的稠密低纬表示。
本文所要做的工作就是在充分研究了已有 GNN 相关成果的基础上,提出一种合适的模型,在公开数据集上完成相关的推荐任务,并取得推荐性能的提升。
1.2 国内外相关研究 1.2.1 一般推荐任务概述 从历史的发展来看,推荐系统的研究起源于国外,可以追溯到 1994 年明尼苏达大学 GroupLens 研究组推出的 GroupLens 系统 [9] ,该系统首次使用了协同过滤的算法为 user 推荐 item,并且为后面的推荐系统建立了一个形式化的模型框架。
而当今工业界,往往会将推荐系统分成matching和ranking两个阶段来实现,即对应了粗排和精排。这一架构源于论文 [2] ,由 YouTube 于 2016 提出。在国内的电商推荐环境中,也基本采用了这种形式。
自 1994 年开始协同过滤算法应用在推荐系统以来的二十多年间,协同过滤依然是推荐的核心思路之一。所谓协同过滤就是基于群体的信息,对个体信息进行过滤。协同过滤推荐算法基本可以分为基于用户、基于物品以及基于模型三类。
基于用户的协同过滤最早就是由文章 [9] 提出,它的核心思路是相似用户之间对于物品的喜好可能相同。基于物品的协同过滤则是由亚马逊于2001年提出 [10] ,它的核心思路则是喜欢 A 物品的人也会喜欢与 A 相似的物品 B。
基于模型的协同过滤可以大致分为基于矩阵分解的方法与基于分类模型的方法。SVD 奇异值分解是数学上的一种比较经典的矩阵分解方法,可以将一个矩阵表示成三个矩阵相乘。而 SVD++则是不光利用用户的评分矩阵,也引入了用户的行为矩阵,从而使得信息更加完善和稠密 [11] 。除了直接拟合矩阵值的矩阵分解之外,还有一种基于排序的矩阵分解形式。它的核心思路在于用户对于一个正例商品与一个负例商品,应该使得对于正例的评分高于负例。BPR [12] 就是这样的一个方法,通过构造正负样本对的损失函数,使得 user 和 item 最终的隐式表达的乘积互相远离,实际上后来很多的推荐模型,都会使用类似的损失函数。
基于分类模型的方法中比较经典的算法是分解机(FM)算法,该算法在工业界往往应用于 ranking 阶段。FM 算法 [13] 通过引入特征的二阶项,从而缓解特征稀
3 疏的问题,同时将二阶项的权重分解成两个向量的乘积,因此即便在稀疏特征下也能训练该权重。FM 在之后又有 FFM [14] 、DeepFM [15] 等变种,是推荐在精排阶段非常重要的算法之一。
而随着深度学习的发展,也有越来越多利用深度学习技术实现的经典的推荐算法,例如 NCF [16] 、PNN [17] 、DSSM [18] 、Wide&Deep [19] 等算法模型。其中 DeepFM [15]是将 Wide&Deep 中的 Wide 部分替换成了 FM,然后利用 FM 实现特征的自动交叉。而 Deep 部分则建模特征间的高阶关联,从而优化了原来的 FM 算法。后续还有优化的 xDeepFM [20] 、NFM [21] 等算法。同时,引入注意力机制,实现根据当前用户历史行为对用户的兴趣进行捕捉,也是 DIN、MIND 等算法的核心思路。
这些算法在推荐的召回阶段发挥了不小的作用。此外,还有利用 CNN 实现的推荐模型,例如 DeepCoCNN。
1.2.2 图上推荐方法概述 基于图的推荐工作,是与本研究内容密切相关的一部分工作。将用户和物品的交互行为表示为图结构或者网络结构,然后利用图上的表示学习来表达节点或者边的语义信息是图上推荐的一般做法。在这里可以将其分成两类:单纯的表示学习与引入 KG 的推荐模型。
单纯的表示学习其基本思路是参照 NLP 技术中 word2vec 的方法,通过SkipGram 算法来学习节点之间共现的隐式表达。具体来说,可以从一个节点出发,通过随机游走的方式,找到一批认为与这个点相似的点,通过这种共现学习节点的 Embedding 表示。这种稠密的低维度表示可以在 matching 阶段表示商品与商品之间的相似度,也可以在 ranking 阶段作为特征输入到更复杂的模型中用于精排。DeepWalk [22] 被认为是第一个利用 NLP 中 Embedding 的技术来学习节点表示的方法;而 LINE [23] 则是在方法 [22] 的基础上引入了不同与邻接相似的二阶相似,拓宽了节点相似的范围,使得节点的表达更加抽象。Node2Vec [24] 则是在方法 [22] 的基础上通过引入了更加灵活的随机游走方式,同时也能对高阶的相似进行建模。上文的模型都只考虑了同构图的情况,而对于异构图 Metapath2Vec [25] 则提出了利用元路径来指导随机游走的策略,从而学习节点表达。
使用图谱进行推荐比较经典的做法就是上文提到的异构图推荐的做法,即基于路径的推荐方法 [26][27] 。该类方法将知识图谱构建成一张异构信息网络,然后构造物品之间基于 meta-path 的特征,但这种方法的缺点也很明显,人为地构造 meta-
4 path 的工作量过于繁琐,且难以普适地应用于各种场景。近年来研究人员对于如何将图谱数据应用于推荐也有很多探索和尝试,本课题的核心内容也在于探究如何利用图神经网络将例如知识图谱这样的图数据应用到推荐任务中。
1.2.3 图神经网络在推荐上的应用 正如上文所言,图上的推荐任务已经颇有成效。自然地,随着图神经网络的兴起,许多研究人员开始尝试利用图神经网络模型来训练端到端(End-to-End)的推荐系统,以充分挖掘图数据的潜力和价值。
PinSage [28] 是 GCN 方法在工业界的一次很好的落地实现,该算法通过 random walk 和 GCN 来生成涵盖了图结构信息和节点特征的节点嵌入表示,其主要的改进点在于对于利用随机游走生成子图,并在子图上进行 GCN 的操作,这样大大节省了内存开销;同时推荐向的训练则是参考了 BPR [12] 的损失函数,最大化正负样本的得分差。
GCMC [29] 是利用图生成的方法来实现推荐的方法。它的主要想法就是将用户和物品的交互构建成图中的边,然后通过随机掩盖边的方法,让模型学习用户和物品之间存在边的概率。通过这种方法,GCMC 将原先的推荐任务转变了成了图上的链接预测。且它的训练过程是将原图进行嵌入之后再让模型尝试还原,因此也是 Auto-Encoder 框架的一个很好的应用。
KGAT [30] 、KGCN [31] 是最近一段时间里比较明确地利用 GNN 方法将知识图谱应用推荐任务的两种方法。
KGAT [30] 应用 GAT 的思想对图谱数据进行了操作。
Item 本身是图谱中的实体,而 User 和 Item 可以通过是否行为构建出一条边,因此通过这条边可以将 User引入现有的图谱图中,从而构建了一张 CKG(协同知识图谱)。主要思路是通过GAT 对 User 和 Item Embedding 化,然后训练 BPR 损失,这是属于 CF 训练的一部分。而图谱的方法中同时引入了 TransR,TransR 训练出来结果作为 CF 训练中注意力权重的来源,也就是在 Trans 算法中更接近的实体之间,其注意力值要相对高一些。
KGCN [31] 将 GCN 方法应用到图谱上,但说是 GCN 的方法,实际上也是一种注意力模型。它为每一个用户针对每一个关系都生成了不同的注意力权重,这就从某种程度上实现了每个用户对于商品的关注点都有所不同,这也应该是做 User-Item 交互预测的核心思路。不过这样使得模型训练的成本大大提高,论文本身也
5 采用了邻接采样的机制来降低训练成本,不过它做 Attention 的思路值得借鉴。
可以预见,随着图神经网络和知识图谱的不断发展,会有越来越多的利用GNN 实现个性化推荐的方法涌现出来。
1.3 GNN 进行推荐的挑战 图数据是一种隐含结构信息且内容丰富的数据,将其应用到推荐任务上,普通的方法可能并不能得到足够有效的结果;而利用 GNN 可以天然地使用图数据的结构信息,并将图上节点做更加丰富的表达。然而将 GNN 运用到推荐任务中仍需要克服以下几个问题:
1. 图谱数据的结构和表达 本文选择了使用 NLP 中的知识图谱数据来作为推荐的基础数据。从一方面来说,图谱数据对于推荐任务来说是非常宝贵的 side information,可以从不同的维度很好地补充推荐任务需要的额外信息;从另一方面说,图谱数据也是非常典型的图数据,有着丰富的结构和边信息。而如何使用图谱数据,挖掘图谱数据隐含的特点和信息就成为了本文所要解决的核心问题。GNN 模型的选择和构建自然是一方面的难点,还有一方面的难点在于针对图谱数据本身,是否有比较通用的挖掘其信息表达的方式,从而增强 GNN 模型的能力,最终提升推荐的性能。
2. 图模型的选择和构建 显然,本研究的第二个难点就是如何选择和构建合适本推荐任务的 GNN 模型。总的来说,现有的许多 GNN 模型基本都是脱胎于 GCN 的基础框架,并在GraphSAGE 的改进之上继续发展而来的。简单地说,模型都基于两个阶段:即如何聚集节点的邻居节点信息以及聚合之后做何种处理。本文也将沿用这种模式,探究一种合适的聚合方式,使得该 GNN 模型能够在本问题上有较好的表现。问题的难点就在于,如何根据不同的图谱表示方法,来更好地设计模型的聚合方式,以及通过不同的实验来证明,哪些模型结构更加适合本问题的解决。
1.4 针对挑战所进行的工作
本文的任务是研究如何更好地实现在图数据上的物品推荐算法。该方法是在现有相关研究基础上,进行一次拓展和尝试的方法,主要进行的工作包括以下几点:
6 (1)在已有推荐算法的基础上,尝试使用图神经网络的技术来实现图数据上的推荐。
(2)图谱信息的表达:针对图谱这种特殊的图数据,利用不同的图表示学习的方法,来提取和挖掘图数据的信息,并将其与 GNN 模型进行有机的结合。
(3)提出了一种基于 tucker 分解增强的 GAT 模型结构,以及尝试了其他不同类型的 GNN 模型及其相关变种。
(4)利用开源框架 DGL 和深度学习框架 pytorch 构建模型,完成实验代码,尝试上面提出的不同的想法并进行实验。
(5)对于异构同构等图上问题,进行了不同的考量和实验,对于图数据的预处理做了充分的准备。
1.5 论文的结构安排
本文研究的是利用图神网络进行物品推荐的任务,全文总共分成五个部分,具体的内容安排如下所示:
第一章为绪论,阐述了本文的研究背景和国内外的相关研究情况,并对本研究的难点和主要工作做了简单的叙述。
第二章则是将文本研究过程中涉及到的知识内容和模型方法做了统一的阐述,主要是围绕 GNN 模型、图数据表示方法、推荐算法和开源框架这几个方面展开的。
第三章则详细介绍了本文提出的方法,一种基于 tucker 分解的 GAT 推荐模型,详细说明了设计思路和模型的具体结构。
第四章则是详细地说明了本文的实验环境,和实验设计的过程,对于具体的代码内容也有基本的概述。分析和阐述实验结果,利用表格以及一些图形化的展示,来说明研究的结果。
第五章对本文的工作做了总结,并对未来的研究做了展望。
7 第 第2章 章
图推荐相关的背景知识 2.1 理论的知识背景 2.1.1 图神经网络 图神经网络是最近几年以来兴起的一种基于图数据结构的广义神经网络架构。传统的深度学习模型,例如 LSTM [32] 和 CNN,是在欧式空间的数据上进行训练,并取得了许多不错的成绩。但是对于非欧式空间的数据,例如社交网络、知识图谱这些有着非规则连边的数据,直接利用深度模型有许多的局限性。针对这种问题,研究者们引入了图来表示非欧式数据,并利用深度学习的方法,在图上进行卷积从而对图数据进行处理,以发掘其规律和特征。
GNN 的一个发展方向,是借鉴 CNN 的思路,如何在图上进行卷积从而实现图上的卷积神经网络是 GNN 重点需要解决的问题。而 GNN 的一个很重要的作用和知识表示类似,是图上节点和边的稠密低纬表示,上文提到的DeepWalk和LINE说明了网络表示的有效性,但这些方法并不系统且计算复杂,GNN 旨在解决这些问题 [1] 。
GNN 值得学习的根本理由有以下三点。
第一,像上文所说的传统的 CNN 和 RNN 模型并不能很好地处理图数据的输入,因为它们的特征需要按照特定的顺序进行叠加,而图中的点往往是无序的。如果为了完整地表达一张图,可能就需要把所有的顺序都作为输入,显然这是非常冗余且难以实现的。GNN 解决这个问题的方法就是将特征在每个节点上进行传播,从而忽略了节点输入的顺序。也就是说,GNN 的输出与节点输入的顺序是无关的。
第二,传统的神经网络结构中,对于边信息是无法建模的,往往边信息会被简化成节点本身的特征信息,而 GNN 则可以通过图结构实现信息的传递,从而利用边信息进行特征的隐式表达。
第三,图形数据本身是推理的一个非常重要的组成,人脑的推理过程几乎都是基于从日常经验中提取的图信息。尽管 CNN 可以很好的处理图片信息,而 RNN在文本信息的处理中也有不俗的表现,但它们仍然不能从大型实验数据中学习推理图,然而,GNN 为探索这些非结构化数据生成图信息提供了一个新的方向和思路,从而可能演化出更进一步的高级人工智能。
8 除此之外,一个未经训练的简单架构的 GNN 也被证明具有良好的性能,图结构本身成为了 GNN 模型的重要组成部分。
2.1.1.1 Graph Convolutional Network (GCN) 借助图的拉普拉斯的特征值和特征向量来研究图的基本性质,是 GCN 的理论基础。具体详细的理论研究并不是本文要讨论的重点,因此这里只是简单概述一下 GCN 理论的发展情况和核心内容。
首先是关于图上卷积的计算的推导,以下的内容来自于论文 [33] 的提炼和理解。图的拉普拉斯矩阵是指,对于图 G=(V,E),其拉普拉斯矩阵的定义为 L=D-A,其中 D 表示整个图的顶点度矩阵,而 A 则表示了整张图的邻接矩阵。事实上,这只是拉普拉斯矩阵的其中一种定义,总的来说,图上的拉普拉斯矩阵一共有以下三种定义: