一种基于矩阵分块技巧的协同过滤跨域推荐 A Collaborative Filtering Cross-Domain Recommendation Based on Matrix Blocking Technique

doi:10.12677/MOS.2023.123192

Modeling and Simulation
Vol. 12 No. 03 ( 2023 ), Article ID: 65240 , 11 pages
10.12677/MOS.2023.123192

一种基于矩阵分块技巧的协同过滤跨域推荐

姜树媛，胡建华^*，王新利

●How to Cite this Article

上海理工大学理学院，上海

收稿日期：2023年3月2日；录用日期：2023年5月8日；发布日期：2023年5月15日

摘要

针对数据稀疏性的挑战和冷启动问题，跨域推荐技术成为研究热点，大大提高了推荐的精确度。但当前主要的跨域推荐模型建立在源域与目标域的用户或项目完全重叠的情形下，其应用具有局限性。本文拟在用户部分重叠的场景下，提出一种新的跨域推荐模型：基于矩阵分块技巧的协同过滤跨域推荐(A Collaborative Filtering Cross-Domain Recommendation Based on Matrix Blocking Technique, CFCDRMB)。新模型采用矩阵三分解形式，利用矩阵分块技巧表征共享用户潜在因子和域特有用户潜在因子，同时用联合矩阵分解学习特征矩阵来捕获各自域的数据特征并实现共享知识的迁移。本文在3个数据集上与4个方法进行了对比，实验结果表明，新提出的模型在部分用户重叠场景下具有显著的优越性。

关键词

矩阵分块，跨域推荐，部分用户重叠

A Collaborative Filtering Cross-Domain Recommendation Based on Matrix Blocking Technique

Shuyuan Jiang, Jianhua Hu^*, Xinli Wang

College of Science, University of Shanghai for Science and Technology, Shanghai

Received: Mar. 2^nd, 2023; accepted: May 8^th, 2023; published: May 15^th, 2023

ABSTRACT

Due to the challenge of data sparsity and cold start, cross-domain recommendation technology has become a research hotspot, greatly improving the accuracy of recommendation. However, the current main cross-domain recommendation model is based on the situation that the users or items in the source domain and the target domain completely overlap, which leads to the limitation in application. In this paper, we have proposed a new cross-domain recommendation model under the scenario of partial overlap of users: A Collaborative Filtering Cross-Domain Recommendation based on Matrix Blocking Technique (CFCDRMB). The new model adopts the matrix triple-decomposition form, uses the matrix blocking technique to represent the shared user potential factor and the domain-specific user potential factor, and utilizes the joint matrix decomposition learning feature matrix to capture the data characteristics of each domain and transfer the shared knowledge. In this paper, four methods are compared on three data sets, and the experimental results show that the new model has significant advantages in partial user overlap scenarios.

Keywords:Matrix Blocking, Cross-Domain Recommendation, Partial User Overlap

This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).

http://creativecommons.org/licenses/by/4.0/

1. 引言

伴随着互联网的出现和普及，用户可以获得大量的信息，但互联网的迅速发展也致使数据信息大幅度增加，这便造成了信息过载 [1] ，用户难以从海量数据中挑选出有效信息。为了解决这一问题，推荐系统 [2] [3] 应运而生。

推荐系统通过数据进行预测，既可以帮助用户挑选出有效信息，也可以将信息展现在更可能对它感兴趣的用户面前。常见的推荐方法包括基于内容的推荐、基于知识的推荐、协同过滤以及混合推荐等 [4] 。推荐系统现已广泛地应用在很多领域，例如零售、音乐、目录、网络搜索等 [5] 。但在实际中，由于与用户产生交互的项目很少，因此便产生了数据稀疏和冷启动问题，这也是推荐系统所面临的主要问题。

为了缓解数据稀疏 [6] 和冷启动 [7] ，一种有效的方法就是跨域推荐 [8] [9] 。跨域推荐旨在利用其他领域的数据信息，帮助目标领域给用户进行推荐。例如，对于一个大型的电商平台而言，新用户从未购买过书籍，但是该用户可能在此平台上购买过电影或音乐，这些信息往往是能够帮助平台实现对该用户购买书籍的推荐工作，或者借助其他用户或其他物品的相关信息，让可用的信息丰富起来，从而降低推荐难度。

跨域推荐的主要方法有协同过滤 [10] 、矩阵分解 [11] 、迁移学习 [12] 、神经网络 [13] 以及注意力机制 [14] 等。对于基于矩阵分解的推荐方法，国内外学者们已经做了很多的研究。一种是将迁移学习与矩阵分解相结合，将在源域上通过矩阵分解学习到的评分模型迁移到目标域，这种模型的缺点是没有利用目标域的信息，因此在迁移后，推荐效果不佳。之后，有学者提出，当源域和目标域用户完全重叠或者项目完全重叠时，在矩阵分解的基础上，利用矩阵联合分解(Collective Matrix Factorization, CMF)的方法 [15] ，即同时最小化两个域的损失函数，这样便可以同时分析两个域的数据信息，但是这种模型要求用户因子矩阵或项目因子矩阵完全相同。

针对以上的不足，本文提出了一种基于部分用户重叠的跨域推荐方法，主要贡献有：

1) 在用户部分重叠的场景下，提出一种新的跨域推荐模型：基于矩阵分块技巧的协同过滤跨域推荐(A Collaborative Filtering Cross-Domain Recommendation Based on Matrix Blocking Technique, CFCDRMB)。模型采用矩阵三分解形式来学习潜在因子矩阵和特征矩阵。

2) 模型利用矩阵分块技巧表征共享用户潜在因子和域特有用户潜在因子；并利用联合矩阵分解学习特征矩阵来捕获各自域的数据特征并实现共享知识的迁移。

3) 本文在3个数据集上与4个方法进行了对比，实验结果表明，新提出的模型在部分用户重叠场景下具有显著的优越性。

2. 相关工作及原理

推荐系统的评分矩阵是一个高维稀疏矩阵 $X = {[x_{i, j}]}_{n \times n} \in {ℝ^{+}, ?}$ ，潜在因子模型通过将目标矩阵分解

为相应潜在因子矩阵的乘积，模型也从最初的二分解形式推广到三分解形式。概率矩阵分解(Probabilistic Matrix Factorization, PMF) [16] 模型是一种基于矩阵二分解的推荐方法，它将用户的评分矩阵 $X_{m \times n}$ 、用户特征因子矩阵 $U_{m \times r}$ 、项目特征因子矩阵 $V_{n \times r}$ 都看为随机变量，并且还基于两个前提，1) 用户特征因子和项目特征因子服从均值为0的高斯分布；2) 预测后的评分矩阵和真实值的误差也服从均值为0的高斯分布。它的损失函数为

$L o s s = \sum_{i = 1}^{m} \sum_{j = 1}^{n} I_{i, j} {(X_{i, j} - U_{i} V_{j}^{T})}^{2} + λ_{1} \sum_{i = 1}^{m} {‖ U_{i} ‖}_{F}^{2} + λ_{2} \sum_{j = 1}^{n} {‖ V_{j} ‖}_{F}^{2}$ (1)

其中 $I_{i, j}$ 为指示函数，若用户i对项目j打过分，则 $I_{i, j} = 1$ ，否则为0； $λ_{1}$ 、 $λ_{2}$ 为对应的正则化系数。

矩阵三分解模型的思想是将一个矩阵分解为三个低秩因子矩阵的乘积，即用三个低秩矩阵 $U_{m \times r}$ ， $S_{r \times r}$ ， $V_{n \times r}$ 相乘来近似表示原始矩阵 $X_{m \times n}$ ，其中r为分解的秩。在推荐系统中，U表示用户因子矩阵，其元素表示每一个用户对每个用户特征因子的隶属度；V表示项目因子矩阵，其元素表示每一个项目对每个项目特征因子的隶属度；S为特征矩阵，其每个元素表示每个用户特征因子对每个项目特征因子的偏好程度。

矩阵三分解的目标函数如下：

$\min_{U ， S ， V} L = ‖ X - U S V^{T} ‖$ (2)

针对单域数据稀疏和冷启动等问题，近年来学者们提出了跨域推荐概念 [17] ，跨域推荐是指借助于一个或多个源域的丰富数据信息，通过迁移学习的思想，将源域获得的有用知识迁移到目标域中，从而得到目标域中相比于传统单一领域推荐更为精确的推荐结果。

设 $X^{(1)} = {[x_{i, j}^{(1)}]}_{m \times n}, X^{(2)} = {[x_{i, j}^{(2)}]}_{k \times l} \in {ℝ^{+}, ?}$ 分别表示目标域和源域的评分矩阵。经典的联合矩阵分解

的协同过滤推荐系统(CMF)处理的是源域和目标域的项目完全重叠的情况，目标函数为

$J (U_{1}, U_{2}, V) = {‖ I_{1} \circ (X^{(1)} - U_{1} V^{T}) ‖}_{F}^{2} + {‖ I_{2} \circ (X^{(2)} - U_{2} V^{T}) ‖}_{F}^{2} + λ θ$ (3)

其中 $I_{i}$ 为缺失值指示矩阵， $U_{i}$ 为域的用户潜在因子，V为项目潜在因子，θ为正则化项用以防止过拟合。这里模型假设共享项目因子V并以此作为知识迁移的桥梁。后来Pan等 [18] 充分利用源域和目标域的用户和项目之间的关系，构造共享的潜在空间，通过矩阵的低秩三因子分解(TCF模型)实现知识的迁移，其模型为：

$J (U, V, B, \tilde{B}) = \frac{1}{2} {‖ I_{1} \circ (X^{(1)} - U B V^{T}) ‖}_{F}^{2} + \frac{λ}{2} {‖ I_{2} \circ (X^{(2)} - U \tilde{B} V^{T}) ‖}_{F}^{2} + λ θ$ (4)

$s . t . \begin{matrix} \end{matrix} U U^{T} = I, V V^{T} = I$

此模型基于用户和项目完全重叠的情况，同时共享了用户潜在因子U和项目潜在因子V，通过学习内部矩阵 $B$ , $\tilde{B}$ 分别来捕获各自域的数据特征，并加以正交约束迁移最有用的知识。但正交约束却难以满足非负性的要求。

本文拟在用户部分重叠的场景下，提出一种新的跨域推荐模型。

3. 新模型的提出

3.1. 问题描述

目前跨域推荐系统在缓解新系统冷启动中已经取得了显著的成效，但常见的推荐系统模型都是基于用户完全重叠、或者项目完全重叠的前提。此外，在以往的模型中，假设源域、目标域完全共享重叠的特征因子矩阵，即假设 $U^{(1)} = U^{(2)}$ 或者 $V^{(1)} = V^{(2)}$ ，但这样的假设过强，且会丢失每个域中独有的特征信

息。因此本文提出了应用于部分用户重叠的推荐场景。设 $X^{(1)} = {[x_{i, j}^{(1)}]}_{(n_{0} + n_{1}) \times m_{1}}$ 表示目标域评分矩阵， $X^{(2)} = {[x_{i, j}^{(2)}]}_{(n_{0} + n_{2}) \times m_{2}}$ 表示源域的评分矩阵，这里约定只有部分用户重叠，其重叠数目为 $n_{0}$ 。我们的目的

是挖掘源域和目标域之间的隐式特征，通过联合矩阵分解的协同过滤模型以实现域间知识的迁移；在两个域进行信息共享的同时，保留每个域特有的特征，并将信息利用最大化，过程可见图1。

3.2. CFCDRMB模型

在用户部分重叠的情形下，本文提出一种新的跨域推荐模型：基于矩阵分块技巧的协同过滤跨域推荐(A Collaborative Filtering Cross-Domain Recommendation Based on Matrix Blocking Technique, CFCDRMB)。新模型的损失函数如公式(5)：

$\begin{array}{l} L = {‖ X^{(1)} - (\begin{matrix} U^{(0)} \\ U^{(1)} \end{matrix}) S^{(1)} V^{(1)} ‖}^{(2)} + {‖ X^{(2)} - (\begin{matrix} U^{(0)} \\ U^{(2)} \end{matrix}) S^{(2)} V^{(2)} ‖}^{(2)} + λ_{1} {‖ S^{(1)} - S^{(2)} ‖}^{^{(2)}} \\ + λ_{2} {‖ U^{(0)} ‖}^{(2)} + λ_{3} {‖ U^{(1)} ‖}^{(2)} + λ_{4} {‖ U^{(2)} ‖}^{(2)} + λ_{5} {‖ V^{(1)} ‖}^{(2)} + λ_{6} {‖ V^{(2)} ‖}^{(2)} \end{array}$ (5)

$s . t . U^{(0)} \geq 0, U^{(1)} \geq 0, U^{(2)} \geq 0, V^{(1)} \geq 0, V^{(2)} \geq 0, S^{(1)} \geq 0, S^{(2)} \geq 0$

其中 $U^{(0)} = {[u_{i, k}^{(0)}]}_{n_{0} \times r}$ ，为两个域共享的特征因子， $U^{(1)} = {[u_{i, k}^{(1)}]}_{n_{1} \times r}$ ， $U^{(2)} = {[u_{i, k}^{(2)}]}_{n_{2} \times r}$ 为保留的两个域特有的特征因子， $V^{(1)} = {[v_{l, j}^{(1)}]}_{d \times m_{1}}$ ， $V^{(2)} = {[v_{l, j}^{(2)}]}_{d \times m_{2}}$ 分别表示两个域的项目因子矩阵， $S^{(1)} = {[s_{k, l}^{(1)}]}_{r \times d}$ 、 $S^{(2)} = {[s_{k, l}^{(2)}]}_{r \times d}$

表示两个域中用户特征对项目特征的偏好程度，这里 $n_{0}$ 、 $n_{1}$ 、 $n_{2}$ 分别表示共享用户特征因子的个数、目标域特有用户特征因子的个数、源域特有用户特征因子的个数， $m_{1}$ 、 $m_{2}$ 分别表示项目特征因子个数，r为用户特征因子个数，d为项目特征因子个数。两个域的用户特征潜在因子可用分块矩阵表示为

$U^{(01)} = (\begin{matrix} U^{(0)} \\ U^{(1)} \end{matrix}), U^{(02)} = (\begin{matrix} U^{(0)} \\ U^{(2)} \end{matrix})$ 。

$λ_{i}$ 表示正则化系数，其中 $i = 1, 2, 3, 4, 5, 6$ 。模型中第一项为目标域的重构误差项，第二项为源域的重构误差项，第三项用来学习跨域间特征的相似性，其余项为正则项以防止模型过拟合。为了提高推荐的高效性，要求源域、目标域的特征分类尽可能相似，因此在损失函数中，就要求 $S^{(1)}$ 、 $S^{(2)}$ 尽可能接近。

3.3. 优化算法

跨域推荐模型本质是一个最小化的优化问题，即让损失函数(5)最小化，但模型有非负性的约束，用梯度下降法是一种较好的策略，这里我们拟采用随机梯度下降法和交替更新规则优化模型。首先，将目标函数(5)按元素展开：

$\begin{array}{l} L = {\sum_{i = 1}^{n_{0} + n_{1}} \sum_{j = 1}^{m_{1}} (x_{i, j}^{(1)} - \sum_{k = 1}^{r} \sum_{l = 1}^{d} u_{i, k}^{(01)} s_{k, l}^{(1)} v_{l, j}^{(1)})}^{2} + {\sum_{i = 1}^{n_{0} + n_{2}} \sum_{j = 1}^{m_{2}} (x_{i, j}^{(2)} - \sum_{k = 1}^{r} \sum_{l = 1}^{d} u_{i, k}^{(02)} s_{k, l}^{(2)} v_{l, j}^{(2)})}^{2} + λ_{1} \sum_{k = 1}^{r} \sum_{l = 1}^{d} {(s_{k, l}^{(1)} - s_{k, l}^{(2)})}^{2} \\ + λ_{2} \sum_{i = 1}^{n_{0}} \sum_{k = 1}^{r} u_{i, k}^{{(0)}^{2}} + λ_{3} \sum_{i = 1}^{n_{1}} \sum_{k = 1}^{r} u_{i, k}^{{(1)}^{2}} + λ_{4} \sum_{i = 1}^{n_{2}} \sum_{k = 1}^{r} u_{i, k}^{{(2)}^{2}} + λ_{5} \sum_{l = 1}^{d} \sum_{j = 1}^{m_{1}} v_{l, j}^{{(1)}^{2}} + λ_{6} \sum_{l = 1}^{d} \sum_{j = 1}^{m_{2}} v_{l, j}^{{(2)}^{2}} \end{array}$ (6)

Figure 1. CFCDRMB model

图1. CFCDRMB模型

根据拉格朗日乘子法，等式(6)中分别对 $U^{(0)}$ 、 $U^{(1)}$ 、 $U^{(2)}$ 、 $S^{(1)}$ 、 $S^{(2)}$ 、 $V^{(1)}$ 、 $V^{(2)}$ 的各元素求偏导数得到：

$\frac{\partial L}{\partial s_{k, l}^{(1)}} = - 2 (\sum_{i = 1}^{n_{0} + n_{1}} \sum_{j = 1}^{m_{1}} [(x_{i, j}^{(1)} - u_{i, k}^{(01)} s_{k, l}^{(1)} v_{l, j}^{(1)}) (u_{i, j}^{(01)} v_{l, j}^{(1)})] + λ_{1} (s_{k, l}^{(1)} - s_{k, l}^{(2)}))$ (7)

$\frac{\partial L}{\partial s_{k, l}^{(2)}} = - 2 (\sum_{i = 1}^{n_{0} + n_{2}} \sum_{j = 1}^{m_{2}} [(x_{i, j}^{(2)} - u_{i, k}^{(02)} s_{k, l}^{(2)} v_{l, j}^{(2)}) (u_{i, j}^{(02)} v_{l, j}^{(2)})] - λ_{1} (s_{k, l}^{(1)} - s_{k, l}^{(2)}))$ (8)

$\frac{\partial L}{\partial u_{i, k}^{(0)}} = - 2 (\sum_{j = 1}^{m_{1}} [(x_{i, j}^{(1)} - \sum_{l = 1}^{d} u_{i, k}^{(0)} s_{k, l}^{(1)} v_{l, j}^{(1)}) (\sum_{l = 1}^{d} s_{k, l}^{(1)} v_{l, j}^{(1)})] + \sum_{j = 1}^{m_{2}} [(x_{i, j}^{(2)} - \sum_{l = 1}^{d} u_{i, k}^{(0)} s_{k, l}^{(2)} v_{l, j}^{(2)}) (\sum_{l = 1}^{d} s_{k, l}^{(2)} v_{l, j}^{(2)})] + λ_{2} u_{i, k}^{(0)})$ (9)

$\frac{\partial L}{\partial u_{i, k}^{(1)}} = - 2 (\sum_{j = 1}^{m_{1}} [(x_{i, j}^{(1)} - \sum_{l = 1}^{d} u_{i, k}^{(1)} s_{k, l}^{(1)} v_{l, j}^{(1)}) (\sum_{l = 1}^{d} s_{k, l}^{(1)} v_{l, j}^{(1)})] + λ_{3} u_{i, k}^{(1)})$ (10)

$\frac{\partial L}{\partial u_{i, k}^{(2)}} = - 2 (\sum_{j = 1}^{m_{2}} [(x_{i, j}^{(2)} - \sum_{l = 1}^{d} u_{i, k}^{(2)} s_{k, l}^{(2)} v_{l, j}^{(2)}) (\sum_{l = 1}^{d} s_{k, l}^{(2)} v_{l, j}^{(2)})] + λ_{4} u_{i, k}^{(2)})$ (11)

$\frac{\partial L}{\partial v_{l, j}^{(1)}} = - 2 (\sum_{i = 1}^{n_{0} + n_{1}} [(x_{i, j}^{(1)} - \sum_{k = 1}^{r} u_{i, k}^{(01)} s_{k, l}^{(1)} v_{l, j}^{(1)}) (\sum_{k = 1}^{r} u_{i, k}^{(01)} s_{k, l}^{(1)})] + λ_{5} v_{l, j}^{(1)})$ (12)

$\frac{\partial L}{\partial v_{l, j}^{(2)}} = - 2 (\sum_{i = 1}^{n_{0} + n_{2}} [(x_{i, j}^{(2)} - \sum_{k = 1}^{r} u_{i, k}^{(02)} s_{k, l}^{(2)} v_{l, j}^{(2)}) (\sum_{k = 1}^{r} u_{i, k}^{(02)} s_{k, l}^{(2)})] + λ_{6} v_{l, j}^{(2)})$ (13)

则 $U^{(0)}$ 、 $U^{(1)}$ 、 $U^{(2)}$ 、 $S^{(1)}$ 、 $S^{(2)}$ 、 $V^{(1)}$ 、 $V^{(2)}$ 的更新公式为：

$u_{i, k}^{(0)} \leftarrow u_{i, k}^{(0)} - α \frac{\partial L}{\partial u_{i, k}^{(0)}}$ (14)

$u_{i, k}^{(1)} \leftarrow u_{i, k}^{(1)} - α \frac{\partial L}{\partial u_{i, k}^{(1)}}$ (15)

$u_{i, k}^{(2)} \leftarrow u_{i, k}^{(2)} - α \frac{\partial L}{\partial u_{i, k}^{(2)}}$ (16)

$s_{k, l}^{(1)} \leftarrow s_{k, l}^{(1)} - α \frac{\partial L}{\partial s_{k, l}^{(1)}}$ (17)

$s_{k, l}^{(2)} \leftarrow s_{k, l}^{(2)} - α \frac{\partial L}{\partial s_{k, l}^{(2)}}$ (18)

$v_{l, j}^{(1)} \leftarrow v_{l, j}^{(1)} - α \frac{\partial L}{\partial v_{l, j}^{(1)}}$ (19)

$v_{l, j}^{(2)} \leftarrow v_{l, j}^{(2)} - α \frac{\partial L}{\partial v_{l, j}^{(2)}}$ (20)

其中 $α$ 为步长。为了保证非负性 [19] ，在每一次迭代中， $θ = \max (0, θ)$ ，其中 $θ \in {s_{k, l}^{(1)}, s_{k, l}^{(2)}, u_{i, k}^{(0)}, u_{i, k}^{(1)}, u_{i, k}^{(2)}, v_{l, j}^{(1)}, v_{l, j}^{(2)}}$ 。求解新模型的优化算法具体步骤可见算法1。

算法1：最小化损失函数的优化算法

输入：目标域评分矩阵 $X_{1}$ 、源域评分矩阵 $X_{2}$ 、用户潜在因子个数r、项目潜在因子个数d、正则化系数 $λ_{i}$ 、阈值 $ε$ 、最大迭代次数 $s t e p$

初始化： $U^{(0)}$ 、 $U^{(1)}$ 、 $U^{(2)}$ 、 $S^{(1)}$ 、 $S^{(2)}$ 、 $V^{(1)}$ 、 $V^{(2)}$ 、 $t = 0$

While not converge and $t < s t e p$ ：

1) 通过公式(7)~(13)得到梯度

2) 通过公式(14)~(20)得到更新后的 $U^{(0)}$ 、 $U^{(1)}$ 、 $U^{(2)}$ 、 $S^{(1)}$ 、 $S^{(2)}$ 、 $V^{(1)}$ 、 $V^{( 2 )}$

3) $t + = 1$

4) 计算 ${\hat{X}}^{(1)} = (\begin{matrix} U^{(0)} \\ U^{(1)} \end{matrix}) S^{(1)} V^{( 1 )}$

5) End

6) 输出： ${\hat{X}}^{( 1 )}$

4. 实验

4.1. 数据集与数据预处理

本文使用了真实数据集亚马逊评论数据集(Amazon review data)中的数据进行实验，Amazon数据集 [20] 来源于Amazon购物网站，记录了用户对商品的评价，是推荐系统的经典数据集。实验中选取了Movie、Book、Music三个域的数据，对于三个域的相关数据描述如表1。

首先对数据进行预处理，去除数据集中对项目评分少于5个的用户信息，并在处理后的数据中，随机选择600个用户、5000个项目，三个域有100个重叠用户，并且Movie、Book、Music三个域的稀疏度分别为99.9%、98.4%和98%，以此形成部分用户重叠的跨域推荐场景。

Table 1. Amazon dataset information description

表1. Amazon数据集信息描述

此外，本文还将数据进行了Min-Max标准化，将初始评分映射到[0, 1]区间内，标准化规则如下：

$X_{i, j} = \frac{X_{i, j} - \min (X_{i, j})}{\max (X_{i, j}) - \min (X_{i, j})}$

4.2. 评价指标

本文采用均方根误差(RMSE)和平均绝对误差(MAE)来衡量推荐的有效性，定义如下：

$R M S E = \sqrt{\frac{1}{N} \sum_{i, j} {(x_{i, j} - {\hat{x}}_{i, j})}^{2}}$

$M A E = \frac{1}{N} \sum_{i, j} | x_{i, j} - {\hat{x}}_{i, j} |$

其中N为评分个数， ${\hat{x}}_{i, j}$ 为预测值， $x_{i, j}$ 为实际值，RMSE和MAE数值越小，推荐效果越好。

4.3. 对比方法

本文选用两个单域模型和两个跨域模型进行对比实验，以验证新模型算法的优越性。

1) 概率矩阵分解PMF模型(Probabilistic Matrix Factorization)是用于单域上的推荐方法。

2) 奇异值分解模型(Singular Value Decomposition, SVD)是经典的矩阵分解方法，可用于单域推荐。

3) 基于HISF [21] 的推荐模型(Hidden Implicit Similarities for Cross-Domain Recommendation)是一种较新的跨域推荐方法。

4) 基于CBT的推荐模型(Codebook Transfer)是一种用于用户、项目均不重叠的跨域推荐方法，它的思想是，源域目标域之间存在一定共性，即评分模式，因此可以将在源域上通过正交非负矩阵分解 [22] 学习到的codebook矩阵迁移到目标域中，通过与目标域进行比对，填补目标域评分矩阵，从而实现跨域推荐。

4.4. 实验结果与分析

本文分别在3个数据集上进行了三组跨域推荐实验，如表2所示。3组实验结果如表3~5所示，且已将每组实验的RMSE和MAE最小值标黑。

从表3~5的结果可以发现，相较于单域推荐方法和其他的跨域推荐方法而言，CFCDRMB拥有更好的推荐性能。3组实验中，与经典的单域推荐方法PMF、SVD相比，本文所提出的CFCDRMB可以提升大约45%、13%、11%的性能，由此可知，当源域数据稀疏时，利用其他域的数据可以有效的提升目标域的推荐能力；与跨域推荐方法HISF、CBT相比，CFCDRMB可以提升大约70%、73%、72%的性能，虽然HISF、CBT两种方法都是跨域推荐方法，但由于它们都存在一定的使用场景限制，所以将它们用于部分用户重叠的全新场景时，推荐性能便会大幅度下降。同时，根据HISF的均方根误差均小于CBT这一结果来看，相较于两个域完全不同，当源域和目标域存在重叠部分时，目标域的推荐更好，即可以用于帮助目标域进行推荐的数据更加有效。

Table 2. Experimental group

表2. 实验组别

Table 3. RMSE of recommendation on Movie

表3. 对Movie进行推荐的RMSE

Table 4. RMSE of recommendation on Book

表4. 对Book进行推荐的RMSE

Table 5. RMSE of recommendation on Music

表5. 对Music进行推荐的RMSE

此外，由于要使两个域的用户、项目特征尽可能相似，所以正则化系数 $λ_{1}$ 对于模型有很大的影响；用户特征个数r以及项目特征个数d的取值也会影响到推荐性能，如果r和d取值过大，便可能会导致过拟合现象，所以确定合适的取值也有着很大的意义。

因此，除了以上实验，本文还针对模型中的三个重要的参数：正则化系数 $λ_{1}$ 、用户特征个数r以及项目特征个数d进行了实验，目的是为了查看参数对模型推荐效果的影响。实验结果如图2、图3以及图4所示。

Figure 2. Effect of $λ_{1}$ value on RMSE

图2. $λ_{1}$ 取值对模型RMSE的影响

Figure 3. Effect of the number of user features r on RMSE

图3. 用户特征个数r对模型RMSE的影响

Figure 4. Effect of the number of item features d on RMSE

图4. 项目特征个数d对模型RMSE的影响

由实验结果可以看出， $λ_{1}$ 、r和d均对推荐效果产生了一定的影响，其均方根误差的趋势总体呈现出先下降再上升。当 $λ_{1}$ 取0.4，r取50，d取20时，CFCDRMB的RMSE最小，模型的损失最小，此时推荐效果最好。

最后，本文还对模型进行了收敛性分析，3组实验的收敛结果如图5所示。实验结果可以证明，3组实验中，本文提出的模型均收敛，并且每组实验都在迭代200次左右开始收敛。

Figure 5. Convergence of RMSE when recommending Movie, Book and Music

图5. 对Movie、Book和Music进行推荐时，RMSE的收敛性图

5. 结论

本文提出了一个适用于部分用户重叠的跨域推荐模型，它在传统的矩阵三分解模型的基础之上，利用矩阵分块技巧，保留了每个域所特有的特征信息，让数据得到了更加充分的利用。本文在3个稀疏数据集上进行了实验，实验结果也表明，在原数据集稀疏的情况下，充分利用已有的数据信息可以使得模型的推荐效果更好。同时，从实验结果可以看出，该模型还有效缓解了部分用户重叠场景下的跨域推荐问题；通过和其他推荐模型相比较，本文所提出的模型具有更好的推荐性能，在现有的推荐模型基础上都有了一定程度的提升。最后，新模型的优化过程也是收敛的。但本文在模型求解最优解时，使用的仍然是传统机器学习中的随机梯度下降算法，该算法效率较低。未来的工作将研究更新算法，进一步提高推荐算法的速度效能。

文章引用

姜树媛,胡建华,王新利. 一种基于矩阵分块技巧的协同过滤跨域推荐
A Collaborative Filtering Cross-Domain Recommendation Based on Matrix Blocking Technique[J]. 建模与仿真, 2023, 12(03): 2091-2101. https://doi.org/10.12677/MOS.2023.123192

参考文献

1. Zhang, S., Yao, L., Sun, A. and Tai, Y. (2019) Deep Learning Based Recommender System: A Survey and New Perspectives. ACM Computing Surveys (CSUR), 1, Article 1.

2. Batmaz, Z., Yurekli, A., Bilge, A. and Kaleli, C. (2018) A Review on Deep Learning for Recommender Systems: Challenges and Remedies. Artificial Intelligence Review, 52, 1-37. https://doi.org/10.1007/s10462-018-9654-y

3. Palma, F., Farzin, H., Guéhéneuc, Y.-G. and Moha, N. (2012) Recom-mendation System for Design Patterns in Software Development: An DPR Overview. Proceedings of 2012 Third International Workshop on Recommendation Systems for Software Engineering (RSSE), Zurich, 4 June 2012, 1-5. https://doi.org/10.1109/RSSE.2012.6233399

4. 赵岩, 刘宏伟. 推荐系统综述[J]. 智能计算机与应用, 2021, 11(7): 228-233.

5. Gomez-Uribe, C.A. and Hunt, N. (2016) The Netflix Recommender System: Algorithms, Business Value and Innovation. ACM Transactions on Management Information Systems (TMIS), 6, Article No. 13. https://doi.org/10.1145/2843948

6. He, X., Liao, L., Zhang, H., et al. (2017) Neural Collaborative Filtering. Proceed-ings of the 26th International Conference on World Wide Web, Perth, 3-7 April 2017, 173-182. https://doi.org/10.1145/3038912.3052569

7. Embarak, O.H. (2011) A Method for Solving the Cold Start Problem in Recommendation Systems. Proceedings of 2011 International Conference on Innovations in Information Technology, Abu Dhabi, 25-27 April 2011, 238-243. https://doi.org/10.1109/INNOVATIONS.2011.5893824

8. Hawashin, B., Alzubi, S., Mughaid, A., Fotouhi, F. and Abusukhon, A. (2020) An Efficient Cold Start Solution for Recommender Systems Based on Machine Learning and User In-terests. Proceedings of 2020 Seventh International Conference on Software Defined Systems (SDS), Paris, 20-23 April 2020, 220-225. https://doi.org/10.1109/SDS49854.2020.9143953

9. Teng, W., Wang, N., Shi, H., Liu, Y. and Wang, J. (2020) Classi-fier-Constrained Deep Adversarial Domain Adaptation for Cross-Domain Semisupervised Classification in Remote Sensing Images. IEEE Geoscience and Remote Sensing Letters, 17, 789-793. https://doi.org/10.1109/LGRS.2019.2931305

10. Jianjun, M. (2020) Research on Collaborative Filtering Recommenda-tion Algorithm Based on User Behavior Characteristics. Proceedings of 2020 International Conference on Big Data & Artificial Intelligence & Software Engineering (ICBASE), Bangkok, 30 October-1 November 2020, 425-428. https://doi.org/10.1109/ICBASE51474.2020.00096

11. Wang, X., Zhong, Y., Zhang, L. and Xu, Y. (2017) Spatial Group Sparsity Regularized Nonnegative Matrix Factorization for Hyperspectral Unmixing. IEEE Transactions on Geoscience and Remote Sensing, 55, 6287-6304. https://doi.org/10.1109/TGRS.2017.2724944

12. Shao, L., Zhu, F. and Li, X. (2015) Transfer Learning for Visual Cate-gorization: A Survey. IEEE Transactions on Neural Networks and Learning Systems, 26, 1019-1034. https://doi.org/10.1109/TNNLS.2014.2330900

13. Salam, F.M.A. (1990) New Artificial Neural Net Models: Basic The-ory and Characteristics. Proceedings of IEEE International Symposium on Circuits and Systems, New Orleans, 1-3 May 1990, 200-203.

14. Feng, A., Zhang, X. and Song, X. (2022) Unrestricted Attention May Not Be All You Need—Masked Attention Mechanism Focuses Better on Relevant Parts in Aspect-Based Sentiment Analysis. IEEE Access, 10, 8518-8528. https://doi.org/10.1109/ACCESS.2022.3142178

15. Singh, A.P. and Gordon, G.J. (2008) Relational Learning via Col-lective Matrix Factorization. Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Las Vegas, 24-27 August 2008, 650-658. https://doi.org/10.21236/ADA486804

16. Ma, W., Wu, Y., Gong, M., Qin, C. and Wang, S. (2017) Local Probabilistic Matrix Factorization for Personal Recommendation. Proceedings of 2017 13th International Conference on Computational Intelligence and Security (CIS), Hong Kong, 15-18 December 2017, 97-101. https://doi.org/10.1109/CIS.2017.00029

17. He, J., Liu, R., Zhuang, F., Lin, F., Niu, C. and He, Q. (2018) A General Cross-Domain Recommendation Framework via Bayesian Neural Network. Proceedings of 2018 IEEE International Conference on Data Mining (ICDM), Singapore, 17-20 November 2018, 1001-1006. https://doi.org/10.1109/ICDM.2018.00125

18. Pan, W. and Yang, Q. (2013) Transfer Learning in Heterogeneous Col-laborative Filtering Domains. Artificial Intelligence, 197, 39-55. https://doi.org/10.1016/j.artint.2013.01.003

19. Zhu, N. and Cao, J. (2020) Enhancing Cross-Domain Recommendation through Preference Structure Information Sharing. Proceedings of 2020 IEEE International Conference on Web Services (ICWS), Beijing, 19-23 October 2020, 524-531. https://doi.org/10.1109/ICWS49710.2020.00076

20. Ni, J., Li, J. and McAuley, J. (2019) Justifying Recommendations Using Distantly-Labeled Reviews and Fined-Grained Aspects. Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP), Hong Kong, 3-7 November 2019, 188-197.

21. Do, Q., Liu, W., Fan, J. and Tao, D. (2021) Unveiling Hidden Implicit Simi-larities for Cross-Domain Recommendation. IEEE Transactions on Knowledge and Data Engineering, 33, 302-315. https://doi.org/10.1109/TKDE.2019.2923904

22. Ding, C., Li, T., Peng, W. and Park, H. (2006) Orthogonal Nonnega-tive Matrix Tri-Factorizations for Clustering. Proceedings of the 12th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Philadelphia, 20-23 August 2006, 126-135. https://doi.org/10.1145/1150402.1150420

NOTES

^*通讯作者。

期刊菜单