﻿ 基于RFMF模型和K-Means方法的公募基金用户精细化营销 Meticulous Marketing of Mutual Fund Customers Based on RFMF Model and K-Means Method

Finance
Vol. 09  No. 06 ( 2019 ), Article ID: 32824 , 7 pages
10.12677/FIN.2019.96070

Meticulous Marketing of Mutual Fund Customers Based on RFMF Model and K-Means Method

Xianlin Huang

School of Information Technology & Management, University of International Business and Economics, Beijing

Received: Oct. 15th, 2019; accepted: Oct. 30th, 2019; published: Nov. 6th, 2019

ABSTRACT

With the rapid development of Internet technology, Internet channels have become the key sales channels for mutual fund companies. Meticulous marketing is critical to reduce costs and improve operational efficiency. Facing customers with huge financial potential growing up with the Internet, how to effectively distinguish them and implement meticulous marketing strategies for different types of customers is an urgent problem for the companies. This paper proposed an improved RFM model, which measures customer value from three dimensions of recency, frequency and management fee, and grouped users through K-Means algorithm. The model was verified by using the historical data of a certain fund company’s product, and five clusters were obtained. Based on the characteristics of users in the five clusters, targeted marketing strategies were proposed.

Keywords:RFM Model, Customer Clustering, Meticulous Fund Marketing

1. 引言

2. 模型和方法

2.1. RFMF模型

RFM模型是一种重要的客户响应分析方法 [3] [4]，该模型通过用户的最近购买的时间R、购买频率F以及购买的金额M三项指标来衡量用户的价值水平。RFM模型较为动态地层示了一个客户的基本行为特征轮廓，这对个性化的服务和营销提供了依据。但由于基金产品的特殊性，购买的金额不能较为全面表示用户的价值，因此，本文将购买金额改变为用户购买的金额与持有时长的乘积，得到了RFMF模型。

$\stackrel{¯}{A}=\left[\begin{array}{ccc}{w}_{r}/{w}_{r}& {w}_{r}/{w}_{f}& {w}_{r}/{w}_{m}\\ {w}_{f}/{w}_{r}& {w}_{f}/{w}_{f}& {w}_{f}/{w}_{m}\\ {w}_{m}/{w}_{r}& {w}_{m}/{w}_{f}& {w}_{m}/{w}_{m}\end{array}\right]$

$\stackrel{¯}{A}\cdot W=\left[\begin{array}{ccc}{w}_{r}/{w}_{r}& {w}_{r}/{w}_{f}& {w}_{r}/{w}_{m}\\ {w}_{f}/{w}_{r}& {w}_{f}/{w}_{f}& {w}_{f}/{w}_{m}\\ {w}_{m}/{w}_{r}& {w}_{m}/{w}_{f}& {w}_{m}/{w}_{m}\end{array}\right]\cdot \left[\begin{array}{c}{w}_{r}\\ {w}_{f}\\ {w}_{m}\end{array}\right]=3\left[\begin{array}{c}{w}_{r}\\ {w}_{f}\\ {w}_{m}\end{array}\right]$

$\text{RFMF}_\text{score}=0.08*\text{R}+0.19*\text{F}+0.73*\text{MF}$ (1)

Figure 1. 1-9 Marking and comparing matrix

2.2. K均值聚类方法

“K均值”这一词最早由麦奎因(1967) [6] 提出，但本算法思想可以追溯到1957年，斯坦豪斯(1957) [7] 、劳埃德(1957) [8] 分别在各自的研究领域独立提出来的思想，这一思想在空间聚类分析种应用广泛。简单、高效、成功的应用案例和经验，是其出现数十年后，仍然广为使用的最重要的原因。该算法最常见的形式是采用被称为劳埃德算法(Lloydalgorithm)的迭代式改进探索法。算法首先把输入点分成k个初始化分组，可以是随机的或者使用一些启发式数据。然后计算每组的中心点，根据中心点的位置把对象分到离它最近的中心，重新确定分组。继续重复不断地计算中心并重新分组，直到收敛，即对象不再改变分组。

3. 实验

3.1. 数据集

3.2. 数据处理

3.3. 聚类个数选择

K均值算法的第一步是确定聚类的个数，生成K个质心。确定聚类个数的常用方法包括肘部法则 [9] [10] 和CH指标 [11]。肘部法则是指：根据数据的潜在模式，当设定的聚类个数不断逼近真实聚类个数时，均方误差呈现快速下降态势，而当设定聚类个数超过真实聚类个数时，均方误差也会继续下降，但下降速度会趋于平缓。通过画出K-均方误差曲线，找出下降途中的拐点，即可较好的确定K值，如图2，可知K最优值为5。

Figure 2. K-SSE curve

CH指标通过计算类中各点与类中心的距离平方和来度量类内的紧密度，通过计算各类中心点与数据集中心点距离平方和来度量数据集的分离度，CH指标由分离度与紧密度的比值得到，因此，CH越大代表着类自身越紧密，类与类之间越分散，即更优的聚类结果。画出K-CH值曲线，如图3可知，K的最优取值为5。两种K值确定方法都说明K取值为5为最优情况，因此，确定为5个聚类。

Figure 3. K-CH curve

4. 实验结果分析

Table 1. RFMF clustering result

(1) 聚类一中的用户，总体价值较高，人均累计申购16,429.22元，带来的管理费人均13.38元，较高，但上次申购距今人均超过211天，近期不够活跃。

(2) 聚类二中的用户属于一般挽留用户，用户数量最多，但用户价值最低，RFMF评分仅有2.53，最近一次申购时间平均超过了214天，人均累计申购580元，管理费人均0.16元，活跃时间也很久远，用户留存率最低，总体来说用户带来的效益很低。

(3) 聚类四中的用户是重点发展客户，RFMF评分高，相对来讲近期比较活跃，最近一次申购行为距今仅150天左右，人均管理费方面也达到了14.61元，用户留存率超过60%，但申购频次比较低，具有成为高净值的发展潜力。

(4) 聚类五中的用户是重要价值用户，用户十分活跃，最近一次申购距今天数距今平均在38天左右，而人均购买频次超过18次，其中超过一般的用户的申购频次都在10次以上。用户带来的管理费方面，人均管理费达到了29.86元，是5个用户群体中最高的。这类用户群体是基金公司的高价值客户，也是基金公司重点保持的优质客户，为公司带来的经济效益最高，但实际用户比例却很低。

5. 研究局限与未来展望

5.1. 研究局限

1、限于数据来源，只运用了一只基金产品的申赎数据，对用户价值的概括较为片面。

2、本研究从事后的角度，研究了已经有过购买行为的用户对于基金公司的价值，对于新用户，本方法会有冷启动问题，无法衡量用户价值，并加以区分。

5.2. 未来展望

1、在丰富数据类型角度，一方面，可选择用户购买的所有产品的数据，而不仅限于一只产品，可以更加全面、准确地衡量用户的价值以及用户的偏好，并为其提供相应的营销策略。另一方面，可以增加用户个人信息，如用户所述地区、用户收入水平、用户年龄等，帮助刻画用户特征，事前衡量用户价值，解决冷启动问题。

2、模型优化角度，在本文模型的指标权重确定的方法上，采用的是专家打分和层次分析法，定性和定量的方法相结合，但总体来说难以避免专家个人主观因素的影响，缺乏客观性。未来的研究方向上，可以改进指标权重的确定方式，更加客观地优化各指标权重的赋值方式，增强客观性。

Meticulous Marketing of Mutual Fund Customers Based on RFMF Model and K-Means Method[J]. 金融, 2019, 09(06): 634-640. https://doi.org/10.12677/FIN.2019.96070

1. 1. 裴蕾. 新形势下我国开放式基金营销策略研究[J]. 内蒙古科技与经济, 2017(7): 25.

2. 2. 邹定斌,宁娇丽. 我国证券投资基金营销现状与市场精细化营销对策[J]. 湖南科技大学学报(社会科学版), 2005, 8(1): 86-89.

3. 3. Cohen, M.D. (2004) Exploiting Response Models—Optimizing Cross-Sell and Up-Sell Opportunities in Banking. Information Systems, 29, 327-341. https://doi.org/10.1016/j.is.2003.08.001

4. 4. Miglautsch, J. (2000) Thoughts on RFM Scoring. The Journal of Database Marketing, 8, 35-43. https://doi.org/10.1055/s-2000-11239

5. 5. 和金生, 赵焕臣, 杜秀珍. 用层次分析法探讨科研成果的综合评价[J]. 系统工程理论与实践, 1985(1): 33-38.

6. 6. Macqueen, J. (1965) Some Methods for Classification and Analysis of Mul-ti-Variate Observations. Proceedings of Berkeley Symposium on Mathematical Statistics & Probability, Berkeley, June 21-July 18, 1965, 281-297.

7. 7. Steinhaus, H. (1956) Sur la division des corpmaterielsen parties. Bulletin L’Académie Polonaise des Science, 1, 801.

8. 8. Lloyd, S.P. (1957) Least Square Quantization in PCM. Bell Telephone Laboratories Paper. Published in Journal Much Later: Lloyd, SP (1982) Least Squares Quantization in PCM. IEEE Transactions on Information Theory, 28, 129-137.

9. 9. 李永森, 杨善林, 马溪骏, 等. 空间聚类算法中的K值优化问题研究[J]. 系统仿真学报, 2006, 18(3): 573-576.

10. 10. 王千, 王成, 冯振元, 叶金凤. K-Means聚类算法研究综述[J]. 电子设计工程, 2012, 20(7): 21-24.

11. 11. Calinski, T. and Harabasz, J. (1974) A Dendrite Method for Cluster Analysis. Communications in Statistics, 3, 1-27. https://doi.org/10.1080/03610927408827101