众包商业模式下的任务定价方案研究 Research on Mission Pricing Scheme under Crowdsourcing Business Model

doi:10.12677/MM.2018.82020

Modern Management
Vol.08 No.02(2018), Article ID:24483,10 pages
10.12677/MM.2018.82020

Research on Mission Pricing Scheme under Crowdsourcing Business Model

Xiaoying Fu¹, Rui Feng²

●How to Cite this Article

¹College of Mathematics and System Science, Shandong University of Science and Technology, Qingdao Shandong

²Shandong University of Science and Technology, Qingdao Shandong

Received: Apr. 3^rd, 2018; accepted: Apr. 17^th, 2018; published: Apr. 24^th, 2018

ABSTRACT

This paper studies the self-service crowdsourcing platform of mobile Internet, and establishes the task pricing model based on multivariate linear regression model. Compared with the original plan, the completion rate of the improved model reached 67.305%, which was significantly higher than 62.395% of the original plan. And the overall relative reduction of mission expenditure, optimization effect is better. According to the analysis of the task “package release”, we carried out the simulation based on the principle of support vector machine (SVM). On the basis of the second problem, the rules of packing are added, and the rules of simulation are changed, thus introducing the idea of greedy algorithm to establish the packing mechanism to improve the pricing scheme established before. After solving, in the improved model, the task completion rate increased to 72.302%, and the overall task is completed better. This article involves the data from the National Undergraduate Mathematical Contest 2017 Modeling B questions.

Keywords:Multiple Linear Regression, Support Vector Machine, Greedy Algorithm, Simulation, Punishment Mechanism

众包商业模式下的任务定价方案研究

付晓莹¹，冯睿²

¹数学与系统科学学院，山东科技大学，山东青岛

²山东科技大学，山东青岛

收稿日期：2018年4月3日；录用日期：2018年4月17日；发布日期：2018年4月24日

摘要

本文对移动互联网的自助式劳务众包平台进行研究，建立了基于多元线性回归模型下的任务定价模型。与原方案进行对比，改进后模型的任务完成率达到67.305%，相对于原方案的62.395%有了明显提高，并且任务相对支出整体上降低，优化效果较好。进一步，根据对任务“打包发布”方式的分析，进行了基于支持向量机样本分类原理下的仿真模拟，在问题二的基础上添加打包规则、更改仿真规则，并且引入贪心算法的思想建立打包机制，改进之前建立的定价方案。经求解，得出改进后的模型中，任务完成率提高到72.302%，整体任务完成情况较好。本文所涉及数据来自于2017年全国大学生数学建模竞赛B题。

关键词 :多元线性回归，支持向量机，贪心算法，仿真模拟，惩罚机制

This work is licensed under the Creative Commons Attribution International License (CC BY).

http://creativecommons.org/licenses/by/4.0/

1. 引言

“拍照赚钱”是移动互联网下的一种自助式服务模式。用户下载APP，注册成为APP的会员，然后从APP上领取需要拍照的任务(比如上超市去检查某种商品的上架情况)，赚取APP对任务所标定的酬金。这种基于移动互联网的自助式劳务众包平台，为企业提供各种商业检查和信息搜集，相比传统的市场调查方式可以大大节省调查成本，而且有效地保证了调查数据真实性，缩短了调查的周期。APP作为平台运行的核心，其中的任务定价是核心要素。假如定价不合理，有的任务就会无人问津，导致商品检查失败。

研究现状：随着互联网普及率的逐渐提高以及Web2.0时代网络虚拟产品交易的兴起，众包已经成为一种新型的电子商务模式并占据着越来越重要的市场地位。众包是一种开放式创新，其成功与否与任务发布者的出价密切相关，研究任务的出价策略对于任务发布者获取满意方案、降低成本(时间成本与经济成本)具有重要意义。众包的本质是服务产品在线交易行为，大多数学者基于服务定价理论和在线逆向拍卖理论为指导，通过实证的方法研究众包网站上任务发布者制定的任务最终悬赏金额与任务属性及市场竞争的关系，从而得出成功的出价策略。

问题的产生

基于组委会给出相关地区数据，本文研究了如下问题：

1) 研究某已知项目的任务定价规律，分析任务未完成的原因。

2) 设计新的任务定价方案，并和原方案进行比较。

3) 实际情况下，多个任务可能因为位置比较集中，导致用户会争相选择，一种考虑是将这些任务联合在一起打包发布。在这种考虑下，如何修改前面的定价模型，对最终的任务完成情况又有什么影响？

2. 问题分析

本文选取的影响任务定价的因素：任务难度、会员–任务数量比、会员距离任务地点的远近程度、地区差异、会员信誉均值、会员预定任务限额(图1~3)。

3. 模型的建立

3.1. 任务定价影响因素体系

1) 任务难度

同一个项目中任务难度相当，因此样本底价相同，用常数值 $P_{0}$ 表示。

2) 会员–任务数量比

$ρ = \frac{N_{i}}{M_{i}}, i = 1, 2, 3, 4,$ (1)

Figure 1. Flow chart of problem 1

图1. 问题一模型求解流程图

Figure 2. Flow chart of problem 2

图2. 问题二模型求解流程图

其中， $N_{i}$ 代表一定区域内会员分布的数量， $M_{i}$ 代表一定区域内任务分布的数量，i表示本文划分的若干个小区域。在此，引入经济学中的需求函数进行该部分的定价 $P_{ρ}$ 表示，B表示 $P_{ρ}$ 关于r的敏感程度， $A / B$ 表示本文所考虑的 $P_{ρ}$ 最大值：

$P_{ρ} = \frac{A - \sqrt{ρ}}{B} .$ (2)

3) 会员距离任务地点的远近程度

数据只给出了会员与人物之间的经纬度坐标，在此本文利用Google地图提供的方法 [1] ，进行距离换算，计算精度与谷歌地图精度相似，误差在0.2米以下，具体运算方式如下：

$S = 2 \arcsin \sqrt{\sin^{2} \frac{a}{2} + \cos (L a t 1) \times \cos (L a t 2) \times \sin^{2} \frac{b}{2}} \times 6378.137,$ (3)

其中， $L a t 1 L u n g 1$ 表示A点经纬度， $L a t 2 L u n g 2$ 表示B点经纬度， $a = L a t 1 - L a t 2$ 为两点纬度之差， $b = L u n g 1 - L u n g 2$ 表示两点经度之差，6378.137为地球半径，单位为千米。

“距离定价”定义为距离总和的均值，即：

$d = \frac{\sum_{j}^{n} d_{j}}{n}, j = 1, 2, \dots, n,$ (4)

Figure 3. Flow chart of problem 3

图3. 问题三模型求解流程图

其中， $d_{j}$ 表示一个任务周围5 km内的会员距离，本文利用Java求解835个任务位置5 km以内的会员个数和距离均值。

4) 区域差异

四个城市之间的地区差异体现在多方面，故导致的任务定价不同，本文用误差项 $ε (o)$ 表示。其中，误差项并不只是一个单纯的常数值，它包含了可能存在的浮动因素，浮动因素会使定价模型出现动态非线性的特点，为此本文不考虑非线性模型，因此将其考虑进误差项中，将定价模型转换成线性模型。

$ε (p) = 动态因素引起的任动态定价差异$ (5)

5) 会员信誉均值

$\bar{R} = \frac{\sum_{j = 1}^{n} R_{j}}{n}, j = 1, 2, \dots, n,$ (6)

6) 会员的预定任务限额

本文用一定区域内所有会员的预定任务限额表示，即

$Q = \sum_{j = 1}^{n} Q_{j}, j = 1, 2, \dots, n .$ (7)

3.2. 任务定价估计模型 [2]

基于上述分析，本文建立以下众包平台任务定价模型，并且该模型可以给出单个的任务定价：

$p r i c e = α {}_{1}\cdot P_{ρ} + α_{2} \cdot d + α_{3} \cdot \bar{R} + α_{4} \cdot Q + P_{0} + ε (p) .$ (8)

利用Matlab将量化后的四类数据与定价代入到模型中，根据0~1分类进行多元线性回归，最小二乘拟合出完成与未完成样本的参数估计值，得到参数结果如表1所示。

综上可知，在划定区域内(任务点周围5 km以内)，通过参数 $α_{1}, α_{2}$ 可以看出会员–任务的数量比r和会员到该任务地点的距离因素d是影响任务定价price的主要因素，并且通过分析对比可知，这两个因素也显著影响任务完成率。因此，任务的定价是影响任务完成的主要因素。

4. 优化与仿真模型

4.1. 确定优化目标

本文拟通过对 $α_{1}, α_{2}$ 的优化，达到以下两个优化目标，作为问题二模型改进的方向。

1) 对于任务发布者来说，尽可能提高任务完成率。

2) 对于任务发布者来说，尽可能减少任务的相对支出(支出与任务完成率的比值)。

4.2. 对任务是否完成进行判别：支持向量机二值分类原理及应用

支持向量机是针对二值分类问题提出的，选取样本，建立约束条件和超平面约束条件，然后进行分类，从而建立一个支持向量数目相对较少的最优分类平面，从训练样本中找到一个支持向量，建构出最好的分类超平面，是本文的主要目标。

本文将训练样本集 $(x_{x}, y_{i}), i = 1, \cdot \cdot \cdot, l$ 分成两个类别，标记为正 $(y_{i} = 1)$ 的属于第一类 $x_{i} \in R^{n}$ ，标记为负 $(y_{i} = - 1)$ 的属于第二类 $x_{i} \in R^{n}$ ，如果本文建构的决策函数能够将被测试数据分开，那么学习目标就达成了。其中， $n = 6$ ，六个维度依次代表：任务难度、会员–任务数量比、会员到任务地点的距离、会员信誉均值、地区差异、会员预定任务限额。

Table 1. Parameter fit values for completed and uncompleted task pricing models

表1. 完成与未完成任务定价模型参数拟合值

由于题目中给出的任务完成情况是由0和1两种表示(1表示完成，0表示未完成)。本文在优化第一个目标，即任务完成率时，就需要根据支持向量机的二值分类特点进行任务是否完成的判断，从而得出任务完成情况。

4.3. 仿真模型的建立

首先，本文确定仿真模型的规则如下：

Rule 1：每个会员只会选择其直线距离5 km以内的任务。

Rule 2：每个会员会选择可选范围内给出定价最高的任务。

Rule 3：每个会员按照预定任务开始时间进行任务选择。

Rule 4：根据题意，每个会员获得任务数量为：

$\frac{该会员的预定任务限额}{该会员周围 5 km 内所有会员的任务限额总和} \times 5 km 内所有任务数$ (9)

Rule 5：对重要参数 $α_{1}, α_{2}$ 在其0.8~1.2倍范围内进行枚举搜索。

Rule 6：不考虑可能的自然因素和人为因素影响。

在满足规则的前提下，本文对 $α_{1}, α_{2}$ 在一定范围内进行枚举，增量范围可以在参数0.8~1.2倍之间。对其进行网格化处理，使用启发式算法搜索最优参数，使得任务完成率最大，并且此时的价格即为最优价格。

4.4. 求解

本文利用Java实现定价模型优化的仿真模拟。发现a₂对优化后的模型影响不大，任务完成率和单位任务支出的数据变动几乎可以忽略不计。所以最终的优化模型结果中，忽略了a₂的参与作用，认为其仍然是原来的值固定不变，只通过优化a₁的值来改进模型。a₁部分枚举结果如表2所示。

本文将优化后的最优a₁值代入原模型中，得出新的定价模型，即为改进后的方案。部分运行结果如表3所示。

4.5. 与原模型的对比及结果分析

通过两个优化目标确定a₁最优值，并且与原始参数的对比如表4。其中，通过对比可以看出，优化后的模型任务完成率比原模型增加了5%以上，支出比原来有所上升，但是相对支出是降低的，由原来的58,411.54减少为58,258.81。因此，本文认为仿真模拟后得出的模型优化效果较好。

Table 2. Partial model solution results

表2. 部分模型求解结果

Table 3. Part of new pricing schemes for problem 2

表3. 部分问题二新的定价方案

Table 4. Parameter values before and after optimization

表4. 优化前后参数值

5. 任务打包模型：基于贪心算法的打包规则

本文主要是增加了打包的思想：多个任务可能因为位置比较集中，导致用户会争相选择，本文考虑将这些任务联合在一起打包发布。因此，本文在问题二的基础上添加打包规则、更改仿真规则。

使用贪心算法求解问题时，总是做出在当前看来是最好的选择。即不从整体最优上加以考虑，他所做出的是在某种意义上的局部最优解。结合支持向量机的样本分类功能，本文采用贪心算法的打包流程如图4。

5.1. 仿真规则的改进

根据问题三的实际情况本文在问题二的基础上增加改进了以下仿真规则：

1) 限定最多三个任务被打包组合在一个包内；

2) 视打包后整体为一个任务，该任务的位置取包内任务距离中心；

3) 每个会员可接受任务的范围发生改变，该范围与包内任务之间的距离呈递减关系，可表示为：

$\bar{d} = 5 - b \cdot Δ d^{a},$ (10)

其中， $a, b$ 均为大于零的常数； $Δ d$ 表示包内任务之间的距离，当 $Δ d = 0$ 时可接受范围为之前的5 km。

5.2. 改进后模型的求解

本文利用Java实现改进后定价模型的仿真模拟，部分任务的定价如表5所示。

5.3. 模型改进后的效果分析

模型改进后与改进前的任务完成率具体比较如表6所示。

Figure 4. Flowchart of the greedy algorithm

图4. 贪心算法流程图

Table 5. Partially packaged task pricing

表5. 部分打包后的任务定价

Table 6. Task completion rates before and after model improvement

表6. 模型改进前后的任务完成率

由结果可知，改进后的任务完成情况较好，任务完成有所提高。

文章引用

付晓莹,冯睿. 众包商业模式下的任务定价方案研究
Research on Mission Pricing Scheme under Crowdsourcing Business Model[J]. 现代管理, 2018, 08(02): 162-171. https://doi.org/10.12677/MM.2018.82020

参考文献

1. 谷歌地图计算两个坐标的距离函数[EB/OL]. 博客. http://www.cnblogs.com/yony/archive/2012/07/31/2616253.html

2. 李训, 林川, 胡明. 我国地域关系对审计定价影响的实证研究[J]. 财经论丛(浙江财经大学学报), 2013(2): 93-100.

附录

2017年全国大学生数学建模竞赛B题全部数据见： http://www.mcm.edu.cn/html_cn/node/460baf68ab0ed0e1e557a0c79b1c4648.html

因篇幅原因以下只给出部分数据展示：

附件一：已结束项目任务数据

附件二：会员信息数据

附件三：新项目任务数据

期刊菜单