﻿ 我国电影票房影响因素分析及预测 Analysis and Forecast of the Influencing Factors of Chinese Box Office

Vol. 08  No. 04 ( 2019 ), Article ID: 29675 , 7 pages
10.12677/ASS.2019.84069

Analysis and Forecast of the Influencing Factors of Chinese Box Office

Shanshan Ping

Jiangxi University of Finance and Economics, Nanchang Jiangxi

Received: Mar. 20th, 2019; accepted: Apr. 4th, 2019; published: Apr. 11th, 2019

ABSTRACT

More and more people and investors focus on film industry in the context of promoting the development of film industry. Studying on the influence factors of box office and predicting box office can benefit the development of film industry and can be the base for investors to make right decisions. This article selects top 100 Chinese mainland domestic films since 2011, which excludes animated films. We select and define 18 indexes to build the indexation system of influence factors of revenues of releasing films. We use stepwise multiple regression method to analyze the influence factors of box office. From the result, the market factor has the best effect. We can predict box office from multiplied regression, Neural Networks, Random forest and SVR model. We can find the best fitting model by comparing these four models. We can find that the random forest model is the best model.

Keywords:Box Office, Multiple Regression, Neural Networks, SVR Model, Random Forest

1. 引言

2. 建立指标体系

Table 1. Indicator system table

3. 模型建立

3.1. 多元线性回归

Table 2. Step by step

R2 = 0.5887, F = 23.27, P = 9.45e−15.

3.2. BP神经网络

$\text{Y}={f}_{2}\left(\underset{i=I}{\overset{{N}_{i}}{\sum }}{w}_{j}^{2}\cdot \left({f}_{1}\left(\underset{j=I}{\overset{{N}_{j}}{\sum }}{w}_{ij}^{1}\cdot {x}_{i}\left(\text{I}\right)+{b}_{j}^{1}\right)\right)+{b}_{0}^{2}\right)$ (1)

$m=\sqrt{n+l}+\alpha$ (2)

Figure 1. Neural network iterations

3.3. SVR支持向量机回归模型

SVR就是指支持向量机回归模型，它是基于SVM模型的回归模型。SVM即支持向量机也是机器学习模型，在判别、分类以及回归分析有很多的应用 [6] 。这种分类方法的原理是在一个空间内寻找到一个超平面，使得这个超平面能够把空间分成两部份，且这两部分到这个超平面的距离最大。如果数据线性不可分，那么就把原数据通过一个非线性映射转换成高维空间的数据，再在这个空间找到一个符合要求的超平面。

$f\left(x\right)=\left(w\ast \phi \left(x\right)\right)+b,w\in F$ (3)

$w$ 是权值向量， $b$ 是偏置项。$b$ 通过最小化一个泛函公式(4)来估计：

$R\left(w\right)=\frac{1}{2}{||w||}^{2}+C\underset{i}{\overset{n}{\sum }}{J}^{i}\left({y}_{i},{d}_{i}\right)$ (4)

Table 3. Basic parameters of SVR model

3.4. 随机森林模型

Figure 2. Random forest schematic

Figure 3. Accuracy decrement eigenvalue importance level

4. 模型结果分析

4.1. 拟合度与稳定性对比

Table 4. MSE & NMSE

4.2. 预测精确度对比

5. 结论与建议

Table 5. Total deviation between predicted and actual values

1) 对于电影投资方，如果仅是出于票房考虑，应该投资贺岁档的电影，在技术上应该采用IMAX，这样可以更好地吸引观众，获得更高的票房 [8] 。

2) 如果想预测一部电影的票房，可以关注一下它的“猫眼想看指数”、“豆瓣评分”和“百度搜索指数”，并且看它是否是贺岁片、喜剧片、动作片，或者电影是否采用了IMAX技术。

3) 可以选用上述的7个指标建立随机森林模型来对电影票房进行预测。

Analysis and Forecast of the Influencing Factors of Chinese Box Office[J]. 社会科学前沿, 2019, 08(04): 489-495. https://doi.org/10.12677/ASS.2019.84069

1. 1. 刘连涛. 我国3D电影票房影响因素[J]. 商, 2016(13): 201-202.

2. 2. 崔凝凝, 唐嘉庚. 基于回归分析的中国电影票房影响因素研究[J]. 江苏商论, 2012(8): 35-39.

3. 3. Hennig-Thurau, T., Houston, M.B. and Walsh, G. (2007) Determinants of Motion Picture Box Office and Profitability: an Interrelationship Approach. Review of Managerial Science, 1, 65-92.

4. 4. 陈然. 我国商业电影票房影响因素研究——基于多元线性回归和神经网络分析[D]: [硕士学位论文]. 昆明: 云南财经大学, 2016.

5. 5. 程相君, 王春宁, 陈生潭. 神经网络原理及其应用[M]. 北京: 国防工业出版社, 1995.

6. 6. 陈诗一. 非参数支持向量回归和分类理论及其在金融市场预测中的应用[M]. 北京: 北京大学出版社, 2008.

7. 7. 李欣海. 随机森林模型在分类与回归分析中的应用[J]. 应用昆虫学报, 2013(4): 1190-1197.

8. 8. 聂鸿迪. 中国电影票房的影响因素及其实证研究[D]: [硕士学位论文]. 北京: 北京交通大学, 2015.