摘 要:票房与评分作为评价一部电影最重要的两个方面,传统研究考虑他们的影响因素时,只考虑多个影响因素对其中一个因素的影响(即“多对一”)。本文提出基于多分类Logistic 回归模型,构造一种单一影响因素对多个因素(即“一对多”)是否产生影响的分析方法,并从理论角度对该方法给予了证明;并将该方法应用在2017 年和2018 年国产电影数据中,分析了明 星影响力对电影票房评分两方面的影响,发现明星影响力对电影票房评分没有显著影响。
关键词:多分类Logistic 回归;影响因素筛选;明星影响力
中图分类号:TP181 文献标识码:A 文章编号:2096-4706(2019)21-0022-04
Multi-class Logistic Regression Based on Machine Learning
——Analysis of the Influence of Star on the Box Office and Score
HUANG Lianshu,XIA Qizheng
(School of Statistics and Information,Shanghai University of International Business and Economics,Shanghai 201600,China)
Abstract:Box office and scoring are the two most important aspects of evaluating a film. When traditional research considers their influencing factors,only the influence of multiple influencing factors on one of the factors (more to one) is considered. This paper proposes an analysis method based on multi-class Logistic regression model to construct whether a single influencing factor affects multiple factors (one to more),and proves the method from a theoretical perspective. In addition,we applies the data of domestic films of China in 2017 and 2018,and analyze the influence of star on the movie box office and score. We find that the star has no significant effect on the movie box office and score.
Keywords:multi-class Logistic regression;selection of factors;star influence
基金项目:本文系2019年上海市大学生创新创业训练计划项目:基于数据挖掘的电影票房预测——论明星知名度与票房的“高跟鞋曲线”(项目编号:201910273114)的研究成果之一。
参考文献:
[1] Barry R. Litman,Linda S. Kohl. Predicting financialsuccess of motion pictures:The '80s experience [J].Journal of Media Economics,1989,2(2):35-50.
[2] Scott Sochay. Predicting the Performance of Motion Pictures [J].Journal of Media Economics,1994,7(4):1-20.
[3] 李健平,王世民. 基于灰色关联分析和BP 算法的国内电影票房预测 [J]. 电子世界,2018(24):18-19.
[4] 吴珏,潘徐. 基于用户内容消费数据的电影票房预测模型探索 [J]. 全球传媒学刊,2018,5(3):96-107.
[5] 郑坚,周尚波. 基于神经网络的电影票房预测建模 [J]. 计算机应用,2014,34(3):742-748.
[6] 周如彪,林晓霞,王昱华. 基于多元回归分析豆瓣电影评分 [J]. 艺术科技,2019,32(1):67-68+83.
[7] 马松岳,许鑫. 基于评论情感分析的用户在线评价研究——以豆瓣网电影为例 [J]. 图书情报工作,2016,60(10):95-102.
[8] 李锦绣. 基于Logistic 回归模型和支持向量机(SVM)模型的多分类研究 [D]. 武汉:华中师范大学,2014.
作者简介:黄恋舒(1997.11-),女,汉族,广西贵港人,本科在读,研究方向:经济统计;夏启政(1998.11-),男,汉族,河南新乡人,本科在读,研究方向:经济统计。