论文部分内容阅读
该文通过爬虫代码搜集了当前B站电影栏目列表中的所有电影(约1000部),同时爬取每部电影下的所有评分数据(约65万条),每条评分数据包含评分时间与用户的ID信息。通过非参数统计中的Mann-Whitney秩和检验对搜集的数据进行分析和研究,结果表明:B站电影栏目中第一次评分人员的比例会对评分产生显著影响。同时参考美国IMDb贝叶斯加权统计算法中只收录“老用户”评分的处理方式,对B站评分系统提出建议,使评分能更加客观、全面地为观众提供参考。