基于社交网络分析的电影票房预测系统的设计与实现

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:tianshui8085
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
进入21世纪以来,神经网络、情感分析等在电影票房预测上的广泛应用,使得电影票房预测的准确性逐年提高。由于电影制作的复杂与不确定性,未来电影票房预测的发展趋势需要吸纳更多数据,采取更贴合的模型跟踪预测。现有的基于产品的神经网络算法(PNN)模型在票房预测取得了不错的效果,但仍然有一些不足。本文针对性地提出了三种改进的模型架构。在特征工程阶段,PNN模型将所有特征按领域划分,领域间特征通过两两交叉映射到同一向量空间。这忽略了每个领域中特征表达的一致性,本文提出以组为单位的产品神经网络算法(GPNN)模型引入分组进入嵌入层(GSE)的概念,进行特征组划分时,对组内所有特征考虑表达的一致性和差异性。另外在GPNN特征工程基础上,强化对票房预测影响较大的一些交叉连续特征,作为有连续特征的以组为单位的产品神经网络算法(CGPNN)。在特征交叉阶段,GPNN、CGPNN模型均采用外积算子实现特征交叉,将特征映射到高维向量空间内,全面地学习出特征的深层表达,然而在数据不足的情况下模型难以收敛。针对这两种网络结构的特性,本文提出了基于探测的有连续特征的以组为单位的产品神经网络算法(Probe-based CGPNN)模型,用内积算子完成特征交叉,在保证预测效果不明显下降的前提下,合理地降低时空复杂度。基于上述的三种改进模型,借鉴现有票房预测系统的结构,本文设计与实现了基于社交网络分析的电影票房预测系统,将整个系统划分为网络爬虫子模块、数据存储模块、文本情感分析子模块、特征组合子模块、电影票房预测子模块、数据前端展示模块等六个主要功能模块,并详细阐述了其内部实现细节。
其他文献
本文针对目前市政道路路基压实度现场检测方法 ,着重探讨了灌砂法、环刀法和落锤频谱式快速测定仪法的适用条件和使用方法,并针对路基压实度现行的不同方法在同一测试路段进
以高速公路某隧道为例,建立爆破振动数值模拟模型并进行了分析,得到后行洞爆破对先行洞初期支护产生的一般影响规律,从而确定先行洞的初期支护参数,以保证隧道初期支护的质量
汉语拼音是小学语文教学重要的组成部分,是学生识字、学习普通话的有效工具,是低幼认知衔接的桥梁和纽带,也是学生今后良好的学习习惯,奠定学习基础的重要时期。同时也是小学
后囊膜混浊(posterior capsular opacification,PCO)是白内障手术的主要远期并发症,是由于手术切除纤维块后残留在囊袋中的晶状体上皮细胞(lens epithelial cell,LEC)的异常
对于强直性脊柱炎,庞学丰教授认为:肾虚不养督脉为其发病关键,六淫外袭、气血痹阻为发病条件,应根据病因病机确立治疗原则,抓住补肾壮督之关键以治本,重视祛除外邪、通络止痛
一、影响定价决策的内部因素1.营销目标.企业可供选择的营销目标有:生存目标、现期利润最大化目标、市场份额领导地位目标和产品质量领导地位目标.2.营销组合战略.在企业的营
随着《中华人民共和国种子法》的深入实施和市场经济的快速发展,品种选育和投入主体的多元化趋势,适宜当地种植的合法农作物品种不断丰富。但是,由于审定品种的增加,使得推广品种
微课程是一种基于信息技术的新型教学资源和教学模式,建构高校《程序设计基础》微课程,可以灵活实现课程教学,帮助学生对程序设计知识和技能进行主动探索。介绍了微课程的概念和
抑郁症的病位在脑,督脉入属于脑,又循行于头顶正中。本着"经脉所过,主治所及"的原则,督脉的穴位可治疗与脑有关的神志病。
近年来,随着国家大力弘扬中国传统文化,提升核心价值观和文化自信,大众对于考古行业关注度越来越高,各级机关对于考古事业支持力度也在不断增大。但考古项目经费管理方面的“丑闻”却不断被曝光,从广东考古所工作人员套取大量民工工资到山西省考古所通过采购环节进行利益输送等,大量考古专项资金被不法份子占用、盗用,给国有资产带来严重的损失,同时给考古行业带来极大的负面影响。众多考古科研机构在专项管理风险控制方面暴