论文部分内容阅读
近年来,随着老龄化程度不断加深的同时人工智能时代也随之到来,信息技术的飞跃式发展和人们生活水平的大幅度提升,老年人对高科技智能产品的需求得不到满足的矛盾越来越强烈。在这样的时代背景下,如何更加全面、准确地了解老年人对智能产品的需求特点,从而为产品设计提供参考依据成为一个炙手可热问题。尽管传统统计调查能够直接了解到老年人消费者的需求特点,但时间、劳动成本较大,调查范围也比较局限。早已不能满足企业相关部门的需要,取而代之的是使用文本挖掘相关技术,相对更为简单、便利。
本文以京东商城老年人智能手机评论为例,基于网络爬虫及自然语言处理技术,紧紧围绕老年人对智能手机的需求特点,对京东商城20多万相关手机评论文本语料进行数据建模,主要步骤如下:为了提高数据的可建模性,首先根据手机类别将采集到的数据划分为智能机和功能机,并进行数据预处理。
其次,为了更加有效、全面地体现老年人手机消费者的需求特点,采用组合模型进行以下的数据挖掘。即基于python中sklearn等数据分析包构建长短记忆神经网络(以下简称LSTM)模型,得到文本语料的情感倾向性并生成4个好坏语料文档;再利用武汉大学ROSTCM6系统构建两类手机语义网络模型,通过重建有价值的高频词之间的关系,并在共现矩阵和评论筛选核对的帮助下,在一定程度上,得到了老年人智能机和功能机的赞点和抱怨点。最后基于LDA主题模型的思想,构建了评论主题模型。通过主题模型对潜在主题的提取,更加清晰明了地展现了两类手机独特的优势和最大的劣势。
综合比较分析两者,将功能机消费者的使用习惯结合到智能机的特征中,并在此基础上,对相关手机生产商、运营商及政府部门等提出诸多实践建议,以帮助老年人智能手机更加符合老年人的使用需求,也为推进智慧养老事业出一份力。
本文以京东商城老年人智能手机评论为例,基于网络爬虫及自然语言处理技术,紧紧围绕老年人对智能手机的需求特点,对京东商城20多万相关手机评论文本语料进行数据建模,主要步骤如下:为了提高数据的可建模性,首先根据手机类别将采集到的数据划分为智能机和功能机,并进行数据预处理。
其次,为了更加有效、全面地体现老年人手机消费者的需求特点,采用组合模型进行以下的数据挖掘。即基于python中sklearn等数据分析包构建长短记忆神经网络(以下简称LSTM)模型,得到文本语料的情感倾向性并生成4个好坏语料文档;再利用武汉大学ROSTCM6系统构建两类手机语义网络模型,通过重建有价值的高频词之间的关系,并在共现矩阵和评论筛选核对的帮助下,在一定程度上,得到了老年人智能机和功能机的赞点和抱怨点。最后基于LDA主题模型的思想,构建了评论主题模型。通过主题模型对潜在主题的提取,更加清晰明了地展现了两类手机独特的优势和最大的劣势。
综合比较分析两者,将功能机消费者的使用习惯结合到智能机的特征中,并在此基础上,对相关手机生产商、运营商及政府部门等提出诸多实践建议,以帮助老年人智能手机更加符合老年人的使用需求,也为推进智慧养老事业出一份力。