古典诗词意境分类方法的研究与实现

来源 :东华大学 | 被引量 : 9次 | 上传用户:zhangchaoyi222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中国素有“诗国”的美誉,自古至今,有无数的文人雅士留下了许多脍炙人口的作品,这些作品是中国文学中的明珠,也是传统文化的瑰宝.长期以来,在中国诗歌的研究中,对不同类型的作品进行分类,既是单独的一项研究内容,又是深入对内容意义研究的前提和基础,因此对诗歌的分类研究是诗歌文学领域中重要的一项内容.然而中国上千年的历史留下的诗歌作品浩如烟海,传统的研究方法需要研究者阅读大量的知识素材,还要作翻阅、查找、记录、整理等工作,再进行分析和统计,最后做出个人的判断,这样的过程既耗时耗力,又可能由于个人的喜爱偏好得到不客观的结论。本文利用现代的计算机理论和技术,结合古典诗词的特点,对古典诗词进行分类,使得计算机在一定程度上可以“理解”诗词,从而对相关领域的研究提供了参考。本文的研究工作主要包括以下几个方面:1、对当前利用计算机来研究古典诗词的现状进行了总结。详细介绍了古典诗词中意象的概念,并根据古典诗词中常用意境来表达内容的特点,提出了古典诗词意境分类的模型。2、对本文提出的古典诗词意境分类模型进行了详细的介绍。根据古典诗词中每个特征项都会表现出一定的倾向性,提出了把特征项表示成代表不同类别比重的向量。在经典的向量空间模型VSM(Vector Space Model)的基础上,通过对那些具有相似倾向性的特征项进行聚类,改进文本模型的表示方式,把每篇诗词表示为基于特征项聚类的模型。3、根据上面提出的诗词表示模型,把诗词分类问题转化为文本分类问题,通过分类算法对古典诗词进行分类判别。本文比较了不同分类算法对古典诗词分类准确性的差异,从中寻找出最适合诗词文本分类的算法。同时比较了基于字和基于词的特征项的差别,得出了基于字的特征项较好的结论,并对特征项个数和聚类角度阈值的取值进行了分析,最终取得了一个最佳的取值范围。4、在本文提出的分类模型的基础上,构建了一个简易的分类系统。用户通过输入诗词后,就可以得到计算机所返回的结果,同时还会返回给用户语料库中最相似的诗词和特征项的统计数据等结果。
其他文献
《解忧杂货店》作为推理作家东野圭吾的非推理小说,书中悬疑元素独具特色,作者在叙述背后隐含了一个多维时间结构。从叙事学角度对多维时间结构进行分析,把多维时间结构的构
腹腔镜下恶性肿瘤切除术后肿瘤转移仍是其最严重的并发症,原因可能是腹腔镜下肿瘤手术时间长、腹腔压力高及气腹造成的低温等。最常用的CO2气腹可引起机体酸碱代谢紊乱,局部
成千上万家公司在张灯结彩地注册挂牌之后,在两到三年甚至更短的时间内,很快就隐姓埋名或者销声匿迹。这些为逃债、逃税、洗钱而成立的所谓“休眠公司”显然已经成为我们这个
目的探讨原发性肾癌肺转移的诊断和治疗方法,提高对转移性肾癌的认识。方法对2008年1月—2012年2月收治的32例原发性肾癌肺转移病例资料进行回顾性分析,结合病史及影像学、病
<正>国务院可以设立"房地产统筹委员会",作为临时机构直接向总理负责.该委员会通过系统化的综合治理,从根本上扭转我国房地产市场中出现的问题.中国的房地产业在经历了一系列
<正>专利保护制度当然是必要的,但药品作为一种特殊的商品,是否应从制度上平衡企业创新投入和公众利益之间的关系?2月26日,湖南沅江市人民检察院对引发舆论关注的陆勇涉嫌"销
目的观察通过中医辨证干预对活动期类风湿关节炎(RA)患者生存质量的影响。方法 2011年1月—2013年12月收治的活动期RA患者120例(DAS28>3.2)分为观察组和对照组,每组60例。对
目的:探讨子宫内膜电切术在功能失调性子宫出血患者中的临床治疗效果及影响因素。方法:选取2015年2月-2016年1月笔者所在医院诊治的功能失调性子宫出血患者200例,采用随机数
房地产企业尤其是中小房地产行业的融资问题一直是研究的热点,亦是关乎国计民生的重大问题。文章选取我国西部二三线城市的JY地区为样本,通过对JY地区中小房地产企业的融资问
法治思想从诞生之日起,就与人治纠缠不清,以往学界更多地是关注法治与人治的对立。然而,沿着法治思想的演变轨迹,对法治思想作出新的审视,将发现法治与人治从未完全决裂,法治