【摘 要】
:
文本表示是文本信息处理的基础问题,目前常用的文本表示模型没有考虑文本中词汇间的关系,在表示文本时损失了大量的文本结构信息,而这些文本结构信患对于理解文本是至关重要
【机 构】
:
北京邮电大学信息工程学院,北京师范大学文学院
【基金项目】
:
北京市自然科学基金(4073037), 教育部博士点基金(20060013007)
论文部分内容阅读
文本表示是文本信息处理的基础问题,目前常用的文本表示模型没有考虑文本中词汇间的关系,在表示文本时损失了大量的文本结构信息,而这些文本结构信患对于理解文本是至关重要的。本文提出了用词汇网络来表示文本,保留了文本结构,并根据词汇间关系的不同层次,依次提出了共现网络-语法网络-语义网络。将文本网络表示方法应用在文本分类中,检验了模型的表示能力。实验结果表明文本网络表示方法要优于向量空间模型。
其他文献
在ANSYS中利用APDL语言,通过求解斜齿轮端面齿廓渐开线和过渡曲线的交点,形成端面齿廓,再沿螺旋线拖拉,直接生成了一对斜齿轮的参数化模型,模型端面上啮合点与节点重合,便于进一步
采用刚体复合运动微分方程和动力学方程组逐次求解的方法,对椭圆齿轮传动后插旋转式分插机构进行动力学分析,建立其动力学模型和编写辅助分析软件,得到插秧过程中中心轮轴心、中
针对空调用电气元件冷却技术类型,以及该领域国内外的专利申请量、核心企业发展趋势概况进行了统计与分析;对部分重点专利技术进行了详细介绍,整体上按照强迫对流换热、制冷
新形势下,舞蹈不仅是一门艺术,也是一种文化与精神。高校的舞蹈教学担负着培养舞蹈专业人才、传承优秀传统文化的使命。舞蹈表演者追求使用高超的舞蹈技巧,给受众带来强大的
本文从高等职业教育的改革与发展中存在的主要问题入手,进行了充分的分析,提出了建设性的保障高职教育健康发展的对策,为高等职业教育发展提供理论依据。