藏文搜索引擎系统中网页自动摘要的研究

来源 :微处理机 | 被引量 : 0次 | 上传用户:uuukns111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
给出了藏文搜索引擎中网页自动摘要的基本思路、基本步骤和Web文摘的定义,讨论了分词算法,提出了基于句子抽取的Web文摘生成算法。算法中将每个Web句子的权重分解为Web特征词权重和Web句子结构权重,Web句子结构权重充分考虑排版格式和超连接属性。根据权值大小按给定的比例挑选句子,并进行平滑处理,生成文字流畅且具备一定质量的摘要。最后实验分析表明效果较好。
其他文献
介绍了光纤通道协议的通信原理,并针对基于光纤通道协议的通信过程过于繁琐的现状,提出了一种高速率、低延迟的通信方案。同时依据新的通信协议,提出了其实现模型,为以后开发高速
为了不断发展和完善我国的社区服务体系,让信息技术逐步应用于社区服务,项目组设计实现了基于HTK的社区语音接入服务平台。HTK(Hidden Markov Model Toolkit)是一个基于隐马尔
针对由20个智能体搭建而成的变形翼硬件系统,通过集成可视化的翼型控制、进程通信、气动数据存取等模块,使用面向对象软件开发研制了基于变参数模型的变体飞行器仿真系统。系
设计和实现了基于FPGA的数字线性键控器,论述了数字线性键控器的工作原理和实现关键,详尽介绍了如何以FPGA为核心对数字线性键控器进行软硬件的设计。
介绍了新型高性能数字信号处理器LF2407A的特性和一种闪速存储器29C256的工作原理,并介绍了基于LF2407A控制29C256(flash memory)进行数据存储/读取的软硬件实现方考?此方案将程序
基于现场可编程门阵列(FPGA)的硬件平台,研究和设计了小波变换的图像数字水印方案,从而提高了嵌入与提取图像数字水印处理的速度。
本文主要论述了MCM工艺过程及多芯片组装技术中的C4技术.并对MCM种类、MCM关键工艺、MCM凸点的制作方法等做了简单介绍.
首先介绍了虚拟仪器及其软件开发平台,然后,通过与传统仪器应用面板的比较,着重阐述了利用LabWindows/CVI对虚拟仪器友好界面的开发。
介绍了一种用ZNE-100T以太网转串口模块实现TMS320LF2407A型DSP与以太网通信的方法。描述了LF2407A中内嵌的串行通信接口模块以及ZNE-100T的结构与用法,给出了硬件电路设计及
本文介绍了网格技术的最新发展,网格资源架构技术WSRF.WSRF是开放式网格服务基础框架OGSI的进化和重构,是Web Service和网格的深度融合.文章在简要介绍了网格技术和Web Servi