网络百科属性抽取

来源 :2012全国高性能计算学术年会 | 被引量 : 0次 | 上传用户:linyulan430
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  本文提出了一种基于中文网络百科的属性抽取方法。该方法以中文网络百科自由文本为数据源,将属性值看作命名实体,对已分类的百科文本进行频繁模式的挖掘。通过分析频繁模式中词语序列与命名实体的关联关系,得到属性模式与属性词语,借助外部语义资源以及词语相似度计算去除重复的属性词语,得到统一的属性名称。本文对多个类别的中文百科条目进行了属性抽取实验,实验结果表明了该方法的可行性和有效性。
其他文献
SimK 是由中科院计算所体系结构国家重点实验室开发的一个并行离散时间模拟引擎.基于已经发布的SimK 1.0 版本,对任务划分及同步推进阻塞控制进行了功能扩展,开发了SimK 的1.1 版本.同时由于缺乏一个专门对SimK 模拟性能评测的Benchmark 以及全面的评测结果,首先讨论了并行模拟引擎Benchmark设计准则,之和介绍开发的Benchmark-PassBall,并且使用它对Sim
云环境中,借助瘦客户端技术提供软件远程执行服务成为解决移动终端资源局限性问题的有效途径.但移动网及广域网的固有延迟会严重影响交互应用程序远程执行的用户体验.本文引入与移动终端距离更近的小规模云基站CloudAP,建立一种面向移动终端的“云中心+云基站”两级软件高效远程执行体系结构,同时提出了CloudAP环境下弹性软件包副本放置策略,软件包副本总是向着请求的方向移动.实验结果表明,借助于云基站Cl
水泥图像特征提取是水泥建模的重要基础。传统的水泥特征提取在处理大量水泥图像时耗时巨大,且需要大量内存资源。考虑到基于像素的图像特征提取有着可并行化程度高的特点,结合实验室现有资源,本文提出了分布式网络内采用GPU(图形处理器)作为计算平台的基于CUDA(基于统一设备架构)的特征提取方法。基于CUDA 架构的GPU 图像特征提取为处理海量水泥图像提供了一种新的思路。
硅酸盐水泥水化反应的极端复杂性使得人工推导水化动力学方程的研究存在很高的难度。通过进化计算方法可以从观测到的硅酸盐水泥水化程度时间序列数据中自动萃取出水化动力学方程,然而其时间复杂度很高。因此,本文利用CUDA 计算架构对进化过程进行并行加速来减少运算时间。实验结果表明,采用CUDA 架构可以获得较高的加速比,所得到的动力学方程可以很好的吻合观测到的水化程度时间序列数据。
为了有效提升列数据库的查询性能,充分利用异构计算平台的计算资源,本文在一套已定义的列数据库原语集合的基础上,提出一套原语调度方法。该方法包括原语执行机制,基于动态规划的CPU原语调度方法和基于GPU显存管理机制的GPU原语调度方法。通过对TPC-H基准程序中几个典型查询进行测试,结果表示CPU原语调度方法使查询更稳定,GPU原语调度方法使得查询更快。
为高效、充分的利用GPU,针对GPU的特点,结合虚拟化环境的安全、隔离等特性,借鉴已有的虚拟化技术,提出了一种可动态调度、支持多用户并发的GPU虚拟化技术.CUDA管理端采用集中、灵活的机制对GPU资源进行统一管理,对GPU内部任务统一调度.GPU内部任务调度通过设置综合负载评价值实现负载平衡,避免了资源的利用不充分.设计了一个面向科学计算的分布式异构系统来模拟GPU虚拟化的应用场景,并通过在设计
并行AMG法是求解PDEs 离散化系统最为有效的迭代法之一,目前已被广泛应用于大规模科学与工程计算等众多领域。本文针对一类系数矩阵为稀疏带状结构的线性代数方程组,在OpenMP 编程环境下,对BoomerAMG解法器内的并行插值算子和并行粗网格算子的生成模块进行了改进; 研制了相应的程序模块,获得了改进的并行AMG 解法器BoomerAMG_OPT;并将其应用于求解Laplace 方程和一类二维三
随着信息资源爆炸性增长,云文件系统凭借高性能、高扩展、高可用、易管理等特点,成为云存储和大数据的基础和核心。由于硬件损坏和软件故障等原因,可能造成数据的损坏和丢失。云文件系统一般采用完全副本技术来提升容错能力,提高数据资源的使用效率和系统性能。但完全副本的存储开销随着副本数目的增加呈线性增长,存储副本时造成额外的写带宽和数据管理开销。纠删码在没有增加过量的存储空间的基础上,通过合理的冗余编码来保证
RTM(Reverse Time Migration)逆时偏移算法是地震勘探领域复杂构造油气藏成像的精确算法之一。本文在分析RTM算法及NVidia GPU并行体系结构基础上。针对算法并行性。采用窗口推进遍历网格的方式实现了基于CUDA的RTM算法并行。并从算法设计、纹理访存、指令流等方面进行优化。实验结果显示。与CPU代码实现相比,GPU并行算法在保证精度的基础上相比单核CPU算法获得了超过12
Oracle HotSpot 是最重要的开源虚拟机之一,服务器版(C2)即时编译器是HotSpot 针对服务器高效运行的重要组成部分。本文在分析HotSpot C2 即时编译器结构的基础上,针对某国产处理器平台,研究了C2 即时编译器移植的关键技术,重点分析了指令匹配、体系结构描述文件、执行模式上下文切换。通过初步的移植,在国产处理器平台上基本通过了OpenJDK 内部测试包的正确性验证,且实验表