切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
您的位置
首页
期刊论文
基于Lucene的中文分词器的设计与实现
基于Lucene的中文分词器的设计与实现
来源 :微型机与应用 | 被引量 : 0次 | 上传用户:wxj1234567
【摘 要】
:
针对Lucene自带中文分词器分词效果差的缺点,在分析现有分词词典机制的基础上,设计了基于全哈希整词二分算法的分词器,并集成到Lucene中,算法通过对整词进行哈希,减少词条匹配次数
【作 者】
:
彭焕峰
【机 构】
:
南京工程学院计算机工程学院
【出 处】
:
微型机与应用
【发表日期】
:
2011年18期
【关键词】
:
LUCENE
哈希
整词二分
最大匹配
Lucene
Hash
binary-seek-by-word
maximum matching
【基金项目】
:
南京工程学院科研青年基金项目(QIQB2009026)
下载到本地 , 更方便阅读
下载此文
赞助VIP
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对Lucene自带中文分词器分词效果差的缺点,在分析现有分词词典机制的基础上,设计了基于全哈希整词二分算法的分词器,并集成到Lucene中,算法通过对整词进行哈希,减少词条匹配次数,提高分词效率。该分词器词典文件维护方便,可以根据不同应用的要求进行定制,从而提高了检索效率。
其他文献
基于多权值神经网络的静态手势字母识别的研究
提出了一种基于多权值神经网络模型的静态手势语识别方法。应用手势字母图像圆周极径序列的傅立叶频谱信息来提取特征,再结合多权值神经网络的训练算法与识别算法,实现静态手势字母的识别,并取得了很好的识别效果。
期刊
多权值神经元
人机交互
手势识别
手势字母
multi-weighted neuron
human-computer interaction
hand ge
基于改进Snake模型能量函数在MR图像边缘提取中的研究
在分析传统主动轮廓模型的基本原理、数学表征及算法实现的基础上,针对其收敛于局部极小值和依赖初始位置选取方面存在的不足,提出了改进的主动轮廓模型。该模型通过对一阶连续性能量Econt的改进和增加外部约束能量Esand,使MRI图像边缘提取能够接近真实边缘且不依赖初始位置选取。通过脑部肿瘤边缘提取实验证实了该改进主动轮廓模型的有效性。
期刊
主动轮廓模型
MRI
边缘提取
脑肿瘤
active contour models
MRI
edge extraction
brain tumor
基于LIN总线的倒车雷达系统的设计与实现
采用AT89S52作为控制器,连接并控制自主设计的超声波倒车雷达的接收与发送模块。控制器将倒车雷达模块的数据以LIN协议规定的报文格式发送到LIN总线,通信过程按照LIN协议规定的
期刊
LIN总线
倒车雷达
超声波
LIN bus
reversing radar system
ultrasonic
基于HVS和小波变换的彩色图像水印算法
提出了一种将彩色水印图像嵌入到原始彩色图像中的数字水印算法。该算法对水印的加密采取了Arnold结合矩阵变换的方法并利用人类视觉系统特性,将水印信息嵌入到载体图像多级小
期刊
彩色数字水印
人类视觉系统
小波变换
color digital watermark
HVS
DWT
基于NiosⅡ处理器的TFT-LCD图形显示设计
主要阐述了以Altera公司的FPGA为核心的基于NiosⅡ软核的嵌入式LCD图形显示设计方法。从系统的角度提出在LCD上显示图形的设计过程,给出搭建NiosⅡ软核的系统整体结构图,并最
期刊
LCD显示
NiosⅡ软核
现场可编程门陈列(FPGA)
LCD display
Nios Ⅱ soft core
filed programmable g
基于MCl45163P的智能锁相频率合成器设计
设计基于MCl45163P的智能锁相频率合成器,此系统是在经典频率锁相合成器电路的基础上,加入单片机控制环节,实现频率输出的自动控制、预置频率值、显示频率等功能。对系统的实
期刊
锁相环
锁相频率合成器
压控振荡器(VCO)
计数器
phase-locked loop
PLL frequency synthesizer
voltage
概率逻辑结果支持度的合成算法
Haenni的概率推理系统在与D—S理论相互转化的过程中进行了投影,从而不可避免地导致一些有价值信息的丢失。为此提出一种新的概率逻辑结果支持度的合成算法来避免信息的丢失。
期刊
概率推理系统:D—S理论:合成算法
probabilitic argumentation systems
Dempester-Shafer theory
c
基于ARM9的便携式CIS型扫描仪设计
通过ARM9技术深入分析CIS图像传感器采集RGB图像的过程和机理,将CIS输出的模拟图像信号及时有序地采集到MCU中,再精准地进行A/D转换,最终经TFT显屏获得图像信息,可实现便携式CIS型扫描仪的功能,或进一步进行图像智能识别及处理。
期刊
ARM9
STM911FA
接触式图像传感器
ADC
TIM
SSP
ARM9
STR911FA
CIS
ADC
TIM
SSP
其他学术论文