【摘 要】
:
针对查询分类问题,借助互联网中人工组织的分类网站领域URL,利用URL-key在各个类别中使用的频度,提出基于方差的领域URL-key识别方法,利用机器翻译、拼音翻译和搜索结果反馈
【机 构】
:
北京信息科技大学网络文化与数字传播北京市重点实验室,北京100101北京理工大学管理与经济学院,北京100081;北京城市系统工程研究中心,北京100035
【出 处】
:
第三届CCF国际自然语言处理与中文计算会议
论文部分内容阅读
针对查询分类问题,借助互联网中人工组织的分类网站领域URL,利用URL-key在各个类别中使用的频度,提出基于方差的领域URL-key识别方法,利用机器翻译、拼音翻译和搜索结果反馈等技术对URL-key进行过滤,构建领域URL-key.然后结合伪相关反馈技术,选取URL-key为特征,构建URL-key向量,利用SVM对查询串进行分类.实验结果表明,该方法不仅F值比对比方法提高7%,而且资源的使用也远远小于对比方法,提高了系统的时效性.
其他文献
通过数值模拟分析,定量讨论震源区附近高速异常、接收区附近低速异常以及目标区浅部局地波速异常对三叉震相反演一维波速结构的影响,结果说明波速横向变化在传统的一维波速结
采用悬臂压电脉冲阀,制备出最高重复频率达到3 k Hz的脉冲分子束。通过测量氮气分子束在飞秒激光作用下隧道电离生成的N2+(B-X)荧光光谱,对脉冲阀的性能做了表征。这种k Hz脉冲
为了研究华北地区气溶胶吸湿性的日变化特征,独立设计并搭建一套高时间分辨率的加湿浊度计系统。该系统首次采用两台水浴来交替控制样气加湿过程,将循环周期由先前的2-3小时
在采用有限元软件ANSYS分析水合物相关的Slipstream海底滑坡体时,针对多波束测深获得的复杂滑塌区海底地貌,首先通过滑坡陡壁的形态恢复滑塌面被掩埋的部分,然后通过与周围海
提出一种多级放大时间数字转换器新型结构。该结构由粗测和细测组成,粗测部分利用延时链得到小于一个延时单元的关键余量,并设计了面积小、功耗低的关键余量选择逻辑。细测部