技术情报系统过滤与加工功能的设计与构建

来源 :软件 | 被引量 : 0次 | 上传用户:jianlzho
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:以技术情报系统信息过滤与加工为研究对象,初步探讨了信息过滤与加工的设计方法,阐述了计算机自动过滤与专家手工过滤的分工与合作,并设计了相关的数据表和业务流程,为深入开展相关研究奠定了一定的理论与实践基础。
  关键字:技术情报;过滤;加工
  中图分类号:TP391.1 文献标识码:A DOI:10.3969/j.issn.1003-6970.2013.06.022
  0 引言
  技术情报系统运行前期,由于通过各种渠道搜索的情报数据太多,导致不相关信息量大,信息精度通常较低,分散无序,且有时缺乏逻辑性和合理性,因此需要一个鉴别、验证、整理和有序化的步骤,把信息置于竞争战略的考虑中,与专家的知识、经验和判断能力进行充分和结合,对采集的信息进行过滤和加工,使之变为有价值的情报。为此,在设计技术情报过滤和加工功能时,要通过计算机算法和领域专家知识的融合来实现对情报信息的过滤,并对过滤的情报进行二次加工,进而为情报分析和情报预警提供更加精准的数据基础。
  1 系统设计描述
  1.1 系统功能设计
  情报过滤分为计算机自动过滤和专家手工过滤两种方式,情报加工则主要由领域专家根据情报的利用方式、加工内容采取人工的方式。
  1.1.1技术内容加工
  对于专利和学术论文,系统为领域专家提供收集情报的技术加工功能,加工内容如表1:
  该种加工的实现方式是在数据库存储上预留出以上信息字段。其中,技术类别一项指定用户只能从专家知识库中的技术领域内容进行选择,而不能随意填写。
  1.1.2预警内容加工
  预警内容的加工与技术内容加工为两个并列的加工模块,但又比技术加工更加深入、细致,其针对对象仍为专利和学术论文。具体加工内容设置如表2。
  以上指标的取值在数据库中用1、2、3、4数字表示,在页面上用汉字表示,两者一一对应。例如,加工时,专家选择“创新程度”为“高”,那么在数据库中被加工的数据的创新程度字段取值为4,如果选择无创新程度,则存入数据1。
  1.1.3技术指标加工
  如果专利和论文所描述的技术内容涉及技术指标,如长、宽、高、密度、大小等,而且这些技术指标得到改善,或者领域专家特别关注某一指标,那么在进行情报加工时增加技术指标加工。
  1.2 用户流程设计
  计算机的自动过滤为必选,由计算机的后台完成。利用专家知识进行的过滤和加工操作由人工完成,在前台页面进行。默认情况下,由计算机过滤的后信息为有用信息,人工过滤进一步强制的把经过计算机过滤的数据删除或标记为不相关。举例如下:
  (1)系统搜索到的论文P1、P2、P3….P100,经过计算机过滤后保留下来P1、P3、P5…..P99,把P2、P4、P6、P100标记为“不相关”。
  (2)在做分析和预警时,选择数据 where 相关性!<> null,选择的是P1、P3、P5…..P99
  (3)如果进行了专家的筛选,进一步从P1、P3、P5…..P99中选出P1、P3、P5、P7、P9,那么,在P11…P99上标记不相关。
  (4)在做分析和预警时。与步骤2相同,这样就把专家筛选的剔除了。如果没有专家过滤,也不影响计算机的自动过滤操作。
  2 系统实现
  2.1 手工过滤的数据库实现方式
  对于存储在数据库表中的每一条数据记录,都有一个唯一标识字段和该条记录过滤状态的两个字段
  比如专利CN123456789.0,唯一标识为该专利的号码,过滤状态字段1的取值分别为0、1,分别表示这条数据是否经过专家阅读,过滤状态字典2的取值分别为0、1,分别表示这条数据是否是与激光雷达成像压缩传感成像技术具有相关性。通过这两个字段的组合可以对相关数据进行筛选查询。而且,在情报搜索子系统中不会重复下载这条专利数据,只要根据唯一标识判断数据库中已经存在这条数据,不管其状态如何,均不再重复下载。具体实现数据库设置如表3。
  2.2 技术加工的数据库实现方式
  数据库中infoprocess表用于存储技术加工的内容,表的设计如表4:
  3 小结
  技术情报系统中对于信息的过滤和加工是形成情报的重要环节,同时是后期情报预警的重要前提和基础。本文对信息过滤和加工功能进行了初步的探讨,为今后的工作奠定了一定的理论基础。
  参考文献
  [1]陈磊,李德华.热点问题情报过滤模型与算法[J].武汉大学学报.2008年第3期.
  [2]王宏生.基于本体的信息过滤研究[J].科技信息.2009(29).
  [3]谢科.文本分类系统关键技术[J].广西师范大学学报.2007(2).
  [4]严莉莉.基于类信息的文本聚类中特征选择算法[J].计算机工程与应用.2007(12).
其他文献
为了提高web应用的开发效率,产生了很多自动生成工具,如基于模板、可视化页面编辑工具。但仍需要开发人员具备较高的专业技能,并且生成工具的自动化程度不高。本文给出了一个
图书馆应充分发挥主阵地作用,不断拓展服务空间,创新服务方式,满足广大人民群众的基本文化需求,从而保障和促进全民阅读.
摘 要:当前,许多媒体服务供应商利用云技术向使用者提供流媒体云服务。云服务虽然提升了流媒体业务按需访问的便捷性,但用户在使用流媒体云服务的同时操作的智能化程度较低。用户在流媒体文件选择、媒体设备选择及服务器连接方面缺乏智能手段。此外,系统不具有媒体流播放的断点支持功能。本文利用即插即用网络通信协议UPnP,设计了一套最佳播放设备的智能选取模型。本模型通过分析比较媒体文件元数据与播放设备元数据,自动
本文主要研究医学成像技术中经常采用的均值滤波、中值滤波和小波变换去噪算法。通过原理研究、实验仿真与去噪结果对比分析,了解其在图像细节复原和去噪方面的特点,并得到医学X光成像中去噪算法的应用区间。
本文研究分析了XMPP协议,以及基于该协议的企业级即时通信系统。在此基础上,对XMPP协议进行了自定义扩展,将当前企业信息系统中的远程控制以及实时推送功能和即时通信系统进
摘 要: 校本研修是学校打造品牌,创建特色,促进教师专业化发展的有效路径。因此,在校本研修中,要有正确的指导思想与目标,采用多种有效策略,并把校本研修制度化、经常化,从而促进和提高教师专业化发展。  关键词: 校本研修 学校品牌与特色 教师专业化  教师是学校最重要的课程资源,教师队伍整体素质对于学校的发展有着重要影响。因此,提高教师的整体素质,促进教师专业化的发展,是打造学校品牌、进行创新
随着经济迅猛发展,高层建筑不断涌现,桩基作为一种强有力的地基基础被广泛运用建筑工程,作为地下隐蔽工程,桩基检测的重要性被日益强化。低应变是无损检测的一种,操作便捷轻