论文部分内容阅读
摘 要:以技术情报系统信息过滤与加工为研究对象,初步探讨了信息过滤与加工的设计方法,阐述了计算机自动过滤与专家手工过滤的分工与合作,并设计了相关的数据表和业务流程,为深入开展相关研究奠定了一定的理论与实践基础。
关键字:技术情报;过滤;加工
中图分类号:TP391.1 文献标识码:A DOI:10.3969/j.issn.1003-6970.2013.06.022
0 引言
技术情报系统运行前期,由于通过各种渠道搜索的情报数据太多,导致不相关信息量大,信息精度通常较低,分散无序,且有时缺乏逻辑性和合理性,因此需要一个鉴别、验证、整理和有序化的步骤,把信息置于竞争战略的考虑中,与专家的知识、经验和判断能力进行充分和结合,对采集的信息进行过滤和加工,使之变为有价值的情报。为此,在设计技术情报过滤和加工功能时,要通过计算机算法和领域专家知识的融合来实现对情报信息的过滤,并对过滤的情报进行二次加工,进而为情报分析和情报预警提供更加精准的数据基础。
1 系统设计描述
1.1 系统功能设计
情报过滤分为计算机自动过滤和专家手工过滤两种方式,情报加工则主要由领域专家根据情报的利用方式、加工内容采取人工的方式。
1.1.1技术内容加工
对于专利和学术论文,系统为领域专家提供收集情报的技术加工功能,加工内容如表1:
该种加工的实现方式是在数据库存储上预留出以上信息字段。其中,技术类别一项指定用户只能从专家知识库中的技术领域内容进行选择,而不能随意填写。
1.1.2预警内容加工
预警内容的加工与技术内容加工为两个并列的加工模块,但又比技术加工更加深入、细致,其针对对象仍为专利和学术论文。具体加工内容设置如表2。
以上指标的取值在数据库中用1、2、3、4数字表示,在页面上用汉字表示,两者一一对应。例如,加工时,专家选择“创新程度”为“高”,那么在数据库中被加工的数据的创新程度字段取值为4,如果选择无创新程度,则存入数据1。
1.1.3技术指标加工
如果专利和论文所描述的技术内容涉及技术指标,如长、宽、高、密度、大小等,而且这些技术指标得到改善,或者领域专家特别关注某一指标,那么在进行情报加工时增加技术指标加工。
1.2 用户流程设计
计算机的自动过滤为必选,由计算机的后台完成。利用专家知识进行的过滤和加工操作由人工完成,在前台页面进行。默认情况下,由计算机过滤的后信息为有用信息,人工过滤进一步强制的把经过计算机过滤的数据删除或标记为不相关。举例如下:
(1)系统搜索到的论文P1、P2、P3….P100,经过计算机过滤后保留下来P1、P3、P5…..P99,把P2、P4、P6、P100标记为“不相关”。
(2)在做分析和预警时,选择数据 where 相关性!<> null,选择的是P1、P3、P5…..P99
(3)如果进行了专家的筛选,进一步从P1、P3、P5…..P99中选出P1、P3、P5、P7、P9,那么,在P11…P99上标记不相关。
(4)在做分析和预警时。与步骤2相同,这样就把专家筛选的剔除了。如果没有专家过滤,也不影响计算机的自动过滤操作。
2 系统实现
2.1 手工过滤的数据库实现方式
对于存储在数据库表中的每一条数据记录,都有一个唯一标识字段和该条记录过滤状态的两个字段
比如专利CN123456789.0,唯一标识为该专利的号码,过滤状态字段1的取值分别为0、1,分别表示这条数据是否经过专家阅读,过滤状态字典2的取值分别为0、1,分别表示这条数据是否是与激光雷达成像压缩传感成像技术具有相关性。通过这两个字段的组合可以对相关数据进行筛选查询。而且,在情报搜索子系统中不会重复下载这条专利数据,只要根据唯一标识判断数据库中已经存在这条数据,不管其状态如何,均不再重复下载。具体实现数据库设置如表3。
2.2 技术加工的数据库实现方式
数据库中infoprocess表用于存储技术加工的内容,表的设计如表4:
3 小结
技术情报系统中对于信息的过滤和加工是形成情报的重要环节,同时是后期情报预警的重要前提和基础。本文对信息过滤和加工功能进行了初步的探讨,为今后的工作奠定了一定的理论基础。
参考文献
[1]陈磊,李德华.热点问题情报过滤模型与算法[J].武汉大学学报.2008年第3期.
[2]王宏生.基于本体的信息过滤研究[J].科技信息.2009(29).
[3]谢科.文本分类系统关键技术[J].广西师范大学学报.2007(2).
[4]严莉莉.基于类信息的文本聚类中特征选择算法[J].计算机工程与应用.2007(12).
关键字:技术情报;过滤;加工
中图分类号:TP391.1 文献标识码:A DOI:10.3969/j.issn.1003-6970.2013.06.022
0 引言
技术情报系统运行前期,由于通过各种渠道搜索的情报数据太多,导致不相关信息量大,信息精度通常较低,分散无序,且有时缺乏逻辑性和合理性,因此需要一个鉴别、验证、整理和有序化的步骤,把信息置于竞争战略的考虑中,与专家的知识、经验和判断能力进行充分和结合,对采集的信息进行过滤和加工,使之变为有价值的情报。为此,在设计技术情报过滤和加工功能时,要通过计算机算法和领域专家知识的融合来实现对情报信息的过滤,并对过滤的情报进行二次加工,进而为情报分析和情报预警提供更加精准的数据基础。
1 系统设计描述
1.1 系统功能设计
情报过滤分为计算机自动过滤和专家手工过滤两种方式,情报加工则主要由领域专家根据情报的利用方式、加工内容采取人工的方式。
1.1.1技术内容加工
对于专利和学术论文,系统为领域专家提供收集情报的技术加工功能,加工内容如表1:
该种加工的实现方式是在数据库存储上预留出以上信息字段。其中,技术类别一项指定用户只能从专家知识库中的技术领域内容进行选择,而不能随意填写。
1.1.2预警内容加工
预警内容的加工与技术内容加工为两个并列的加工模块,但又比技术加工更加深入、细致,其针对对象仍为专利和学术论文。具体加工内容设置如表2。
以上指标的取值在数据库中用1、2、3、4数字表示,在页面上用汉字表示,两者一一对应。例如,加工时,专家选择“创新程度”为“高”,那么在数据库中被加工的数据的创新程度字段取值为4,如果选择无创新程度,则存入数据1。
1.1.3技术指标加工
如果专利和论文所描述的技术内容涉及技术指标,如长、宽、高、密度、大小等,而且这些技术指标得到改善,或者领域专家特别关注某一指标,那么在进行情报加工时增加技术指标加工。
1.2 用户流程设计
计算机的自动过滤为必选,由计算机的后台完成。利用专家知识进行的过滤和加工操作由人工完成,在前台页面进行。默认情况下,由计算机过滤的后信息为有用信息,人工过滤进一步强制的把经过计算机过滤的数据删除或标记为不相关。举例如下:
(1)系统搜索到的论文P1、P2、P3….P100,经过计算机过滤后保留下来P1、P3、P5…..P99,把P2、P4、P6、P100标记为“不相关”。
(2)在做分析和预警时,选择数据 where 相关性!<> null,选择的是P1、P3、P5…..P99
(3)如果进行了专家的筛选,进一步从P1、P3、P5…..P99中选出P1、P3、P5、P7、P9,那么,在P11…P99上标记不相关。
(4)在做分析和预警时。与步骤2相同,这样就把专家筛选的剔除了。如果没有专家过滤,也不影响计算机的自动过滤操作。
2 系统实现
2.1 手工过滤的数据库实现方式
对于存储在数据库表中的每一条数据记录,都有一个唯一标识字段和该条记录过滤状态的两个字段
比如专利CN123456789.0,唯一标识为该专利的号码,过滤状态字段1的取值分别为0、1,分别表示这条数据是否经过专家阅读,过滤状态字典2的取值分别为0、1,分别表示这条数据是否是与激光雷达成像压缩传感成像技术具有相关性。通过这两个字段的组合可以对相关数据进行筛选查询。而且,在情报搜索子系统中不会重复下载这条专利数据,只要根据唯一标识判断数据库中已经存在这条数据,不管其状态如何,均不再重复下载。具体实现数据库设置如表3。
2.2 技术加工的数据库实现方式
数据库中infoprocess表用于存储技术加工的内容,表的设计如表4:
3 小结
技术情报系统中对于信息的过滤和加工是形成情报的重要环节,同时是后期情报预警的重要前提和基础。本文对信息过滤和加工功能进行了初步的探讨,为今后的工作奠定了一定的理论基础。
参考文献
[1]陈磊,李德华.热点问题情报过滤模型与算法[J].武汉大学学报.2008年第3期.
[2]王宏生.基于本体的信息过滤研究[J].科技信息.2009(29).
[3]谢科.文本分类系统关键技术[J].广西师范大学学报.2007(2).
[4]严莉莉.基于类信息的文本聚类中特征选择算法[J].计算机工程与应用.2007(12).