基于局域网的信息推送系统

被引量 : 0次 | 上传用户:helpothers
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet/Intranet的迅速发展,基于WWW的网上信息的收集,发布及查询检索等事务处理为信息社会带来了全新的概念。于是基于Internet/Intranet的信息处理也就日益成为人们关注的焦点。在这种背景下,信息推送技术应运而生。推送技术的本质在于让信息主动的去寻找用户,因此其优势在于信息的主动性。通过使用该技术,可以主动的将信息推送到用户面前;其弱势在于信息的准确性比较差,由于简单的筛选机制取代了人工的选择,必然会使推送的信息和用户的需求之间存在一定的差异。推送技术在Internet上没有取得成功,原因是多方面的。对于网络信息提供商(ISP)来说,一方面因为它的用户类型太复杂;另一方面由于受到带宽的限制而无法成功的进行信息推送。而在一个单位或者部门,由于组内用户的兴趣是接近的,因此有实现信息推送的可能性。 为此,我们对“基于局域网的信息推送系统”进行研究。所做的工作如下:首先,利用基于实例的方法得到了一个组的兴趣,并建立对应的兴趣模型;其次,利用现有的搜索引擎技术根据该组提交的查询关键词得到文档集。使用向量空间模型将用户的兴趣以及得到的文档表示成为向量形式{(k1,v2),(k2,v2)…(kn,vn)},并使用夹角余弦公式计算两者之间的相似度,将相似度最大的前N篇文档推送给用户。最后,在用户反馈单元,使用了算术平均和证据理论两种方法来处理用户的反馈。目的在于将组内所有用户的兴趣进行综合,得到对文档的一个综合评价,以便更好的修改初始的profile,以期提高推送的准确率。 进一步的工作:1.尝试使用别的方法来计算群体兴趣以及文档中关键词的权重;2.检验是相似度值还是推送的文档数目作为过滤指标对提高用户的满意度更好;3.进一步完善基于局域网的信息推送系统的功能。
其他文献
本论文分三部分论述了《今文尚书》的文学艺术成就。 第一部分文体论,梳理了从古至今对《尚书》文体划分的材料,并论述传统六体“典、谟、诰、训、誓、命”的特点、内容,对其
前言 艾滋病已成为全球最严重的公共卫生和社会问题之一。我国艾滋病流行呈快速上升趋势,已进入快速增长期,高危人群中艾滋病的流行开始向一般人群扩散。与其他传染性疾病不
兼语句(bi-constituent sentences)作为现代汉语中一种特殊的句法和语义结构长期以来一直倍受语言学界的关注。典型的兼语句如(1)所示: (1)张三请李四来北京。 按照传统
本文共约19万字,分9章对《鬼谷子》进行研究,其中主要涉及《鬼谷子》的真伪问题、作者问题、成书问题,以及其中蕴涵的文学理论及其在先秦文学史上的地位等4个大的问题。主要结论
本文系印度瓦腊纳西甘地研究所所长迪帕克.马利克教授应约而为本刊专门撰写的论文。自从圣雄甘地于1908年提出非暴力不合作主义以来,已经过去一百年了。他的学说和实践在印度
荆襄地区军事地理位置很早就引起不少政治家、军事家和学者的关注。中国历史上的许多战争大多以此地理位置为依托,而一举取得成功的。该区域在中国历代战争中的作用有史可鉴,
中国货币化房改制度推进以来,房地产行业进入了快速发展的轨道,并日益呈现出群雄纷争的新格局,其竞争空前剧烈,因此创造竞争优势是房地产企业的必由之路。本文以价值链为工具
本文基于微观调查数据,利用有序Probit模型对影响我国西部地区高校教师薪酬满意度的因素进行了系统分析。研究发现:西部地区高校教师薪酬满意度整体水平不高;文化程度、职称
情绪智力是传统智力所忽视的一种智力,它主要研究情绪、情感、感情在智慧(智力)活动中的功用以及它们与认知密切协同作用处理情绪性问题的能力。虽然这种思想有着悠久的历史,但
文学的常态,或者说什么样的关系才是文学与现实生活所要建立起的理想、良性的正常关系,这一直是文学界在探讨和关注的问题。就九十年代文学来说,它一方面是向着现实密切地靠拢,而