用Microsoft Office进行图书采访查重的体会

来源 :全国新书目 | 被引量 : 0次 | 上传用户:king4978
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  目前,大多数图书馆进行采访查重主要是利用图书馆自身的自动化管理系统、馆配商提供的图书查重平台、购买具有查重功能的采集器以及自己开发的查重软件几种方式进行查重,这几种方式对数据的个性化要求,处理的繁简层次、所耗费的时间以及成本费用都不尽相同。几种方式各有长处,也各有弊端。本人也先后尝试过各种查重方式,最终的结果都不那么令人满意。经过长时间的体会和摸索,发现还是office办公软件靠得住些。以下就如何利用office进行查重,与同行切磋。
  
  1 利用Excel进行查看
  
  由于一张Excel表格只能容纳6万多条记录,采用Excel查重主要是针对比较小的数据,在这里我把它称为局部查重,特别适合采访数据间的相互查重(馆藏小的也适合),对图书验收特别有用,可以有效地杜绝塞书现象。我们可以把来自不同馆配商的采访预订数据做成一个文件,分别放在不同的工作表中,比如将从人天、儒林和三新的预订数据做成一个名叫图书预订数据.xls文件,该文件中就包含人天、儒林和三新三个工作表,也可以把不同馆配商的预订数据分别做成不同的文件,如人天.xls、懦林.xls和三新.xls三个文件,本人习惯做成一个文件。当每新订购一批图书,就将其采访数据加入相应的工作表中或文件中,并作一备注,标明是第几批,以供图书到馆验收查重用。
  1.1 同一表中数据的处理
  包括对书号及重复数据的处理,进行这种处理有助于表与表中查重的效率和准确性的提高。书号的处理主要是针对10位同13位ISBN号间进行转换,建议将10位和13位的ISBN号各入一列,这样就可以用10位查,也可以用13位查。由于同一表中可能会出现几条相同的记录,会造成统计的误差,这就需要对这一重复记录进行剔除,用手动的方法不仅费时而且费神,用表中高级筛选的话,效率就大大提高了。具体操作为选中工具栏中数据下拉菜单一筛选一高级筛选,选中列表区域和条件区域,在复选选择不重复记录,单击确定,表中就会隐藏重复的记录,显示的则是不重复的记录,我们也可以将其记录复制到其它表中。建议以上的操作最好是以ISBN号为条件,书名因同名的太多而不宜用,同一书号的丛书或套书则要单独进行处理。
  1.2 不同表或不同文件间数据的查重
  采购的图书入馆后,先不急着一包一单验收,因为一包一单的图书不一定是本馆订购的书。用订购数据同馆配商的发货数据比对,进行查重,可以将馆配商的塞书剔除,从而有效地杜绝塞书现象。数据的比对实际上是引用Excel自带的统计函数COUNTIF进行统计,最终达到查重的目的。假若本馆现在要对人天公司的发货图书进行验收,只要打开人天的订购数据和发货数据,在ISBN的格式一致时用ISBN号查重:在人天发货数据插入一列,在要插入的列中调用统计函数COUNTIF,这个函数主要用于计算区域中满足给定条件的单元格的个数,语法为COUNTIF(range,criteria),Range为需要计算其中满足条件的单元格数目的单元格区域Criteria为确定哪些单元格将被计算在内的条件,其形式可以为数字、表达式、单元格引用或文本。本例中的Range为人天订购数据中的ISBN列,Criteria为人天发货数据中的ISBN列。通过计算后,数字为0的是未订购的数据,即人天塞书,非零的就是本馆的订购图书。记住插入列前的一列数据不能为空,计算完毕后最好将计算好的值替换成文本,这样会提高处理数据的效率。为了防止馆配商将所到图书在下次重发,最好将已验收的订购图书作一备注,供下次再查重用。这样,就可以从根本上杜绝馆配商塞书情况的发生。在掌握这个函数后,我们可以很方便地进行表与表的比对,不过数据太大会影响计算速度,建议太大的数据比对不用Excel,改用Access。
  
  2 利用Access查重
  
  Access同Excel相比,具有更强大的功能,支持广泛的数据格式,可以处理大型的数据,在查重和去重方面有不可比拟的优越性,其操作方法如下。
  在去重和查重之前,将要处理的数据导入Access表中,包括采访数据,馆藏数据以及其它相关的数据,其数据各字段的格式要保持一致。导入数据后,接着我们就要进行数据的处理。
  2.1 同一文件中的数据去重
  我们先在查询中建立一个去重文件,在设计视图中写入去重命令(sELECT DISTINCT字段名INTO表FROM需要去重的数据文件),其中,字段名指导人数据的各字段,如书号,书名等,“表”是经过处理后的没有重复记录的表,点击执行后,不重的数据就进入“表”中,打开“表”,全是不重的数据记录。
  2.2 不同文件的数据去重
  若要将采访数据A中同馆藏数据B中相重复的记录去掉,可以用DELETE*FROM A WHERE字段名iIl(select字段名from B);命令,其字段名必须相对应,即为同一条件。执行命令后,重复的数据就在A中删除没有了。
  2.3 不同文件的数据的查重
  如果说我们只要知道采访数据A中的哪些数据同馆藏数据B中的数据重了,而不动采访数据A,也好办,用命令SELECT A* INTO c FROM AWHERE字段名in(select字段名from B);命令执行后,重复的数据记录就在表c了,只要打开表c就可以查看重复的数据记录,而采访数据A没有任何变化。
  用Access查重去重很容易实现,只需用简短的命令执行操作,不过,查重前务必要确保导人数据的准确性,否则,查重去重的准确性就没有保障。
  关于用office查重去重,更深层次的东西有待大家进一步挖掘,希望本文起到抛砖引玉之效。笔者以为,为了科学建设馆藏资源及优化馆藏资源,图书馆采购人员必须具备一定的数据处理能力,通过在整个业务链的前端把好图书的质量关,确保提高全馆的服务水平。
其他文献
《热的简史》  [美]姜·范恩著李乃信译  东方出版社2009.8  定价:35.00元     尽管也许这本被冠以“热的简史”之名的书比《时间简史》、《万物简史》似乎稍难懂些,但我还是想拿出来与大家分享这一本“好玩儿”的书。  一本“好玩儿”的书通常是因为背后有“好玩儿”的人。没错。这书是李老爷保媒拉纤得来的。李老爷就是写《这才是你的世界》的那个老头子,我叫他“李老爷”;他有两个鬼灵精的正在上大
吉首大学地处湘鄂渝黔四省(市)边区。该区域包括湖南湘西土家族苗族自治州、张家界市、怀化市,湖北鄂西土家族苗族自治州,重庆黔江开发区,贵州铜仁地区等,面积11万平方公里,人口2100万。湘鄂渝黔四省(市)边区的共同特征——老少边山穷。老——革命老区;少——少数民族聚居区;边——各省(市)边远地区;山——云贵高原东端的武陵山区;穷——全国18个贫困片之一。  “十万大山,百年匪患,千年封闭”是湘西的历
“西楚霸王”项羽是位流传千年、家喻户晓的人物,关于他,“霸王别姬”、“垓下之围”、“四面楚歌”等故事可谓家喻户晓。项羽的一生大起大落,颇有传奇色彩——27岁,从一个普通的反秦将领一跃成为分封十八路诸侯的“西楚霸王”,31岁兵败乌江,自杀身亡,还与虞姬演绎了一段英雄美人的爱情传奇。所谓“一千个读者,就有一千个哈姆雷特”,对项羽的历史评价也是褒贬不一,众说纷纭,有人仰慕项羽的英雄气概和情怀,把他当作灭
知识管理是知识经济时代的一种崭新的管理模式,虽然其理论还不够成熟和完善,但这并不影响它在实践中的应用,如微软、IBM、施乐等国际知名大公司的实践,都充分证明了知识管理产生的成果是惊人的。因此,积极吸收知识管理的研究成果,借鉴企业知识管理的成功经验,提高图书馆的管理水平与服务质量,是时代赋予图书馆的基本要求。怎样利用知识管理理论指导图书馆工作实践,提高图书馆管理的水平,成为本文关注和探讨的问题。  
在夜晚寒冷的空气中,柏林雷鸟队正在气喘吁吁地加紧训练,他们的头盔和垫肩板上冒着热气。  很多人会说,美国的体育、文化和价值观早已经深入到德国的血液里。所以这里那么多的人,包括这些正在球场上狂热地互相冲撞的球员们,一直在密切关注着即将到来的美国总统选举。  “你有点像个旁观者,”四分卫克里斯托弗说,“你影响不了它,但是最终它能影响你。”  在柏林的肯尼迪广场,在叶子泛红的树下走过,穿过一个小市场,就
《对话:中国模式》  赵启正 [美]奈斯比特   [奥]奈斯比特著  新世界出版社 2010.4  定价:29.80元    何谓“中国模式”?未来的中国将往何处去?这些问题切切实实地摆在了国人和世界的面前。近期,全国政协外事委员会主任赵启正与美国著名未来学家约翰·奈斯比特及其夫人多丽丝·奈斯比特的对话集《对话:中国模式》一书为相关议题的探讨带来了新的视角,也为中国公共外交的实践提供了新的思路和示
B、哲学、宗教     中国哲学大纲 /张岱年著 .—江苏教育出版社 ,2005 .—555页 .—(国学书库) .—7-5343-6213-X :¥34.80    中国哲学简史 /冯友兰著;赵复三译 .—天津社会科学院出版社 ,2005 .—314页 .—7-80688-221-9 :¥25.00    后生小子:诸子百家新九章 /鲍鹏山著 .—华东师范大学出版社 ,2005 .—179页 .
还是在上世纪60年代的中叶,仅是初中生的我曾读过两本小册子。一本是胡佩衡写的《我怎样画山水画》,其中选有黄宾虹的《写景山水》作为范画;一本是王伯敏编的《黄宾虹画语录》,由此开始了我对黄宾虹先生的好奇与关注。谁曾想到,时融四十余年后的今天,我竟有幸成了《黄宾虹全集》的编辑者之一。  全集的编辑过程,是我们对黄宾虹这位“画之大者”深入认识的过程;是我们对他艺术成就、艺术实践和艺术精神认真梳理总结的过程
浙江大学机械工程学院教授邹俊的主攻方向是软体机器人,2019年1月,AdvancedMaterialsTechnologies在封面刊登论文《真空驱动的软气动柔性扭转执行器,赋予软体机器人新的功能》“Vacuum‐PoweredSoftPneumaticTwistingActuatorstoEmpowerNewCapabilitiesforSoftRobots”,他是该论文的通讯作者,文中描述了一
手指保健常被大家所忽略,但手指和身体其他部位一样需要足够休息,也能通过适当运动加强其伸缩性。  你是否长时间打字或写字,或常常手握菜刀、剪刀、螺丝刀或其他工具?  衣服是否坚持手洗,桌布和拖把是否常用双手扭干?  购物袋又多又重,你是否都用手指抓握提柄?  其实,这些重复性挤压手掌和手指,以及让手指长时间出力的动作,都对手部肌腱有不良影响。长久下来,可能导致板机指(trigger finger)。