基于敏感地点标注与敏感人物信息限定的组织发现

来源 :中国科技博览 | 被引量 : 0次 | 上传用户:jealy0717
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘 要]随着无线互联网时代的来临用户与服务提供商进行的数据交互越来越频繁,应用功能服务商为用户提供实时、随地的无线互联网数据信息服务,这也是是未来信息服务业的发展趋势。基于空间位置提供服务的手机网络APP越来越多,并成为一种能够快速有效抢占市场份额的应用特征特征。如,OFO,MOBIKE,外卖软件等等。本论文讨论的是类似于“组织发现”的算法,旨在基于把所有用户传回的位置信息进行处理,筛选出可能是“同伴”的用户,并对此挖掘一定的商业价值。
  [摘 要]组织发现、算法、敏感地点、敏感人物
  中图分類号:TP311.13 文献标识码:A 文章编号:1009-914X(2017)24-0250-01
  一、 课题研究现状及意义
  目前国内外的研究现状主要是对经纬度信息进行平面X,Y坐标映射[1],转化成平面坐标系利用点的聚类分析算法对经纬度数据进行聚类处理。优点是输入简单,只需要输入所有点的经纬度数据,不需要进行额外的输入即可得到结果。缺点:计算的信息量巨大,每次计算需要迭代入所有的點的数据。结果不准确,结果不是以人为单位而是以位置点为单位造成了计算结果含义模糊输出不确定不准确。例如,一个人P的有些轨迹点聚类到了群体A,另一些轨迹点聚类到了群体B,还有一些轨迹点聚类到了群体C。在这种情况下我们不能直接根据结果得出结论,人物P同时属于A、B、C三个群体,则样的结论是不负责任切不准确的。还是上述这种情况,我们需要具体认为的分析每一次聚类结果检查人物P的轨迹点在聚类A中多一些还是B中多一些还是C中多一些。具体阈值需要人为地每一次进行规定才能判断人物P属于哪个团体,结果无法复用且冗余太多,需要人为调整的地方太多。从根本上来说,这类聚类算法的原理是以每一个孤立的点为基本单位进行聚类处理,没有以人为基本单位。得到的只是点属于哪一个点群体而不是人属于哪一个组织,算法的基本单元一个个轨迹点而非人,这类算法的主要算法是SCAN(Density-Based Spatial Clustering of Applications with Noise)基于密度的聚类算法。本文中的算法是以人为基本单位的人群组织发现算法。以人物的IMEI(国际移动装备辨识码)、IMSI(国际移动用户识别码卡号)、MSISDM(电话号码)三个卡号作为一个人物的唯一识别码。本算法开始需要的输入的部分比较多但是算法的结果部分比较准确。标识敏感地点以及给出敏感人物三个卡号中的一个卡号就可以在所选定的敏感地点中找出所有与给定敏感人物是同伙的人员。完成指定目标区域特定人物团伙发现这一功能。
  二、算法原理
  在给定一个敏感人物的前提下,想要挖掘出他的所有类似同伙的过程,本文算法是这样实现的。首先第一步输入想要进行观测的敏感地点,在地图上圈起来几个想要关注的敏感地点。设计算法使用solr查询从数据库查询所有在敏感地点区域中的所有人物。制成列表,相同敏感地点中的所有人物存储在一张表中即几个敏感地点就有几张表。接着第二步输入敏感人物的三个卡号(至少输入一个),若输入的敏感人物的三个卡号中有空值,则将拿到敏感人物卡号进行模糊处理,使用正则匹配中的模糊匹配字符串代替卡号中空值的部分,模糊匹配字符串:([\\s\\S]*?)。利用正则匹配对几个敏感地点列表中的所有人物进行匹配。(将三个卡号按照固定顺序合成一个字符串可以大大增加匹配效率)。如果敏感地点人物列表中匹配成功了敏感人物说明敏感人物到过这个敏感地点的范围内,则保留这张敏感地点人物列表。反之,敏感地点人物列表中没有匹配到敏感人物则说明敏感人物没来过,此时这张敏感地点人物列表对接下来的计算没有用途,丢弃掉。对所有敏感地点人物列表全部迭代匹配了一次敏感人物之后,经过筛选我们就得到了敏感人物去过的敏感地点的人物列表。接着第三步,对得到的剩余的敏感地点人物列表进行频繁项集记录。本算法利用HashMap以键值对的方式来保存每个人物的频繁项集。伪代码如下:
  While(遍历所有敏感地点任务列表)
  {if(键值对表map中没有地点列表中的人物){
  将该人物加入到map键值对的key键中,并设置其对应的value值为1}
  Else(键值对表map中有地点列表中的人物){
  查询键值与该人物对应的value将其自增,value++,替换原来键值对应的value
  }
  }
  这样迭代一次之后敏感地点人物列表中的所有对应的人都有了与之对应的值(value),接下来设置一个阈值,num=size(敏感地点列表的个数)/2+1,所有键值对中value值小于这个值得键值对都将被删除(频繁度不够)。这样得到的所有的键值对的值key都是可能与给定的敏感人物是一个组织的“同伙”。该算法的优点是稳定,不需要人为调整阈值。算法结果准确,配合可视化技术看起来直观,以人物为基本单位挖掘出所有可能的与核心敏感人物有关系的可疑人物聚集成的组织。
  可视化方面,采用的是openlayers3,javascript完成的。Openlsyers是一种基于JavaScript的地图操作行为,本项目中负责在地图中给敏感人物及其团伙进行打点,在地图上标注出来,以及人群聚合将人群比较多的情况(画面冗杂),聚合成一个大圈使得画面比较清晰整洁。
  参考文献
  [1] 龚玺,裴韬,等.时空轨迹聚类方法研究进展[J].地理科学进展,2011,30(5):522-534.
其他文献
中图分类号:G206 文献标识码:A 文章编号:1009-914X(2017)24-0239-01  我们生活在信息时代,飞速发展的互联网技术使人与人之间的交流突破了身份、地域的限制,在虚拟的网络时代里,个人的独立性被增强、放大、个人的欲求也越来越呈现出多元化的形态,网络在给我们提供获取信息、沟通交流、便捷服务等功能的同时,淫秽色情内容也通过网络的高效便利广而传播以致泛滥。  根据我国《刑法》等相
期刊
[摘 要]大学教育体系中,体育课所占的比例相对较高。但是,既往的教学方式很难引导大学体育摆脱低效的困境。新课改的全面推進,很多学生开始将自主学习视为体育锻炼的一部分。自主学习,遵循了主体教育理论的理念,通过建立某种教学模式,令学生可以真正成为学习的主人,且在操作方面,可引导学生结合个人的需求,对学习场地、时间以及内容等进行自主、自由地选择,抓好学习进度,让学习升格为自主行为。文章就大学体育教学中的
期刊
[摘 要]在幼儿园的教育活动中,保育员应成为教师的得力助手。本文通过提高保育员理论认识、强化保育员角色定位和加强保育员与教师的有效配合等方面来阐述保育员科学配合教育活动的策略,使保育员从教育的“旁观者”转变成为教育的“参与者”,对幼儿的教育活动起到积极的促进作用。  [关键词]保育员 教师 教育活动  中图分类号:H319 文献标识码:A 文章编号:1009-914X(2017)24-0234-0
期刊
[摘 要]选修课走班制教学模式的实施区别于传统的课堂教学模式,它能最大限度地满足学生发展的个性化需求;有效地实现因材施教;有助于推进分层教学。中职选修课起步较晚,但随着走班制教学的不断深入,其优势与存在的问题也不断显现。作为声乐选修课的任课老师以及班主任,笔者深刻认识到加强选修课班级管理的重要意义。经过实践,归纳其主要策略有:执行多轨化管理,落实全员育人;强化教育资源配备,实施全程育人;完善一人一
期刊
[摘 要]艺术活动是一种情感和创造性活动,幼儿在艺术活动过程应有愉悦感和个性化的表现。[1]而具有抽象风格的绘本正是一种情感表达、个性化的体现,本文以绘本抽象绘画风格为例,利用创想续编、游戏整合、创意添画、音乐辅助的方法开展了美术教学活动,鼓励孩子大胆创新,体验艺术创作的快乐,为美术教学活动开启新的生机。  [关键词]抽象绘画风格 绘本 幼儿美术教学  中图分类号:G613.6 文献标识码:A 文
期刊
[摘 要]家庭教育與幼儿教育的互补,需从对幼儿园教育进行准备,对幼儿园教育的内容进行巩固和延伸,对幼儿园教育中缺失的方面进行补充这三个方面进行,并加强父母和幼儿园的沟通交流,对孩子每个阶段的情况互通有无,尽量做到家庭教育和幼儿教育的无缝连接,对幼儿的健康成长有及其重要的作用和意义。本文以家庭教育对幼儿园教育的准备,巩固延伸和补充简要分析如何实现家庭教育和幼儿园教育的互补。  [关键词]家庭教育;幼
期刊
[摘 要]近些年由于环境质量下降导致雾霾天气频繁,这使得幼儿的户外体育活动时间大量缩水。另外,天气变化也是阻碍幼儿正常进行户外体育活动的因素之一。“室内体育游戏”是幼儿在活动室、阳台、楼道、门厅等室内场所进行的身体活动。它作为一种体育游戏的补充,可有效地解决因天气、季节因素造成的户外体育活动的局限问题,让幼儿达到锻炼的目的,促进幼儿在体能、情绪、个性、认知等方面健康、和谐的发展。  [关键词]内容
期刊
[摘 要]小学美术在培养学生动手能力方面有十分重要的作用。美术学习过程中集合了大量的动手操作和创造性思维,在小学美术教学活动中,提倡锻炼并提高学生的动手能力,引导学生主动积极地创作,动手参与各种美术教学活动。  [关键词]小学美术教学;动手能力;教学策略  中图分类号:G623.75 文献标识码:A 文章编号:1009-914X(2017)24-0237-01  小学生由于年龄特点,注意力容易分散
期刊
[摘 要]随着网络技术的快速发展,高职院校深入开展数字化校园的建设,在信息推广方面更要做好相关的工作。  [关键词]高职院校;数字化校园;信息推广;对策  中图分类号:G717 文献标识码:A 文章编号:1009-914X(2017)24-0236-01  1.前言  隨着信息技术的发展进步,高职院校尽管起步较晚,但是通过了不断的发展,信息化推广技术也在不断的提高。  2.数字化校园的概念  高职
期刊
[摘 要]当前我国出现了较为严重的制造业需求与工业设计教育的错位,这使得我们现在急需理清我国工业设计教育的情形,并且要将设计教育的思路理清楚,这势在必行。我们可以通过分析国内外工业设计教育模式,从而找到我国工业设计教育存在的纰漏,找到其差异并进行研究反思,这样才能够集百家之长,推出具有中国特色的工业设计教育模式。  [关键词]比较 工业设计教育 反思  中图分类号:TB47-4 文献标识码:A 文
期刊