基于社交网络数据的交通突发事件识别方法

来源 :交通信息与安全 | 被引量 : 0次 | 上传用户:HuSiYou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了从社交网络数据中挖掘出交通突发事件,研究了基于机器学习的文本识别方法。通过关键词和地点定位,利用网页爬虫“Beautiful Soup”爬取到原始文本。采用正则匹配、重复度计算以及“0-1”标记预处理原始文本。基于预处理后文本特征,研究了基于特征权重的特征词选取方法;其中,特征权重的计算综合了词语的出现频率和含有该词语的文本所占比例,通过将二者归一化并加权合并,获得训练集突发事件文本中各个无重复词语的特征权重;依据此值选择确定特征词,并用于后续分类器的输入。测试对比了不同的分类器以及特征词选择方法,结
其他文献
交换机作为通讯传输技术的核心设备,内部芯片产生的热流密度越来越高,提高其散热效率是数据中心稳定运行的前提。本文对应用于交换机散热的新型浸没式液冷技术进行仿真与实验
在人工智能与大数据背景下,自动驾驶船舶因其安全、高效的优势吸引了国内外学者的广泛关注。但其避碰相关法律条例与避碰路径规划发展并不均衡。自动驾驶船舶概念在规范条例
速度是停车视距中最重要的计算参数,而现有停车视距模型的修正计算中较少考虑山岭隧道交通环境对车辆行驶速度的影响。为研究山岭隧道接近段速度流量特性,选取重庆具有代表性