时间:2018年06月21日 09:30
地点:望江基础教学楼B座318实验室
研读成员:王翔坤
研读内容:
Qingqing Chen ; Zheng Hu ; Hang Su ; Xiaosheng Tang ; Ke Yu.Understanding Travel Patterns of Tourists from Mobile Phone Data: A Case Study in Hainan[J]. 2018 IEEE International Conference on Big Data and Smart Computing,2018
一.论文简介:
1.简介
本文介绍了一种以旅游为中心,基于移动设备生成的数据,对旅游资源进行优化配置的方法。笔者设计了一个新的分析框架,通过使用大量的匿名CDR来了解游客的旅行模式。分析框架由数据层,算法层和应用层三层组成。在算法层中定义了捕获游客的多维移动性信息的新的区域活动时间(RAT)模式。应用层显示了算法在发现炎热地区和流行旅游模式中的可用性,分析旅游季节效应以及旅游者的旅游行为,住宿偏好。本文的研究框架为旅游专家提供有价值的旅游流动信息,并有助于加强旅游管理。
图1 分析框架的总体架构
2.主要工作
1)首先将游客的轨迹划分为几个停留点,以满足一定的时间和空间限制。笔者从手机轨迹推断游客的停留点;同时将游客的停留点分组为ROIs,并为研究区内的某个景点手动定义地理围栏。地理围栏内的滞留点将聚集到相应的景区。然后,将DBSCAN算法应用到其余的停留点上。根据DBSCAN算法的结果按照它们所属的管理区域划分成不同的簇来调整结果。最后游客轨迹上的所有停留点都集中在一个Rols中。 图2中的彩色点代表三亚的停留点,同一颜色的点属于同一个群
图2:三亚的ROIS空间分布
2)使用基于贝叶斯定理的概率模型,计算给定时间段内活动的概率,并使用的活动到POI映射如表为游客的轨迹添加活动识别。
图3:在给定停留点和特定时间的活动概率计算公式
3)在进行活动识别之后将游客的基于活动的停留点序列转换为RAT序列,并在RAT序列数据库上执行PrefixSpan算法来发现游客频繁的RAT序列模式。
图4:转换过程
图4(a)是一个游客的基于活动的停留点序列,包含停留点,活动类型和时间戳的ID。图4(b)是描述停留点与Rols之间关系的停留点到RoI图。图4(c)是转化后的RAT序列。可以观察到,RAT序列中的记录小于原始的停留点序列,这是因为重复被放弃。转换后,采用着名的PrefixSpan算法来发现频繁的RAT序列模式。只保留最大模式以避免冗余。
4)设计了一个基于Levenshtein距离的距离度量来度量不同RAT序列的不相似度;
θ1,θ 2 和 θ3是用于在计算RAT项目的相似度时调整空间,时间和语义信息的权重的参数。RSimi,ASimi和TSimi是区域相似度,活动相似度和时间相似度。
- 总结
1)本研究通过使用具有时空信息的大规模CDR数据来关注旅游领域。
2)介绍一个由三层组成的分析框架。算法层将现有技术与一些新算法相结合,以揭示游客运动的基本模式。
3)在算法层定义了捕获游客的多维移动性信息的新的区域活动时间(RAT)模式,从游客的轨迹中发现旅行目的,并发现旅游社区。