时间: 2018年04月26日 09:30
地点: 基础教学楼B座318实验室
研读成员: 李晓伟
研读内容:
[1]Chu D, Sheets D A, Zhao Y, et al. Visualizing Hidden Themes of Taxi Movement with Semantic Transformation[C]. Visualization Symposium. IEEE, 2014:137-144.
论文简介:
首次将文本可视化的方法应用到交通数据中,通过语义转换将出租车轨迹转换为文本数据集。将出租车GPS位置映射到它所在的街道名称,因此,位置坐标就变成了一个关键字,每辆出租车的运动轨迹可以看作一份由出租车穿过街道名称组成的文档,所有的出租车的轨迹就构成了一个文本库。对于这样的文档进行语义分析,通过LDA主题生成模型,分析出租车主题。出租车的主题反应了城市的移动模式和趋势,通过一个可视化系统进行显示和分析。该系统集成了交互式的可视化工具,包括出租车主题地图、主题路线、街道云和平行坐标,以及可视化基于概率的局部信息。
基于LDA的出租车主题
该系统与以前的方法的区别在于:
- 将语义引入到是空数据中,使用了标签云来帮助用户直接查找信息。
- 将基于LDA计算的概率和熵用于可视化街道和出租车轨迹的多样性,
- 可视化了组行为的模式发现,该模式由地图上多个颜色层的聚类实现。街道线的透明度被用来显示重叠在街道上的重叠的主题的相关概率。
本文的系统主要由四个视图:
a.出租车主题视图:
b.街道云:用来显示语义信息和街道之间的关系,街道名称的大小反应了街道的重要性,街道上多个主题的概率分布绘制成图线。
八个出租车主题以及不同主题的词云
c.街道和轨迹的平行坐标视图:每个维度是一个主题,每个折现代表一条街道。点击一个主题会高亮主题中高概率分布的街道。
d.主题随时间演化视图:每个颜色表示一个主题,半径由主题的重要性决定,重要性高的主题会放到重要性低的主题之上,每一列表示一个时间段,不同时间段同一个主题通过链接连接,链接的粗细由相似度决定。
本文使文本分析技术能够应用于大规模的GPS采样数据。将LDA模型用于生成出租车主题,反映了出租车出行的固有模式。并开发了一个可视化分析系统以探索基于发现主题的大规模出租车轨迹数据。可视化支持各种可视化分析任务。近阶段发表了很多与文本相结合的研究,大家可以关注一下将文本数据与GPS数据结合的相关研究,很有意思。