2015年春季学期论文研读推荐文章—by Katrina

阳春三月,莺飞草长。新学期伊始,实验室的论文研读即将拉开帷幕。本学期,我推荐的五篇论文如下:

一、论文一:

1、题目:VAET: A Visual Analytics Approach for E-transactions Time-Series

2、链接:http://ieeexplore.ieee.org/xpl/articleDetails.jsp?arnumber=6876015&contentType=Early+Access+Articles

3、主要内容:该论文结合概率决策树和可视分析的方法对电子商务交易数据中的有趣模式和异常模式进行识别和探索,并研发了一套可视分析系统VAET。结合领域专家手动标注的样本,作者通过定义“显著值(saliency)”,对每次交易进行标注,并设计了两种可视化方法time-of-saliency (TOS) map和KnotLines对结果进行展示。用户可通过交互发现不同视图间的关联,还可在结果中手动对交易进行标注,让整个可视分析过程不断迭代。

系统界面如下图所示:

---300x161

4、推荐理由:

1)选题:近年来,网购掀起了热潮,尤其是2014年淘宝双11史无前例地成功,但随之而来的问题也不少(e.g. 淘宝商家为了排名恶性刷销量)。该论文正是基于这样的前提,去发现其中fake transaction,为电商平台管理商家提供了指导意义,具有实际价值。同时,电子商务数据可视化目前研究地较少,从2010年到现在这是第二篇,随着网购的普遍化,相信这个研究点会越来越热。

2)内容:目前,我第二篇小论文的研究点也在电子商务数据的可视化,但当我拿到数据时,发现里面有很多东西可以做,不知道到底该做什么或者目的是什么。这篇论文跟我的研究内容很相似,但它目的很明确,整篇论文围绕一个目的去研究,去写,逻辑清晰,到最后,问题也很好地解决了。

3)方法:在可视化领域,将数据挖掘和可视化方法结合是近年来的热点,该论文很好地诠释了这点,在交互当中加入样本标注,让整个概率决策的过程可视也论文的亮点。同时,作者基于五线谱,提出了一种新的可视化方法KnotLines。

二、论文二

1、题目:#FluxFlow: Visual Analysis of Anomalous Information Spreading on Social Media

2、链接:http://ieeexplore.ieee.org/xpl/articleDetails.jsp?arnumber=6876013&contentType=Early+Access+Articles

3、主要内容:该论文的目的是揭示和分析社交媒体中异常信息的传播。作者首先用一阶条件随机场模型(OCCRF)来检测异常信息,其后设计了新颖的可视化方法来展示异常信息随时间变化的结果。最后,通过定量的算法表现分析和定性的分析验证了方法的有效性。

系统界面如下图所示:

--2-300x136

4、推荐理由:

1)选题:传统的社交媒体可视化通常展示主题的变化,好友关系网络等,本论文虽然也研究社交媒体可视化,但切入点比较新颖,研究重点在异常信息的传播。

2)方法:近年来,流可视化在信息可视化领域运用广泛,该论文的主视图也借鉴了流可视化的思想,但展示方法却很新颖,即离散的流。通过将retweet表示成一个个的小圆圈,这样既能看到整体变化趋势,又能看到细节的变化。

三、论文三

1、题目:Visual Cluster Exploration of Web Clickstream Data

2、链接:http://ieeexplore.ieee.org/xpl/articleDetails.jsp?arnumber=6400494

3、主要内容:识别和总结用户对电子商务网站的点击模式对提升个性化购物体验和网站布局策略有指导意义。本论文基于这样的出发点,与ebay公司合作,探索用户的点击行为。作者结合自组织映射和马尔可夫链模型,将用户的点击模式映射到二维的平面中,用可视化方法展示出来,并通过随机贪婪算法对结果进行调整,使整体布局最优。

系统界面如下图所示:

--3-300x172

4、推荐理由:

1)在数据挖掘领域,研究用户使用模式的文章很多;在可视化领域,研究点击流可视化的文章也很多。将二者结合,并去解决一个实际问题且解决得很好的文章并不多。

2)这篇论文所用的数据挖掘方法和可视布局方法都是现成的,但最后的结果却能很好地看出用户行为模式的分布及其对比,与论文目的相契合。

四、论文四

1、题目:Multivariate Network Exploration and Presentation: From Detail to Overview via Selections and Aggregations

2、链接:http://ieeexplore.ieee.org/xpl/articleDetails.jsp?arnumber=6875972&contentType=Early+Access+Articles

3、主要内容:相较于之前关于网络的研究集中在拓扑结构或者多变元数据,该论文的研究将这二者结合,即,多变元网络。论文提出的方法既能展示网络的整体结构,又能展示每个节点的特征。同时,针对领域专家和普通用户的不同需求,论文给出了多变元网络的两种展示形式。

系统界面如下图所示:

--4-300x175

4、推荐理由:

1)方法:论文中提出的方法能同时展示网络的拓扑结构和节点特征。同时,在以往关于网络可视化的论文中,通常只有类似的A视图。在该论文中,A和B视图进行了互补,能清楚地看到高度集成的统计信息和细节信息。

2)可视化的基本思想:可视化的始祖FB Viegas曾经在1996年提出了一套沿用至今的经典理论:“overview first, zoom and filter, then details-on-demand.”在本论文中,作者却反其道而行之,提出了“from Detail to Overview via Selections and Aggregations (DOSA)”的思想。DOSA的提出符合当前数据爆炸的时代,如果数据量非常大,可视化的展示存在如下问题:想要展示overview是否有必要,计算机是否能在较快的时间展示出来,即便渲染效率和运行速度没问题,用户是否能在短时间内理解这么多的数据。因此,DOSA的提出对以后大数据可视化有重要意义。

3)交互:这篇论文的交互方式很丰富也较新颖,和传统的zoom,pan等不同。如果有兴趣,可以到我这里来看video。

五、论文五

1、题目:Visualizing Sets and Set-typed Data: State-of-the-Art and Future Challenges

2、链接:http://www.cad.zju.edu.cn/home/vagblog/vispapers/eurovis2014.html

3、主要内容:本论文是关于集合可视化的综述。集合可视化虽然概念简单,但很多现实问题抽象出来都可以看作集合之间关系的分析,因此,对集合数据及其可视化研究尤为重要。作者根据可视化方法和所支持的任务不同,将集合可视化技术分成了七类。

4、推荐理由:

1)集合之间关系的分析以及集合可视化一直都是研究热点,关于这方面的研究文章每年都有很多,但综述尤其是权威综述却很少。这篇论文是eurovis 2014的文章,作者的团队曾经写过关于时间可视化的综述。

2)这篇论文很适合集合可视化的入门或者快速熟悉该领域,论文对相关的概念、基本原理、针对的领域及任务、具体的可视化方法都做了详细的阐述。