2015春季论文推荐——FM1412

  1. How Community Feedback Shapes User Behavior(社区反馈如何塑造用户行为)

主要内容:社交网络的个性化、排名和内容过滤都依赖于用户的反馈和评级机制。用户一般通过跟随其他用户(如赞一个帖子或为其评论投票)来评价内容,这种评价机制使得反馈效果十分复杂。该文章研究一篇帖子文章的评级如何影响作者将来的行为。首先使用众包平台建立评价反馈效果的衡量标准,接下来使用倾向性分数匹配的方法量化社区反馈在对户文章质量的影响,进而分析反馈效果对作者和社区的影响。通过对四个大型评论式新闻社区的研究,发现与传统的自发心理学理论相反,负面反馈对被评价的个人和所在社区都会有显著的损害,正面的反馈也不会有明显的激励作用。

推荐理由:同样改变了普通的研究思路,不再关注用户评分的预测,而是研究评分对社区中个体行为的影响,并从社区级别理解这种影响。结合了众包平台、数学分析建模和数据挖掘灵活地解决实际应用问题。

引用: J. Cheng, C. Danescu-Niculescu-Mizil, J. Leskovec. AAAI International Conference on Weblogs and Social Media (ICWSM), 2014.

  1. Evolution of online user behavior during a social upheaval(社会剧变区间在线用户行为的演化)

主要内容:该文研究了在社会动荡期间在线用户行为的演变,主要通过Twitter收集了2013年土耳其反政府抗议运动期间与该抗议活动相关的230多万条twitter进行分析。文章以hashtag为种子进行扩张筛选收集相关twitter,分析这些twitter的时空特征;使用趋势相似度矩阵对话题进行聚类,分析话题内容同地缘政治之间的关系;使用社会关联度和互动程度衡量用户角色,并分析在社会动荡期间用户角色的转变;此外还研究了真实世界的政治事件同在线用户行为(如用户参与程度或集体改名)之间的关系。

推荐理由:(1)ACM Web Science 2014 Best Paper Award

(2)几乎没有高深的数据挖掘或数学算法,只进行必要实用的分析。使用实事政治为切入点分析用户行为和社会动荡事件之间的关系,发现有意思的结论;找到的蛋糕够大,切到的那块也够甜,值得借鉴。

引用:Varol O, Ferrara E, Ogan C L, et al. Evolution of online user behavior during a social upheaval[C]//Proceedings of the 2014 ACM conference on Web science. ACM, 2014: 81-90.

  1. Domino-Extracting,Comparing,and Manipulating Subsets across Multiple Tabular Datasets(多表数据集子集间的抽出, 比较和操作)

主要内容:介绍一种名为Domino的多表数据可视分析技术,用于表示数据集的子集以及子集间的关系,进而对多表数据进行用户定制的关联分析。该技术给使用者提供了一套对子集进行排列组合和抽出的综合工具,可以让用户实现常见的简单可视化形式以及针对特殊案例的高级可视化形式。除了十分方便的子集操作体验,在其交互设计中也有比较优秀的功能:实时预览live preview和占位符placeholder。通过 还可随意调节大小以及比例尺支持可扩展性。

推荐理由:系统比较完备,可以支持扩展,甚至可以定义为表数据可视化的一个grammar。尤其是论文的主要case解决的是基因序列的相关问题,值得生物项目组的可视化小组成员阅读。

引用:TVCG2014

1

  1. Analysis of the Reputation System and User Contributions on a Question Answering Website: StackOverflow(以程序员问答网站stackoverflow为例分析其荣誉体系和用户贡献之间的关系)

主要内容:stackoverflow(SO)是全球最大的程序员问答网站,其荣誉(reputation)是用户参与其中的奖励,也是该用户专业程度的表征。文章详细研究了SO的荣誉机制,考察其表征用户专业程度的可信度,定量分析用户荣誉值与其活动之间的关系,通过发现的规律进一步研究用户注册初期的活动模式,建立用户活动模型(UAM),以此构造随机森林对新用户未来的专家程度进行预测,取得了较好的效果。

推荐理由:文章条理清晰地叙述了该团队的研究过程,从初始的探索分析到后期集中的目的明确的精准分析,最终根据分析结果提出有效预测问答网站中专家的算法。整篇文章的研究内容和研究过程都值得借鉴。

引用:Movshovitz-Attias D, Movshovitz-Attias Y, Steenkiste P, et al. Analysis of the reputation system and user contributions on a question answering website: Stackoverflow[C]//Proceedings of the 2013 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining. ACM, 2013: 886-893.

  1. Exploiting Social Network Structure for Person-to-Person Sentiment Analysis(从社交网络结构中探索人对人的语义分析)

主要内容:该文主要使用社交网络的结构研究人与人之间的语义分析(相互评价)。与常见的情感分析方法不同,该文类似于co-training的思想,融合了社交网络分析和文本分析两种较为独立的方法,充分利用人类语言和社交上下文之间丰富的相互作用来提高情感分析的准确性。具体来说,通过A与B共现的社交网络分析及A对B相关评价文本的语义分析结果,进行用户A对用户B评价的预测。这是一个NP困难问题,但可以被松弛为一个只有少量转移损失的马尔科夫随机模型,原问题就被转化为一个高效的近似可解问题。

推荐理由:出发点很新,研究的是个人层面的相互评价,一般研究复杂网络的都是全局结构背景下的特性。而且用实验证明了这种co-training思路的可扩展性,即结合文本情感分析与基于网络的预测能够普遍地提升预测性能。

引用:R. West, H. S. Paskov, J. Leskovec, C. Potts. Transactions of the Association for Computational Linguistics (TACL), 2, 2014.