时间:2023年1月8日(周日) 09: 30
地点:腾讯会议(线上)
分享者:甘霖、王启鹏
Part1
分享者:甘霖
分享内容:
[1] Predicting RNA-RBP Interactions by Using a Pseudo-Siamese Network
[2] DeepPN: a deep parallel neural network based on convolutional neural network and graph convolutional network for predicting RNA-protein binding sites
论文简介:
[1]Predicting RNA-RBP Interactions by Using a Pseudo-Siamese Network:大规模的 RNA-蛋白质结合数据使得 RNA-蛋白质相互作用的计算识别成为可能,这为揭示非编码 RNA 与 RNA 结合蛋白 (RBP) 之间的相互作用提供了极大的便利。各种机器学习方法已应用于预测 RNA-蛋白质相互作用 (RPI)。然而,大多数 RPI 预测因子都是为线性 RNA 设计的,而针对环状 RNA (circRNA) 的方法很少。此外,大多数预测器仅使用 RNA 序列或仅使用蛋白质序列作为输入。使用深度神经网络从 RNA 和 RBP 序列中自动学习特征具有改进 RPI 预测因子的巨大潜力。在本文中,我们提出了一种新方法 PSi-bind 来预测 RNA 和 RBP 之间的结合关系,该方法具有伪连体神经网络的特点。我们将 RNA 和 RBP 序列嵌入特征提供给网络,并执行端到端学习以发现 RNA 和 RBP 之间的潜在关联。特别是,我们在大规模 circRNA 数据集上训练我们的模型。实验结果表明,该模型在独立测试集上实现了非常高的准确性,并且大大优于最先进的 RPI 预测器。
[2]DeepPN: a deep parallel neural network based on convolutional neural network and graph convolutional network for predicting RNA-protein binding sites:通过使用有效的计算方法来分析 RNA 结合蛋白 (RBP) 结合位点来解决传统生物实验的费力性质一直是一项具有挑战性的任务。RBP 在转录后控制中起着至关重要的作用。检测 RBPs 结合位点的传统方法既费时又计算量大。最近,计算方法已被纳入 RBPs 的研究中。然而,许多预测不仅依赖于 RNA 的序列数据,还需要额外的数据,例如 RNA 的二级结构数据,以提高预测性能,为了减少这些前期工作的依赖性,在本文中,介绍了 DeepPN,这是一种由卷积神经网络 (CNN) 和图卷积网络 (GCN) 构建的深度并行神经网络,用于检测 RBPs 结合位点。它包括一个并行的两层 CNN 和 GCN 来提取隐藏特征,然后是一个全连接层来进行预测。DeepPN 在 RNA 序列的可学习表示上区分 RBP 结合位点,它只使用序列数据而不使用其他数据。评估结果表明,DeepPN 的性能与已发布的方法相当。
Part2
分享者:王启鹏
分享内容:
[1] Data Hunches: Incorporating Personal Knowledge into Visualizations
[2] Fuzzy Spreadsheet: Understanding and Exploring Uncertainties in Tabular Calculations
论文简介:
[1]Data Hunches: Incorporating Personal Knowledge into Visualizations:数据的麻烦之处在于,它经常只提供一个感兴趣的现象的不完美代表。 熟悉他们的数据集的专家在分析数据集的时候往往会进行隐性的心理修正,或者在存在注意事项的情况下,会谨慎地不对他们的发现过于自信。 然而,关于一个数据集的注意事项的个人知识通常不会以结构化的方式纳入,如果其他缺乏这种知识的人解释数据,这就会产生问题。 在这项工作中,我们将这种分析家对数据集的知识定义为数据直觉。 我们将数据直觉与不确定性区分开来,并讨论直觉的类型。 然后,我们探讨了记录数据直觉的方法,并在原型设计的基础上,提出了设计支持数据直觉的可视化的建议。 最后,我们讨论了与数据直觉相关的各种挑战,包括潜在的伤害以及对信任和隐私的挑战。 我们设想,数据直觉将使分析师能够将他们的知识外部化,促进合作和交流,并支持从他人的数据直觉中学习的能力。
[2]Fuzzy Spreadsheet: Understanding and Exploring Uncertainties in Tabular Calculations:本文提出Fuzzy Spreadsheet,一种增强表格内部可视化的方法,同时尽可能保持界面与传统电子表格布局接近。Fuzzy Spreadsheet允许用户通过电子表格跟踪不确定性信息的传播,并且引入假设分析的过程。为了评估解决方案的有效性,作者进行了一项用户研究,从答案的正确性、响应时间、脑力和可用性方面比较了Fuzzy Spreadsheet与传统电子表格。结果表明Fuzzy Spreadsheet优于传统电子表格,使用户能够更有效地跟踪和探索不确定信息。