2009级硕士研究生闫二辉来访

时间:2020年11月13日 14:30
地点:基础教学楼B318实验室
参会人员:
  闫二辉:实验室2009级硕士研究生,毕业后加入腾讯架构平台部,目前负责腾讯云nosql研发工作
  教师:朱敏教授
  学生:318实验室在校全体在读成员、21级准研究生及部分研究生

会议主要内容:
一、 嘉宾介绍
  首先闫师兄就自己的工作经历、主要研究方向等方面进行了简要的自我介绍。
二、 嘉宾分享

--1

  闫二辉师兄重点分享了数据库应用的行业现状,分别从以下方面进行论述分享:

  • 数据库分类

    • 关系型数据库(Oracle、MySQL、Microsoft SQL Server、PostgreSQL,、BM Db2),其具有统一性、普适性、和易用性的特点,同时关系数据库难以扩展,性能随数据量增加迅速下降,难以适应web时代的高性能,多样性需求。
    • 非关系型数据库NoSQL(Redis、Mongodb、Hbase、Cassandra、Neo4j,、nfluxdb),其主要特点为可扩展、高可用、高性能;最终一致性;缺乏统一标准,易用性一般;以及满足了web时代场景多样,海量数据需求。
    • NewSQL(Spanner、TiDB、OceanBase、TBase),主要具备分布式可扩展、高性能、高可用以及支持多种事务的特点。
  • 数据库架构演进

    • 数据库架构主要由传统单机版到Proxy中间件版、分布式模式、以及NewSQL架构的演进。NewSQL数据库完全使用NewSQL架构进行设计开发,它采用了Shared-nothing 的分布式架构,包含了多节点并发控制、多副本数据复制、流量控制以及分布式查询处理等特性。
    • 除此之外,Oracle、SQLServer、MySQL等数据库采用的OLTP(On-Line Transaction Processing)架构直接面向应用,数据在系统中产生,每次交易牵涉的数据量很小,对响应时间要求高,其数据库的各种操作主要基于索引进行,通常是行存、ACID事务。OLAP(On-Line Analytical Processing)架构本身不产生数据,其基础数据来源于生产系统中的操作数据,复杂查询经常使用多表联结、全表扫描等,牵涉的数量往往十分庞大,每次查询设计的数据量很大,响应时间与具体查询有很大关系,由于业务问题不固定,数据库的各种操作不能完全基于索引进行。由于OLAP 和 OLTP 系统间通常会有几分钟甚至几小时的时延,企业需要维护不同的数据库以便支持两类不同的任务,管理和维护成本高,而HTAP(Hybrid Transaction and Analytical Process)架构使得一份数据同时支持OLTP+OLAP,无需数据交换,并支持行列混合存储引擎。
  • 当前研究热点

    • 闫二辉首先向大家展示了数据库著名国际会议VLDB上各领域的论文分布,其次主要介绍了分布式系统的特点和验证方式,以及存算分离架构相较于传统多副本架构具有逻辑解耦、按需扩缩容与计费、云原生、高弹性等特点与优势,最后介绍了如何从硬件和软件方面提升数据库性能,以及如何保护数据隐私与安全等。

  期间还结合实验室可视化研究方向重点分享了工作中的可视化项目成果及应用。

三、交流提问
  提问交流环节,实验室小伙伴们分别就分享主题及工作/职业发展两个方面提出问题,闫二辉对于相关问题都做了耐心细致的解答,同时还对实验室在读成员分享个人工作心得:
    • 认真做好手头上的每一件小事
    • 积极向上的心态
    • 勤思考,多行动,善总结,长规划,高目标
    • 跳出舒适区
    • 坚持锻炼身体

QQ--20201113223448

         在交流的最后,实验室成员与闫二辉和2010级孙亚楠进行了合影。感谢师兄们抽出时间回到实验室做出的交流分享,殷切期待师兄们下次再来实验室交流。