腾讯云坚持“云+数据库”转型,看好多模数据库未来发展

在刚刚结束不久的2020腾讯全球数字生态大会上,腾讯云数据库总经理林晓斌透露了其在数据库方面的最新进展与计划。据统计,腾讯云数据库服务客户数已经超50万,且随着数据库底层能力升级和数据库矩阵不断完善,腾讯云形成了一套完整的数据库整体解决方案,可以提供主流的MySQL、Redis,自研数据库CynosDB、TDSQL、TBase等近20款数据库PaaS产品,以及迁移上云服务、运维智能监控、数据库智能管家DBbrain等多款SaaS产品,云数据库已经进入智能化和去服务化时代。

此外,在数据库专场上,腾讯云还重磅发布了基于黑石一体化框架结构,集成了腾讯云的硬件技术产品能力和公有云分布式数据库TDSQL的一体机柜,让企业在本地IDC环境下即可获得与公有云上一致的云数据库产品体验,实现金融级分布式数据库的轻松部署和运维。

在特殊的一年里获得进展,腾讯云数据库的发展与国内外形势的变化息息相关。今年以来,新冠疫情的爆发给国内很多行业带来了巨大的变化,电商行业、在线教育,尤其是在线办公等新业务的爆发,这就对数据库提出了更多新的要求。另外,新基建战略也使得国内在线业务交易的数据量全面爆发,并延伸出一些新的业务场景,随之而来的是企业关系型的数据库面临着向非关系型的转变。加上国际形势的复杂多变,这些因素都给国内数据库行业的发展带来很深远的影响。

作为国内领先的数据库厂商,腾讯云在面对这些挑战的过程中做了哪些布局和应对之策?在会前的媒体交流会上,腾讯云数据库副总经理王义成在媒体采访中系统地谈到腾讯云数据库的发展和未来计划。

以下为采访内容整理:

王义成: 首先谈一谈腾讯云数据库的发展。去年开始,腾讯云数据库就开始在做一部分“数据库+云”向“云+数据库”的转型。

之前,我们都在把数据库架到云上,借用云计算商业模式的颠覆,将一些大家常用的开源数据库做云产品化,做一些管控的功能,让更多用户使用。

去年,我们结合云计算与数据库的技术优势,提出了“云+数据库”策略。

过去一年中,腾讯云数据库的发展就是在“云+数据库“上的演进,第一点是在引擎上开发像CynosDB这样的产品,天生利用云易拓展的优势,将数据库的扩缩容与灵活性存储与计算分离的架构结合,充分地拥抱云计算的优势。为迅速改善传统云数据库备份、扩容慢、迁移慢的缺点,我们提了“云+数据库”的第一个策略,做CynosDB存储、计算分离的产品。

第二个是提出了自治,我们开发了DBbrain这样的产品,让用户把DBbrain架在云上,把DBA搬回家,这个产品带来的主要功能,是可以提升7×24小时数据链路/数据性能的诊断,将用户的实际运行情况,包括基于慢查询、SQL审计、性能的监控指标实时给出一个诊断报告,真正把一个业务DBA用这款产品搬回家。

第三个是融合。我们提供了私有云与公有云之间迁移的功能,大力发展数据迁移工具,加速未来私有云与公有云之间的融合,实现平滑过渡,这是我们去年提出来“云+数据库”的策略。

在今年,策略上没有特别大的变化,但是整体局势发生了变化,去年的这些策略在今年的局势变化中都能找到切入点。

第一点,新冠疫情对于整体的互联网行业带来井喷。第二点,5G应用的加速也会催使一些传统行业去做数字化转型。这就带来一些问题:数据库上云/数据库业务大量爆发。所以,在上半年,我们的公有云体量在快速增长。

2020年的新冠疫情对应去年的第一个策略,就是云原生的“云+数据库”的拓展性。我们也发现CynosDB这样的产品确实能够帮助用户快速扩缩容、备份、升级、扩展灾备节点,这一点也是贴合了我们去年的战略,正好也碰上了新冠疫情带来了整个互联网行业的井喷跟资源容量的爆发,CynosDB的产品,包括类似云原生Redis的存储版本也在这次新冠疫情近9个月期间有很大规模的增长。

第二个关键字,2020年的关键字就是国际局势,即中美关系的变化。这引起了一波关于国产化替换的讨论,现在也有类似的行业,叫做信创。这个产业的发展带来很明显的变化。昨天看了赛迪的数据,以前,95%以上的商业数据库或传统模式部署的数据库,93%的市场份额还是被Oracle 、DB2、SQL Server这样的国外厂商霸占,包括以Oracle为代表的OLTP、以SQL Serer为代表的OLAP。国际关系的变化带来了一个浪潮,即国产数据库替换或数据库转型的机遇到来了。

在这个大潮中,国产数据库厂商到底考核什么?其实最关键的还是平滑过渡与体验相似。应用不能大改,或者说在使用上的体验要整体相似,这是他们最关注的点。细分了几点,客户最关心国产数据库的稳定性、高可用性,或者说分布式事务等基本能力。

然而目前,并非所有的国产数据库都能具备这些能力,只有少数的厂商真正能在稳定性、高可用上值得推敲。

第二点,用户看中的还是语法的兼容性,对Oracle、SQL Sevrer、DB2的语法兼容性到底让我的应用是大改还是少改,这个是整体甲方考核国产数据库替换的标准。

第三,你有没有平滑的迁移方案,包括应用评估、对象评估等,如何能够在合理的时间内实现平滑迁移,再做应用的切流。

最后一个考核点,是你有没有数据库的回迁能力。

这几点是甲方或领导最关注的。所以,我们在今年的第二个策略,围绕着国产数据库的替换这块会做相应布局,围绕稳定性、高可用、Oracle、语法的兼容性、异构迁移与应用回迁这块重点推进布局。

总结一下,我们认为今年跟去年的“云+数据库”战略还是没有变化的,但是也有一些细微的差别。

第一个关键字就是新冠疫情带来的互联网井喷跟5G应用,传统行业的互联网数字化转型,所以让我们加深了对于存储计算的分离,CynosDB产品的投入,所以在去年取得了增速比较快的成绩。

第二个关键字是国际局势,加深了我们对于整个去商业数据库一体化的解决方案。从迁移到评估,到Oracle兼容性,再到应用回切整体的去O解决方案整体的形成。

第三个关键字是围绕着新基建与融合的策略,未来在双边一体化和云端之间的管理,推出了TDSQL一体机,未来可以云上、云下帐号体系的互通,做一个边缘计算专业节点相应数据库过渡一体机产品的发布,主要是这三点比较重要的策略。

记者:腾讯云从年初到现在发布了不少的产品,包括新的图数据库的产品,有MySQL8.0的产品,还有数据库迁移的产品,在您看来这多半年比较有代表性的产品是哪一个?

王义成: 我个人的感觉还是跟我整体的应对局势相关一些新的产品是最有代表性的,为应对目前整体的政策关系而开发的国产化数据库替换工具,比如DBbridge异构迁移平台。

另外面对融合的趋势,我们的TDSQL一体机,也是比较有代表性的重大发布。

记者:您曾表示,抢占传统数据库厂商空出来的市场,可能是云数据库厂商未来市场发展的一个重点。腾讯云今年对整个数据库市场有什么样的判断?重点会落在哪里?

王义成: 去年可能Oracle空出来是一个势头,但今年可能是开始逐渐落地了,复工之后这个趋势已经愈发明显了,包括运营商行业、金融行业等大批量国产数据库的需求已经在释放了。

记者:云+数据库的策略是去年提的,到现在差不多一年多的时间,在您看来,从产品、技术、落地场景在这一年是否有变化?

王义成: 变化很大,数字也印证了。我们去年提的是云原生,以CynosDB为代表,能够与云更好结合的扩缩容的升级。正好今年赶上数字化转型跟互联网行业的爆发,我们今年CynosDB的增长速度其实也是各个产品里规模增长最快的一个。

第二点是自治。我们布局DBbrain这样的产品,让用户能够通过这样的工具,更好地去做数据库运维与优化。这款产品今年我们在TOP30的客户基本上都已经用了,腾讯MySQL TOP30的用户都已经用了这款产品,能够助力业务的优化。

超融合这块,今年继续把一体机推出来,落地场景主要是先投入资源把一体机产品做出来,未来去做云上、云下的互通。

记者:今年整体的比较大的趋势是国家提出了新基建,在这一背景下,是否会为数据库的发展带来不一样的生机?

王义成: 我从几个维度来说。

第一个维度,新基建带来的一定是数据量大的冲击。因为新基建最关键的词是5G,在7个领域里可能最关键的是互联网基础设施。5G的到来会有一些,我们现阶段不能想象的颠覆性的应用,比如像4G刚出来的时候,大家都想不到短视频会火,直播会火。

5G出来之后应用速度更快,一定会有更好的应用出来,像AR、VR这些辅助现实、增强现实的应用可能会让大家体验更好。也许还有很多数字化。数据量爆发,对数据库来说有两个趋势。

第一个趋势,传统的数据库分配的模式,TP与AP数据量一定还会有爆发性的增长,纯TP与纯AP领域,在数据量再扩几倍的情况下,还能保持TP与AP整体的稳定性和性能,这个可能是大的趋势,大家还会在这个点上继续深耕。

第二点,随着5G到来,可能会有更多模式的数据库出现,比如图,或者更加稀奇的数据模式。

我们也发现人才会越来越少了。数据库行业本来的人才也会越来越少,数据库下一个模式会向多模方式发展,数据库的存储模式是不同的,但真正对于应用访问或应用处理来说,需要提供一个更加经典化、统一的标准接口以便上层应用访问,我认为,多模可能是未来5G爆发在应用爆发、数据爆发上一个大的趋势。

记者:是否可以透露一下腾讯云正在研发的数据库整体的设计思路?比如针对哪些场景,具备什么样的能力。

王义成: 图数据库是一种点边的关系,相比于传统数据库表结构存储有着自己的优势,点与边之间能够无限扩展连接,并体现相互关系之间的查询。

腾讯云数据库的应用场景主要针对金融类的,如反欺诈的业务。我们内部应用可能是朋友之间,比如说微信、QQ朋友和朋友关系链这块的应用会偏多。你可以理解为关系套关系这种应用可能会偏多。

举个场景像反欺诈,欺诈类的业务,或者说在智能查找丢失儿童,类似关系比较模糊,怎么让它产生相应的数据查询,这块也是比较偏多。在公安领域有一些电话诈骗或者说人物关系的链条,可能都会用图数据库+知识图谱产生应用价值的点。

记者:腾讯云唯一的时序数据库CTSDB是针对物联网和大数据需要大量的时序数据场景,针对这些场景,CTSDB具体做了哪些优化?这个数据库与当前开源的时序数据库相比有哪些优势?

王义成: 优化点主要是三点,也是时序数据库更看重的三点东西,第一个优化点是高并发的写入;第二个是存储的成本相应的优化策略;第三点,对于大数据或者数据量较多的查询相应的优化策略,所以CTSBD这块的优化主要围绕着这三点。

再细说一点,比如用技术做的优化。高并发这块的写入,我们现在单机写入性能大概是20万/秒,集群可以达到千万数据每秒的写入速率。

第二部分就是压缩成本,列式存储方便压缩,可以降低数据存储量,从用户设置清理策略,再加上压缩的算法两个维度,保证数据库的存储成本I降低。

第三块是大数据的查询,我们还是用倒排索引的方式加速任意维度的查询,基本能实现2毫秒延时简单的查询。

与开源数据库相比,第一类,对比开源MySQL,OLTP的数据写入肯定是不足的。还有一种叫OpenTSDB,这种是依赖于Hadoop来做的,它的组件维护相对来说成本比较高。现在最多的就是influxDB,它的单机写入性能还是不错的,但它的分布式版本应该也是商业版收费的,我们也测过,跟我们分布式集群相比,它的性能瓶颈还是相对比较低的,并且它的单机也没有高可用的保证机制。

另外,腾讯云作为PaaS产品,还是会包装成常规的PaaS服务,包括扩缩容,秒级的写入,还有监控报警,都是体系化的PaaS产品。

我们CTSDB还提供了SQL查询,你用常规的SQL也可以去在CTSDB上去做相应数据的反查。

记者:除了刚才讲的图数据库,在新型数据库领域,您还比较看好哪些新兴的技术发展趋势或者是方向?

王义成: 我觉得未来数据量的爆发,多模数据库可能是一个技术趋势。

多模的意思,未来可能会有一些业务系统,我们今年也跟很多客户或者传统行业在聊,大家都被数据中台的概念搞的晕晕乎乎的,搞得挺心潮澎湃的。但其实本质上大家并不是想要一个数据中台,它想要的是一种数据模式的统一,所以我认为未来多模数据库可能是一个大的趋势。

多模分两种,一种是数据存储是同一种模式,我可以对这种数据模式包罗多种协议接口类型,比如一套数据存储,可以包括Mongo的访问模式,以及MySQL的访问模式,这种多模。

还有一种,我有一个集中存储,可以把不同类型的数据库存储到一个整体通用的数据平台上来,再用一个UP层,或者用一个接口层来去兼容多种协议,让所有的应用能更方便地集中做自己的数据处理跟统一,这个技术趋势有可能会出现。

因为我们发现像很多传统行业的数据都会散落在各个业务系统中。现在由于互联网化,谈数据中台、AI中台的时候,各个大的厂商也希望去做一些超越组织架构层面的数据整合和处理。哪个厂商能帮用户做好更快的数据整合,又能够提供抽象化的应用接口这种多模的数据库,有可能是未来中长期相对比较好的趋势。

记者:CynosDB设计采用计算跟存储分离的方式。在业界好像对存算一体和存算分离这两种设计上也是存在争议的,在这方面腾讯的考虑是怎样的呢?

王义成: 我觉得不应该是存算一体跟存储计算分离这点的争议,还是纯分布式单个节点的存算一体和存储跟计算分离的争议。我理解现在争议可能是在这一块,因为都是要解决分布式的问题。我觉得存算一体跟一个存储计算分离相近似一个分布式的架构是不存在争议的点,肯定是存算分离吊打存算一体了,因为存算一体连扩容都做不到,但存储计算分离是可以的。

可能存在的争议是在于,到底是分布式架构的,每单个节点是存算一体的分布式架构,还是存储是在一体,计算是分开这种存储和计算分离的这种分布式的架构,这两个争议点我认为可能是存在。

首先,我认为存算一体,刚才说的分布式架构其实是互联网类的架构,或者是AP类的架构,互联网公司的TP之前大多数都是这种方式演进的,包括阿里、腾讯、京东等大型互联网厂商很多业务都是用MySQL起步,逐渐去用Share-Nothing的方式,将数据做分库分表,随着数据量的增大,它可以扩节点来去做数据分布式,我们叫Share-Nothing的分布式架构。

存储跟计算分离更像是一种Shared Disk的模型,磁盘是共享,计算可以分开,磁盘可以无限扩展,我觉得争议点可能是在这儿,到底是哪种结构?那就来看这个趋势。

以前腾讯就是用Share-Nothing来去做分布式替换的,但发现在替换的过程中,大型的互联网厂商还好,因为这些厂商大多最早都是从开源起步,他们所用的很多开源分布式中间件很好替换。

但在传统行业,TP领域已经被国外厂商教育得根深蒂固了,很多金融和政府行业技术一把手并不认为Share-Nothing是搞TP的,还是认可Oracle那种模式,这也是争议所在。

对于云厂商来说,改变传统行业,或者说改变客户的想法其实还是很难的,你只能逐渐教育新的使用习惯,在架构上统一模式。这不是说架构的争议,而是在于今天你要做这门生意,让更多的用户去习惯上云,或者习惯使用云数据库,你必须在技术架构上贴合它的使用习惯,我觉得Shared Disk这种模式去打传统行业,或者去打被Oracle教育了很多行业客户,是必须要走的一条路,这种争议争下去可能意义并不大。

记者:在目前的环境下,腾讯云数据库的自主可控和国产化替代日益重要,请介绍一下腾讯云在自研数据库方面的进展,腾讯云在自研数据库方面的优势以及应用情况。

王义成: 自研数据库我们一直基于开源自研。国产化体系我们主要做两件事,上下游的适配,适配下游的操作系统、芯片;向上的适配包括国产的应用、中间件,比如银行、政府领域的ISV适配情况。

第一个是向下兼容,技术领域的向下兼容,腾讯云数据库已经与现在的国产CPU,包括ARM、X86体系的厂商,如鲲鹏、飞腾等已经做了相互认证,业务系统也在跑了。真正的项目落地有与鲲鹏、飞腾的合作,TDSQL和TBase已经在鲲鹏和飞腾的机器上跑起来。

另外操作系统层面,腾讯云数据库目前与两个主流的国产操作系统UOS和中标麒麟都进行了相应操作系统适配,在一些政府项目中已经落地。

主持人:今年腾讯云推出了Serverless数据库,会不会扩展到MySQL?

王义成: Serverless是我们一个发展比较重要的方向,对于中长尾用户、长尾用户或腰部客户来说是一个比较好的切入点。去年,腾讯云发布了 PostgreSQL for Serverless数据库,今年未来两个月内可能会发布MySQL的Serverless数据库,也会把MySQL系的Serverless数据库同步开放给用户。

记者:多模数据库未来是否会替代国产数据库?

王义成: 我觉得还是看客户的习惯。其实大家也知道,目前中美这种关系,有很多开源协议还是有一些风险和不确定性。多模有两个目的,第一是用一套数据库可以解决用户不同调用的使用习惯,能够助力用户使用。第二也让各个厂商规避自己相应开源的风险,或者开源应用好的使用模式,我用一套多模的数据存储反向兼容某种协议的接口,也是满足用户的使用习惯。否则今天只能说来一个应用,来一个数据库,我们就要去做相应数据库的演进,PaaS平台的演进。如果它还背着一个很沉重的开源协议,对于适配云上客户的需求也是一个相当大的挑战。

简而言之,多模有两个战略意义:第一个用一套数据库,能够解决多种用户不同访问需求跟应用接口的统一。第二点,能够快速地适配需求,又能够让云厂商脱离或者说规避相应的开源协议的风险。

采访嘉宾:

王义成, 腾讯云数据库副总经理,深耕数据库领域10余年,数据库技术专家工程师。从事过数据库研发、数据库管理员以及云数据库产品经理多项工作。作为腾讯云数据库核心人员参与腾讯云CynosDB、TDSQL、DBBrain等产品的自主研制与设计,带领团队持续用核心技术帮助企业完成数字化转型和业务创新。

©️2020 CSDN 皮肤主题: 代码科技 设计师:Amelia_0503 返回首页