百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分析 > 正文

分布式Nosql数据库(二) - Protobuf的新玩法

liebian365 2024-10-24 14:38 7 浏览 0 评论

背景

在前面的文章中,我们提到了KV + Protobuf的组合解决方案,它是一个实用性非常强的组合,它主要面对的是读多写少、Schema复杂的业务场景,value采用Protobuf编码存储,不仅可以支持非常复杂的schema,如string、int基本类似、primitive list类型、message list类型、map等,同时编解码效率也非常高,对于业务非常友好。由于读取时读取整个value,对于一些需要整个value读取的业务场景而言,读取效率非常高。

虽然KV + Protobuf的解决方案,在某些特定业务场景下有许多优点,但它却存在许多固有的不足,无法适用于所有业务场景,存在一定的局限性和不足。举个例子,如果我们需要对value中内容更新,则业务需要Get + Decode + Update + Encode + Put的繁琐和低效操作才能实现,再比如,为了降低资源开销,业务需要读取value中一部分内容操作,可以发现,面对这些业务场景,KV + Protobuf的处理对业务而言就又变成了低效的方案。

在我们的工作中,我们创新性的基于KV存储支持了Protobuf的Schema,使得它变成一个支持复杂数据数据结构、通用性强的高效Nosql存储服务,在本文中,我们主要对它的设计和实现做一个总结。

架构和设计

上图所示,它整体的架构上采用的是Nubase的架构设计,不过为了支持Protobuf的Schema操作,我们的Dataserver包含了Storage Layer和Computer Layer,Computer Layer负责Protobuf的Schema相关操作,Storage Layer负责实际的数据存储。

业务交互流程

如上所示,业务与系统的整体交互流程主要包括两个步骤,注册表和操作表,提供给业务的是可读性好的操作接口,支持对Protobuf Schema字段级的操作。

  1. Nubase存储支持Namespace隔离,不同数据存储在不同的Namespace,业务数据使用前,需要创建table,并且注册table的Schema。
  2. 业务调用API可读的操作接口,比如update(table, key, name, "xx"),接口表示对table中的key,修改它的Schema中的name字段的value值为"xx",API内部会获取table注册的Schema,然后通过编译Schema,得到Schema中字段名和字段ID的对应关系,实际发送给数据存储节点的请求为update(ns, key, 2, "xx"),存储节点收到请求后,对物理表ns中的key的Schema中字段ID=2的value修改为"xx"。

Protobuf编解码

Protobuf的编码本质上是由多个<tag, value>或<tag, length, value> ... 的pair组成,下面以一个实际的Schema为例来介绍Protobuf具体是如何编码的。

以如上所示的Schema为例,包含三个字段,类型分别int32、string、repeated message,可以看到tag的编码方式为field number << 3 | wire_type,其中wire_type有4种,对应多种数据类型的编码,我们可以看到上面的Schema编码后对应多个tag, value的pair,其中number的filed number=1,wire_type=0,所以最终tag-value的tag为0x1 << 3 | 0,value为int32经过varint编码后的值,varint编码的具体细节这里不做详细介绍,其他字段的编码类似于number字段的编码,不同的地方在于,对于字符串或者message类型,它的编码存储为tag + length + value,下面以一个具体的数据编码为例说明:

可以看到,如上的对象编码后的数据为:<0x1 << 3 | 0, 1000> <0x2 << 3 | 2, "apple">, <0x3 << 3 | 2, { 123, "size 1"}>, ... ...,我们可以进一步根据它的二进制数据理解它的编码方式:

存储处理

前面提到我们的存储处理包含Storage Layer和Computer Layer,Compute Layer主要完成Protobuf相关字段的更新、读取、排序计算等操作,Storage Layer完成数据的实际读写,当前的Storage Layer主要是KV的存储,可以支持内存型的KV,也可以支持磁盘型的KV。

如上所以,以一个实际Protobuf对象的字段级更新为例,当字段number的值增加30,更新字段name的值为orange时,存储端会先获取key对应的二进制数据,然后根据对应的字段ID找到对应的二进制数据段,最后递增或者更新对应二进制段的value,最终将修改后的二进制数据写回存储引擎。

性能

由于将Protobuf相关的更新和计算逻辑处理下沉到了存储服务,相比较业务侧的Decode + Update + Encode,存储侧直接通过二进制寻址更新实现,因此,整个的更新或者计算效率更高,根据实际的测试结果观察,无论对于primitive类型字段还是repeated message字段,相比较业务侧的更新方式,直接在存储侧的二进制寻址更新方式,整体计算时耗下降60% ~ 80%,计算效率大大提升。

由于大量的计算操作下沉到了底层存储,业务侧所需的计算资源大大减少,业务侧观察的RT降低了约70%,业务占用的Flink计算资源减少了约60%。

总结

通过将KV + Protobuf在存储侧的结合,非常好的实现了两者的互补,在可以保证KV读取性能的同时,也能够获得友好且高效的更新性能,同时,能够支持Protobuf的Schema,与Protobuf是完全兼容的,而Protobuf在行业的广泛应用,可以让这套方案具备一定的推广潜力。不过受限于时间和资源,我们当前只为部门内部提供了一些较为通用和定制的操作方式,通用性方面还需要完善,如果需要让它成为一套通用性非常强的分布式Nosql存储服务,还有一定的工作需要完成。

相关推荐

快递查询教程,批量查询物流,一键管理快递

作为商家,每天需要查询许许多多的快递单号,面对不同的快递公司,有没有简单一点的物流查询方法呢?小编的回答当然是有的,下面随小编一起来试试这个新技巧。需要哪些工具?安装一个快递批量查询高手快递单号怎么快...

一键自动查询所有快递的物流信息 支持圆通、韵达等多家快递

对于各位商家来说拥有一个好的快递软件,能够有效的提高自己的工作效率,在管理快递单号的时候都需要对单号进行表格整理,那怎么样能够快速的查询所有单号信息,并自动生成表格呢?1、其实方法很简单,我们不需要一...

快递查询单号查询,怎么查物流到哪了

输入单号怎么查快递到哪里去了呢?今天小编给大家分享一个新的技巧,它支持多家快递,一次能查询多个单号物流,还可对查询到的物流进行分析、筛选以及导出,下面一起来试试。需要哪些工具?安装一个快递批量查询高手...

3分钟查询物流,教你一键批量查询全部物流信息

很多朋友在问,如何在短时间内把单号的物流信息查询出来,查询完成后筛选已签收件、筛选未签收件,今天小编就分享一款物流查询神器,感兴趣的朋友接着往下看。第一步,运行【快递批量查询高手】在主界面中点击【添...

快递单号查询,一次性查询全部物流信息

现在各种快递的查询方式,各有各的好,各有各的劣,总的来说,还是有比较方便的。今天小编就给大家分享一个新的技巧,支持多家快递,一次能查询多个单号的物流,还能对查询到的物流进行分析、筛选以及导出,下面一起...

快递查询工具,批量查询多个快递快递单号的物流状态、签收时间

最近有朋友在问,怎么快速查询单号的物流信息呢?除了官网,还有没有更简单的方法呢?小编的回答当然是有的,下面一起来看看。需要哪些工具?安装一个快递批量查询高手多个京东的快递单号怎么快速查询?进入快递批量...

快递查询软件,自动识别查询快递单号查询方法

当你拥有多个快递单号的时候,该如何快速查询物流信息?比如单号没有快递公司时,又该如何自动识别再去查询呢?不知道如何操作的宝贝们,下面随小编一起来试试。需要哪些工具?安装一个快递批量查询高手快递单号若干...

教你怎样查询快递查询单号并保存物流信息

商家发货,快递揽收后,一般会直接手动复制到官网上一个个查询物流,那么久而久之,就会觉得查询变得特别繁琐,今天小编给大家分享一个新的技巧,下面一起来试试。教程之前,我们来预览一下用快递批量查询高手...

简单几步骤查询所有快递物流信息

在高峰期订单量大的时候,可能需要一双手当十双手去查询快递物流,但是由于逐一去查询,效率极低,追踪困难。那么今天小编给大家分享一个新的技巧,一次能查询多个快递单号的物流,下面一起来学习一下,希望能给大家...

物流单号查询,如何查询快递信息,按最后更新时间搜索需要的单号

最近有很多朋友在问,如何通过快递单号查询物流信息,并按最后更新时间搜索出需要的单号呢?下面随小编一起来试试吧。需要哪些工具?安装一个快递批量查询高手快递单号若干怎么快速查询?运行【快递批量查询高手】...

连续保存新单号功能解析,导入单号查询并自动识别批量查快递信息

快递查询已经成为我们日常生活中不可或缺的一部分。然而,面对海量的快递单号,如何高效、准确地查询每一个快递的物流信息,成为了许多人头疼的问题。幸运的是,随着科技的进步,一款名为“快递批量查询高手”的软件...

快递查询教程,快递单号查询,筛选更新量为1的单号

最近有很多朋友在问,怎么快速查询快递单号的物流,并筛选出更新量为1的单号呢?今天小编给大家分享一个新方法,一起来试试吧。需要哪些工具?安装一个快递批量查询高手多个快递单号怎么快速查询?运行【快递批量查...

掌握批量查询快递动态的技巧,一键查找无信息记录的两种方法解析

在快节奏的商业环境中,高效的物流查询是确保业务顺畅运行的关键。作为快递查询达人,我深知时间的宝贵,因此,今天我将向大家介绍一款强大的工具——快递批量查询高手软件。这款软件能够帮助你批量查询快递动态,一...

从复杂到简单的单号查询,一键清除单号中的符号并批量查快递信息

在繁忙的商务与日常生活中,快递查询已成为不可或缺的一环。然而,面对海量的单号,逐一查询不仅耗时费力,还容易出错。现在,有了快递批量查询高手软件,一切变得简单明了。只需一键,即可搞定单号查询,一键处理单...

物流单号查询,在哪里查询快递

如果在快递单号多的情况,你还在一个个复制粘贴到官网上手动查询,是一件非常麻烦的事情。于是乎今天小编给大家分享一个新的技巧,下面一起来试试。需要哪些工具?安装一个快递批量查询高手快递单号怎么快速查询?...

取消回复欢迎 发表评论: