实践出真知，看我们如何化解DynamoDB的挑战

发布时间：2019-10-22 15:56:15 所属栏目：建站来源：咔咔侃技术

导读：副标题#e# 【大咖·来了第7期】10月24日晚8点观看《智能导购对话机器人实践》 DynamoDB 是 Amazon 基于《 Dynamo: Amazons Highly Available Key-value Store 》实现的 NoSQL 数据库服务。它可以满足数据库无缝的扩展，可以保证数据的持久性以及高可用性。

DynamoDB 会自动维护数据存储分区，但每个分区大小上限为 10GB，一旦超过该限制会导致 DynamoDB 拆分区。这也正是数据偏移带来的影响，当数据严重偏移时，DynamoDB 会默默为你的偏移分区拆分区。我们可以根据下面的公式计算分区数量：

数据总大小 / 10GB 再向上取整 = 分区总数

比如表里数据总量为 15GB，15 / 10 = 1.5，向上取整 = 2，分区数为 2，如果数据不偏移均匀分配的话两个分区每个存储 7.5GB 数据。

读写性能限制

DynamoDB 为什么要拆分区呢?因为它要保证用户预设的读 / 写性能。怎么保证呢?依靠将每个分区数据控制在 10G 以内。另一个条件就是当分区不能满足预设吞吐量时，DynamoDB 也会将分区进行扩充。DynamoDB 对于每个分区读写容量定义如下：

写入容量单位：写入容量单位(WCU：write capacity units)，以每条数据最大 1KB 计算，最大每秒写入 1000 条。

读取容量单位：读取容量单位(RCU：read capacity units)，以每条数据最大 4KB 计算，最大每秒读取 3000 条。

也就是说，一个分区的最大写入容量单位和读取容量单位是固定的，超过了分区最大容量单位就会拆分区。因此我们可以根据下面的公式计算分区数量：

(预设读容量 /3000)+(预设写容量 /1000)再向上取整 = 分区总数

比如预设的读取容量为 500，写入容量为 5000，(500 / 3000) + (5000 / 1000) = 5.1，再向上取整 = 6，分区数为 6。

需要注意的是，对于单分区超过 10G 拆分后的新分区是共享原分区读写容量的，并不是每个表单独的读写容量。

因为预设的读写容量决定了分区数量，但由于单分区数据量达到上限而拆出两个新的分区。