如何设计高并发 NoSQL 数据库模型（Cassandra 与 DynamoDB）

解决分布式数据库设计误区：通过将“关系型思维”转变为“查询优先思维”，指导开发者在 Cassandra 和 DynamoDB 中构建能够支撑海量数据且无性能瓶颈的存储方案。

为什么需要这个技能

在传统 SQL 数据库中，我们习惯于建模“实体”及其“关系”，在查询时通过 JOIN 动态关联。但在分布式 NoSQL 系统（如 Cassandra、DynamoDB）中，JOIN 极其低效甚至被禁止。

如果沿用 SQL 思维设计 NoSQL，会导致全表扫描（Scan）或产生“热分区（Hot Partitions）”，在数据量增大时性能会迅速崩塌。本技能教你如何通过“查询优先”的模式，在写入端预计算数据，从而实现 O(1) 级别的极速读取。

不再先定义表结构，而是先定义访问模式：

分区键决定了数据分布在哪个物理节点上：

目标：数据与流量在集群中均匀分布。
避免陷阱：禁止使用低基数（Low-cardinality）字段（如 status="active"）作为分区键，否则会导致所有数据挤在单台机器上，形成热分区。
最佳实践：使用高基数键（如 UUID、设备 ID）。

在 DynamoDB 中，通过巧妙设计 PK（分区键）和 SK（排序键），将多种实体存储在同一张表中，实现“预连接”读取：

不要害怕数据冗余。为了读取速度，将同一份数据在多张表中存储。虽然增加了写入成本和一致性维护难度，但极大地提升了海量数据下的响应速度。

解压后将目录放入你的 AI 工具 skills 文件夹，重启工具后即可使用。具体路径参考内附的 USAGE.zh.md。

暂无推荐