分库分表

分库方案指的是在系统设计中，为了应对数据库性能瓶颈、存储容量限制、高并发读写等问题，将数据根据一定规则分散存储到多个数据库实例中的方法。

一、分库方案设计原则

二、常见分库策略

三、分库实现方式

应用层实现（自定义）

在业务代码中根据规则路由到目标库。 • 优点：灵活、无中间层； • 缺点：开发复杂，维护成本高。
使用中间件
- ShardingSphere 开源、支持分库分表、分布式事务、读写分离
- MyCAT 类似代理的数据库中间件，支持 SQL 路由
- TDDL 阿里内部使用，开源后用于分库分表
- Vitess 谷歌开源，面向大规模数据库集群的分片方案

四、分库架构演进路径（推荐）

五、主键策略推荐

为避免主键重复，需要使用全局唯一 ID： • 雪花算法（Snowflake）； • UUID（不推荐用于索引字段）； • 数据库自动生成 + 前缀； • Redis + Lua 脚本生成 ID； • 分布式 ID 服务（如美团 Leaf、百度 UidGenerator）

六、常见问题与应对

问题应对策略跨库 join 查询拆分查询 + 应用层聚合分布式事务使用 TCC、SAGA、消息队列补偿分页不准确利用中间件支持或使用主键游标统计类 SQL复杂借助大数据平台（如 Flink、Spark）或缓存中间层数据迁移与扩容使用数据同步工具（Canal、DTS）+ 双写机制