Mysql ID生成策略的三种方法选择及优缺点

来自:网络
时间:2024-08-28
阅读:
免费资源网 - https://freexyz.cn/

mysql ID生成策略一般常用的有三种:自增、UUID 以及雪花算法,下面就拿着三种展开分析一下。

自增主键(Auto Increment)

优点:

简单、易于使用和理解,保证唯一性,无需额外的查询操作。

缺点:

不适用于分布式系统,因为每个节点都需要维护一个独立的计数器,可能会导致冲突和性能问题。

使用场景:

适用于单机或小规模应用,不需要分布式支持的场景。例如,传统的单机应用、小型网站或内部管理系统。

UUID(Universally Unique Identifier)

优点:

全局唯一性,分布式支持,独立性。

缺点:

占用较多的存储空间,无序性,可读性较低。

使用场景:

适用于需要分布式支持、全局唯一性和独立生成ID的场景,特别是在没有数据库连接的情况下。例如,分布式系统、大规模系统或需要独立生成ID的场景。

雪花算法(Snowflake)

优点:

支持分布式环境,生成的ID有序且唯一,包含时间戳信息。

缺点:

依赖于机器的唯一标识,不同机器之间的时间同步问题可能导致ID重复。

使用场景:

适用于需要分布式支持、有序和唯一的ID的场景。例如,大规模的分布式系统、微服务架构、分布式数据库等。

雪花算法生成 ID 冲突问题:

1. 前提条件:
服务通过集群的方式部署,其中部分机器标识位一致。
业务存在一定的并发量,没有并发量无法触发重复问题。
生成 ID 的时机:同一毫秒下的序列号一致。
2. 标识位如何定义才能不重复?
有两种方案:预分配和动态分配。

(1). 预分配(静态)

应用上线前,统计当前服务的节点数,人工去申请标识位。

这种方案,没有代码开发量,在服务节点固定或者项目少可以使用,但是解决不了服务节点动态扩容性问题。

(2). 动态分配

将标识位存放在 Redis、Zookeeper、MySQL 等中间件,在服务启动的时候去请求标识位,请求后标识位并将其更新为下一个可用的。

通过存放标识位,延伸出一个问题:雪花算法的 ID 是 服务内唯一还是全局唯一。

以 Redis 举例,如果要做服务内唯一,存放标识位的 Redis 节点使用自己项目内的就可以;如果是全局唯一,所有使用雪花算法的应用,要用同一个 Redis 节点。

两者的区别仅是 不同的服务间是否公用 Redis。如果没有全局唯一的需求,最好使 ID 服务内唯一,因为这样可以避免单点问题。

服务的节点数超过 1024,则需要做额外的扩展;可以扩展 10 bit 标识位,或者选择开源分布式 ID 框架。

动态分配实现方案:Redis 存储一个 Hash 结构 Key,包含两个键值对:dataCenterId 和 workerId。

        雪花算法不是万能的,并不能适用于所有场景。如果 ID 要求全局唯一并且服务节点超出 1024 节点,可以选择修改算法本身的组成,即扩展标识位,或者选择开源方案:美团LEAF、百度UID。

总结

根据实际使用场景进行选择:

单机或小规模应用:对于规模较小、不需要分布式支持的应用,ID自增是简单而可行的选择。它易于使用和理解,并能保证唯一性。

大规模分布式系统:在需要分布式支持、有序和唯一ID的大规模系统中,雪花算法是更合适的选择。它能够生成分布式环境下的有序且唯一ID,适应大规模的分布式架构。

分布式环境下的全局唯一ID:如果全局唯一性是主要要求,并且不需要严格的有序性,UUID是一个可选的策略。它可以在分布式环境中生成全局唯一的ID,适用于分布式系统、大规模系统或需要独立生成ID的场景。

需要注意的是,对于雪花算法和UUID,在分布式环境中需要注意时间同步问题。确保机器时间的同步性,以避免ID重复。

综上所述,选择适当的ID生成策略需要综合考虑系统规模、分布式支持、唯一性和有序性要求以及时间同步问题。自增主键适用于规模较小、不需要分布式支持的简单应用,而雪花算法则适用于需要分布式支持、有序和唯一ID的大规模应用。UUID 我们一般不做考虑,因为针对于分布式系统来说雪花算法比UUID方式性能更好,UUID占用存储更大。

免费资源网 - https://freexyz.cn/
返回顶部
顶部