twitter的雪花算法一般用于生成分布式ID,订单编号,按时间递增的唯一ID等
算法描述:
第一位:为未使用 0 也表示为正数
第二部分:41位为毫秒级时间(41位的长度可以使用69年) 每次要生成一个新 ID 的时候,都会获取一下当前的 Timestamp, 然后分两种情况生成 sequence number;
第三部分:5位datacenterId和5位workerId(10位的长度最多支持部署1024个节点/机器)
第四部分:最后12位是毫秒内的计数(12位的计数顺序号支持每个节点每毫秒产生4096个ID序号)
如果当前的 Timestamp 和前一个已生成 ID 的 Timestamp 相同 (在同一毫秒中),就用前一个 ID 的 sequence number + 1 作为新的 sequence number (12 bits); 如果本毫秒内的所有 ID 用完,等到下一毫秒继续 (这个等待过程中, 不能分配出新的 ID);如果当前的 Timestamp 比前一个 ID 的 Timestamp 大, 随机生成一个初始 sequence number (12bits) 作为本毫秒内的第一个 sequence number;
最后拼接起来为一个64位ID (42(毫秒)+5(机器ID)+5(业务编码)+12(重复累加))
优点:snowflake生成的ID整体上按照时间自增排序,并且整个分布式系统内不会产生ID碰撞(由datacenter[服务ID 1,2,3….. 每个服务中写死]和workerId[机器ID 读取机器的环境变量MACHINEID 部署时每台服务器ID不一样]作区分),
并且效率较高。经测试snowflake每秒能够产生26万个ID。
缺点:如果当前时间小于记录的上一个毫秒值,则说明这台机器的时间回拨了,抛出异常。但如果这台机器的系统时间在启动之前回拨过,那么有可能出现ID重复的危险。
也就是说snowflake依赖于系统时钟的一致性。如果某台机器的系统时钟回拨,有可能造成ID冲突,或者ID乱序。
但是,我们也有办法去解决时间回拨的问题(通过重新划分64位的划分,如后面12位,我们业务上不需要每毫秒4096个ID序号,就可以划分10+2位,后面的2位作为扩展位,前面的10位保证1024个ID序号,当发生回拨的时候,使用该扩展位,详细实现方式在将来的另一篇笔记进行说明,本次只做最基本的实现)
代码说明:
亦可直接去 nuget 搜索 Snowflake.Net 进行引用直接实现
Snowflake snowflake = new Snowflake(1, 1); long id = snowflake.GetId();
public class Snowflake { private static long machineId;//机器ID private static long datacenterId = 0L;//数据ID private static long sequence = 0L;//计数从零开始 private static long twepoch = 687888001020L; //唯一时间随机量,时间起始标记点,作为基准,一般取系统的最近时间(一旦确定不能变动) private static long machineIdBits = 5L; //机器码字节数 private static long datacenterIdBits = 5L;//数据字节数 public static long maxMachineId = -1L ^ -1L << (int)machineIdBits; //最大机器ID private static long maxDatacenterId = -1L ^ (-1L << (int)datacenterIdBits);//最大数据ID private static long sequenceBits = 12L; //计数器字节数,12个字节用来保存计数码 private static long machineIdShift = sequenceBits; //机器码数据左移位数,就是后面计数器占用的位数 private static long datacenterIdShift = sequenceBits + machineIdBits; private static long timestampLeftShift = sequenceBits + machineIdBits + datacenterIdBits; //时间戳左移动位数就是机器码+计数器总字节数+数据字节数 public static long sequenceMask = -1L ^ -1L << (int)sequenceBits; //一微秒内可以产生计数,如果达到该值则等到下一微妙在进行生成 private static long lastTimestamp = -1L;//最后时间戳 private static object syncRoot = new object();//加锁对象 static Snowflake snowflake; public static Snowflake Instance() { if (snowflake == null) snowflake = new Snowflake(); return snowflake; } public Snowflake() { Snowflakes(0L, -1); } public Snowflake(long machineId) { Snowflakes(machineId, -1); } public Snowflake(long machineId, long datacenterId) { Snowflakes(machineId, datacenterId); } private void Snowflakes(long machineId, long datacenterId) { if (machineId >= 0) { if (machineId > maxMachineId) { throw new Exception("机器码ID非法"); } Snowflake.machineId = machineId; } if (datacenterId >= 0) { if (datacenterId > maxDatacenterId) { throw new Exception("数据中心ID非法"); } Snowflake.datacenterId = datacenterId; } } // 生成当前时间戳(毫秒) private static long GetTimestamp() { return (long)(DateTime.UtcNow - new DateTime(1970, 1, 1, 0, 0, 0, DateTimeKind.Utc)).TotalMilliseconds; } ////// 获取下一微秒时间戳 /// /// ///private static long GetNextTimestamp(long lastTimestamp) { long timestamp = GetTimestamp(); if (timestamp <= lastTimestamp) { timestamp = GetTimestamp(); } return timestamp; } // 获取长整型的ID public long GetId() { lock (syncRoot) { long timestamp = GetTimestamp(); if (Snowflake.lastTimestamp == timestamp) { //同一微妙中生成ID sequence = (sequence + 1) & sequenceMask; //用&运算计算该微秒内产生的计数是否已经到达上限 if (sequence == 0) { //一微妙内产生的ID计数已达上限,等待下一微妙 timestamp = GetNextTimestamp(lastTimestamp); } } else { //不同微秒生成ID sequence = 0L; } if (timestamp < lastTimestamp) { throw new Exception("时间戳比上一次生成ID时时间戳还小,故异常"); } Snowflake.lastTimestamp = timestamp; //把当前时间戳保存为最后生成ID的时间戳 long Id = ((timestamp - twepoch) << (int)timestampLeftShift) | (datacenterId << (int)datacenterIdShift) | (machineId << (int)machineIdShift) | sequence; return Id; } } }