在"一文让你彻底明白什么是一致性哈希"该文中,我们已经了解到了什么是一致性哈希及其的若干问题。还不了解的或者需要温习的请戳以下链接进行回味。
原文链接:http://www.toutiao.com/i6685547708570141188/
文中最后留下了两个小问题,最后的两个小问题将在以下进行详细美妙的回答。
问题1:hash函数是在大样本的情况下才会均匀,如果现在机器比较少的情况下,hash后机器的位置分布不均匀怎么办?
问题2:即使刚开始机器分布很均匀,但是加机器后也会导致不均匀的情况。
如果问题不明白的话,还是请戳“一文让你彻底明白什么是一致性哈希”这篇文章。
原文链接:http://www.toutiao.com/i6685547708570141188/
上述问题1提到,如果机器很少的话,他们经过hash之后落在环有可能形成不均匀的情况,会造成负载不均衡的情况,即:
因为hash函数必须在足够大的样本里,hash之后的分布才会显得均匀,因此针对问题1,我们引入虚拟节点的概念,例如,有三台物理机,分别是m-1、m-2和m-3,假设虚拟节点个数为1000.
将m-1虚拟化m-1-1、m-1-2、m-1-3...... m-1-1000
m-2虚拟化m-2-1、m-2-2、m-2-3.....m-2-1000
m-3虚拟化m-3-1、m-3-2、m-3-3.....m-3-1000,
然后设置一张物理机和虚拟机的对应表,目的是为了找到可以通过物理机找到对应的虚拟机,通过虚拟机找到相对应的物理机,如下。
那这样的话,通过每台真实的物理机虚拟化后的节点,经过hash,映射到环上,注意,是虚拟节点去抢环上的点,又因为每台物理机都有等量的虚拟节点,故它们在环上的分布可以看作是比较均匀的。
当数据来的时候,同样是按照数据找到其在环上的位置,然后通过顺时针法则找到离它最近的虚拟节点,然后将该数据存到该虚拟节点所对应的物理机上(通过虚拟节点-物理机对应表寻找)。
如图,环上的节点均为虚拟节点,为简单起见,假设每台物理机只有3个虚拟节点,那当数据经过hash后映射到环上是上图的位置时,顺时针找到离它最近的m-1-1,然后通过“虚拟节点-物理机”映射表找到m-1-1对应的m-1物理机进行存储。
同样的,如果新增一台m4机器,将它虚拟化成等量的虚拟节点,然后分布在环上。简单起见,每个物理机只有3个虚拟节点,实际上是虚拟化成很多很多的,例如上文提到的1000个虚拟节点。
所以,原本图中绿色的数据属于m-1中的m-1-1部分的,但是现在中间多了个m-4-1,因此,按顺时针法则,灰色部分的数据从m-1上的m-1-1虚拟节点转移到m-4上的m-4-1节点。同样满足虚拟节点均匀分布(即说明每台物理机都负载均衡)和数据迁移代价低的条件。
哈希冲突问题,即两个虚拟节点在环上发生冲突了,目前的解决方案是两个虚拟节点分别对应的两个真实物理机都存同样一份数据。另外冲突的概率是很小的,是个小概率事件,比如环上的哈希值范围为0~2^64,即环上总共可以有2^64个点,但是虚拟节点数目远比这个总数要小,所以发生冲突的可能性比较低,因此可采用以上策略进行解决。
美军“灰鹰”无人机。13日,美国国防部证实,将于明年初开始在韩国部署“灰鹰”无人机。图/视觉中国 当地时间2016年5月21日,巴基斯坦俾路支省Ahmad Wal镇,阿富汗塔利班领导人阿赫塔尔·曼...
12月2日,2020(第十三届)国际汽车技术年会暨“汽车创新技术大奖”颁奖盛典在上海隆重举行。BMTS凭借“400V-700V燃料电池空气压缩机”技术获得“汽车技术创新大奖”。...
这几天不错,交换的友情链接都是几个在业内名字比较大的网站,所以今天抽着周末的上午来写一篇关于交换友情链接的技术含量,很多看不起这一点,但实际上友情链接给我带来的流量远远超过了我每天去互访的流量,所以还...
上个礼拜有网友说,我博客被黑了,其实不是这么回事,只是我自己建立了一个栏目在做黑帽SEO的测试,因为前段时间关键词部分黑帽关键词被和谐了,所以测试我的黑帽SEO技术是否还有价值,事实证明,只是和谐了关...
rta是什么意思(快手推出RTA技术)快手推出的RTA技术,帮助广告主减少无效投放,让流量价值实现最大化。 广告主投放短视频广告最关心的是什么?流量与转化。伴随快手商业化进程不断加速,快手...
网站排名大揭秘 提到泛目录,想必做黑帽SEO的朋友都不会陌生,虽然泛目录程序有很多,但是能把泛目录用好的朋友并不多,今天给大家解析一下泛目录操作核心要点,以免新手朋友再次犯错误,从而与自己的网站...