哈希思想和应用学习 2019-04-15

作者: 小爆爆就是我 | 来源:发表于2019-04-15 20:15 被阅读0次

哈希思想和应用学习 2019-04-15
哈希（hash） - 哈希算法的应用
哈希表
哈希值的生成模式
算法学习--哈希表思想
Vue核心插件之路由模式
DCMH
右手Redis(Redis的高级数据结构)
局部敏感哈希算法
哈希法-哈希表介绍、构造方法、解决冲突办法

哈希算法

概念
哈希思想：
为方便对数据的查找，用数组作为存放值的容器，
通过哈希函数（散列函数）将键（key）转换为索引，
映射到数组对应的地址，
通过对索引的搜索，实现对值的查找。

散列冲突：理想情况下，不同的键会被哈希函数转换为不同的索引值，但是多数情况下我们会遇到多个键对应相同的索引值的情况--散列冲突。（本意不是取同样的值，实际都指向那个值了）

产生散列冲突的原因看下面△处。

解决散列冲突：
拉链法（链地址法）和线性探测法。

哈希算法的实现方法（设计哈希表）：
首先用散列函数将键转换为数组的索引；
解决散列冲突。

[ 补充学习
除留余数法：
参考文章 http://www.nowamagic.net/academy/detail/3008040
这是构造哈希函数最常用的方法。散列表长度为m的散列函数公式为：
f( key ) = key mod p ( p ≤ m )，
mod是取模的意思（可直接对键取模，也可以折叠、平方取中之后再取模）；
p值是生成索引的关键因素，如果p取得不好就容易产生重复索引。从经验上说，p值一般取不超过m的最大质数，或者是不包含20的质因子的合数（比如m=500，p=499或483（21*23））。]

索引的数据类型：
索引的数据类型可以是整数、浮点等任意数据类型，甚至是自定义的。

1.正整数
小正整数直接用；
负数偏移到正数用；
大正整数：
1)除留余数法。见上面的除留余数法。常用但容易造成索引分布不均匀的情况，也会产生散列冲突。
2)大素数法（质数）。可以有效避免索引分布不均，原理以后讨论。下图是大素数参考取值表：

image.png

2.浮点数
先转换成整数然后采用除留余数法。浮点数是二进制存储，将其转换为整数就行啦。

3.字符串
也可以看成正整数处理。

code=c∗B3+o∗B2+d∗B1+e∗B0 ↓
code=c∗B3+o∗B2+d∗B1+e∗B0 ↓
hash(code)=(c∗B3+o∗B2+d∗B1+e∗B0)%M ↓
hash(code)=(c∗B3+o∗B2+d∗B1+e∗B0)%M ↓
hash(code)=((((c∗B)+o)∗B+d)∗B+e))%M ↓
hash(code)=((((c∗B)+o)∗B+d)∗B+e))%M ↓
hash(code)=((((c%M)∗B+o)%M∗B+d)%M∗B+e))%M
最后一行公式为最终状态，B是进制，M是用于取模的素数。

int hash = 0;
for(int i = 0; i < s.length(); i++ )
    hash = (hash * B + s.charAt(i))%M);

???这个括号内的hash好像不对呀

未完待续

网友评论

本文标题：哈希思想和应用学习 2019-04-15

本文链接：https://www.haomeiwen.com/subject/sgjpwqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

哈希思想和应用学习 2019-04-15

相关文章