美文网首页
Hadoop Page Rank

Hadoop Page Rank

作者: 98Future | 来源:发表于2017-11-04 05:28 被阅读0次

Page Rank实现本质也是矩阵相乘

Idea: 用Transition Matrix 乘 initial population on each website. 得到的就是下一个state 的population on each website. 不断调用transition matrix, 最后各个网站人数会趋近stable。

unitState表示time of convergence 我们可以自己定。

调用multiplication.main() on Page Rank matrix.

然后再Sum on unitMultiplication Result.

Multiplication:

PRmapper 给的是当前state上的人数 pr[0] = web name, pr[1]=population

MultiplicationReducer=<网站B, 从网站A这次来B的人数>

//Sum

KEY IDEA:

从1去到a,b,c,d

每个占比1/4!

相关文章

网友评论

      本文标题:Hadoop Page Rank

      本文链接:https://www.haomeiwen.com/subject/ufffmxtx.html