首页 > 其他 > 详细

Massive Data Mining学习记录

时间:2015-02-07 21:38:53      阅读:333      评论:0      收藏:0      [点我收藏+]

第一周:

学习PageRank,

知识点:每个节点的权值由其他节点的投票决定,所有节点的权值和为1

当节点很多时候必须转换成矩阵运算来计算节点的最终值,由马尔可夫链可以证明,这个值可以迭代得到

问题:可能出现无出度节点,导致总体失衡

解决办法:每个节点的入读权值矩阵M‘ = 0.8*M + 0.2*1/n,以0.2的概率跳出当前节点

 

模拟代码:

(ns myclojure.core
  (:use [incanter core stats charts io]))

(def M (matrix [[1/2 1/2 0] [1/2 0 0] [0 1/2 1]]))
(def r (matrix [1/3 1/3 1/3]))
(def T (matrix [r r r]))

(defn fir 
  []
  (loop [rr r t 20] 
    (if (pos? t) 
      (do (println (str t rr))
          (recur (mmult (plus (mult 0.8 M) (mult 0.2 T)) rr) (- t 1)))
      rr)))

(defn -main
  "I don‘t do a whole lot."
  [& args]
  (fir))

(fir)

 

Massive Data Mining学习记录

原文:http://www.cnblogs.com/TLightSky/p/4279327.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!