首页 > 其他 > 详细

数据量大的情况用布隆过滤器判断是否已存在

时间:2019-05-25 11:38:03      阅读:112      评论:0      收藏:0      [点我收藏+]

处理待爬链接,目标网址数据量大的情况下,判断目标网址是否已存在

from bloom_filter import BloomFilter
bloom = BloomFilter(max_elements=10000000, error_rate=0.1)
# 添加URL
bloom.add(https://www.cnblogs.com/6min)
#判断是否在 exists = bloom.__contains__(https://www.cnblogs.com/6min)

 

数据量大的情况用布隆过滤器判断是否已存在

原文:https://www.cnblogs.com/6min/p/10921622.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!