首页 >  
搜索关键字:lsh    ( 161个结果
调试与对拍(一):生成测试数据+对拍
今天打比赛时令小编很气愤,隔壁LSH有文件运行错误,重提了一遍老师就收,而小编重提却爱搭不理,于是小编决定还是自己造个数据把代码重测一遍,于是潜心钻研生成测试数据的方法。 其实很简单,用随机数生成器生成几个随机数再根据数据规模取模就可以了,(必要时可以增加一些特定测试点),代码就几行不做解释了(别问 ...
分类:其他   时间:2019-06-15 20:41:09    收藏:0  评论:0  赞:0  阅读:25
使用Neo4j分析《权力的游戏》
几个月前,数学家 Andrew Beveridge和Jie Shan在数学杂志上发表《权力的网络》,主要分析畅销小说《冰与火之歌》第三部《冰雨的风暴》中人物关系,其已经拍成电视剧《权力的游戏》系列。他们在论文中介绍了如何通过文本分析和实体提取构建人物关系的网络。紧接着,使用社交网络分析算法对人物关系 ...
分类:其他   时间:2019-06-13 11:46:51    收藏:0  评论:0  赞:0  阅读:44
利用Minhash和LSH寻找相似的集合
问题背景 给出N个集合,找到相似的集合对,如何实现呢?直观的方法是比较任意两个集合。那么可以十分精确的找到每一对相似的集合,但是时间复杂度是O(n2)。当N比较小时,比如K级,此算法可以在接受的时间范围内完成,但是如果N变大时,比B级,甚至P级,那么需要的时间是不能够被接受的。比如N= 1B = 1 ...
分类:其他   时间:2019-05-31 14:54:07    收藏:0  评论:0  赞:0  阅读:18
局部敏感哈希算法(Locality Sensitive Hashing)
from:https://www.cnblogs.com/maybe2030/p/4953039.html 阅读目录 1. 基本思想 2. 局部敏感哈希LSH 3. 文档相似度计算 局部敏感哈希(Locality Sensitive Hashing,LSH)算法是我在前一段时间找工作时接触到的一种衡 ...
分类:编程语言   时间:2019-05-29 12:13:30    收藏:0  评论:0  赞:0  阅读:21
云计算学习教程,web页面更新脚本详解
背景:一般公司内生产服务器的web上线更新是由运维人员来完成的,但是不排除有些公司管理混乱,开发自己上传文件到服务器,比如本人之前所在的公司就出现这样的奇葩事,更新方法有很多种,服务多了用自动化运维工具,比如ansible,还可以直接使用svn或git,但是如果服务器比较少的情况下用ansible这样的工具总有些杀鸡用牛刀的感觉,故给新来的开发人员写下如下脚本供其上传新文件到web服务器.注:此脚
分类:Web开发   时间:2019-05-10 10:48:49    收藏:0  评论:0  赞:0  阅读:58
LSH算法
LSH算法 如果一篇文档由100维单词组成,LSH做的事情就是通过对维度分隔,从而对不同文档进行分桶。 如果我准备对100维度分成5个部分,每个部分对应20个维度。序列号为1,2,3,4,5 按照顺序来对比,如果1号中,两个文档的特征是一样的,就分到一个桶里面,如果不一样,就继续看2号,直到5完成。 ...
分类:编程语言   时间:2019-05-08 14:05:14    收藏:0  评论:0  赞:0  阅读:82
minhash算法
minhash算法 大数据量计算相似度的时候,我们使用minhash(最小哈希)进行降维,使用LSH算法进行近似查询。 相似性的度量: 使用雅卡尔系数,交集数量除以并集数量。 以文档为例,组成成分为单词。我们将单词量化为数值,那么一个文档的构成可以有一个数值单词表构成,0表示存在,1表示不存在。 我 ...
分类:编程语言   时间:2019-05-08 13:39:30    收藏:0  评论:0  赞:0  阅读:47
Directx11教程(59) tessellation学习(1)
原文:Directx11教程(59) tessellation学习(1) 在D3D11管线中,新增加了3个stage, Hull shader, Tessellator, Domain shader,用来实现细分操作,就是在gpu中把低细节的表面细分成高细节的体元。在gpu中把低模通过tessell... ...
分类:其他   时间:2019-05-06 10:19:57    收藏:0  评论:0  赞:0  阅读:58
爬虫岗简历-2019-04-25
个人信息 黄劲/男/1996 本科/福建师范大学2019届 软件工程 博客:http://www.cnblogs.com/lokvahkoor/ 期望职位:python爬虫工程师 期望薪资:税前月薪12k~14k,特别喜欢的公司可例外 联系方式 手机/微信:18060877133 邮箱:hj_101 ...
分类:其他   时间:2019-04-25 22:37:54    收藏:0  评论:0  赞:0  阅读:61
延迟加载
延迟加载 显示效果: 代码: ...
分类:其他   时间:2019-04-14 22:57:37    收藏:0  评论:0  赞:0  阅读:50
耗子大叔弹窗来自百度搜索引擎导流的弹窗JS源码赏析
刚看到https://coolshell.cn/articles/9308.html 耗子大叔评价梁斌站点被百度封杀事件言论 然后在自己个人网站酷壳网站上发布了一段JS代码 当请求来自百度导流过来的链接 将弹窗告知警示,下面是那段弹窗JS源码 ,技术人还是关注技术细节 ,分享给大家; ...
分类:Web开发   时间:2019-03-30 12:43:18    收藏:0  评论:0  赞:0  阅读:44
HDU-2612-Find a way
链接:https://vjudge.net/problem/HDU-2612#author=zhang95986 题意: hsj和lsh最近迷上了pokemon go的游戏。在双十一大物期中考试来临之前,他们想抓一只稀有土拨鼠来攒攒人品(因为土拨鼠的刷新地点最近来到了哈工程)但是由于土拨鼠过于强大, ...
分类:其他   时间:2019-03-25 00:03:29    收藏:0  评论:0  赞:0  阅读:59
HASHING(1)
1.Locality Sensitive Hashing(Shingling+MinHash) (LSH, 局部敏感哈希) 2. Learning to Hash 1.Introduction 很多的网页挖掘问题都可以表述为寻找相似集合: 1. 论文查重; 2. 推荐系统; 2.Finding Si ...
分类:其他   时间:2019-03-23 13:12:38    收藏:0  评论:0  赞:0  阅读:63
使用QML绘制界面
1 使用QML设计登录界面 https://www.cnblogs.com/bhlsheji/p/5324871.html 2 使用QML实现下拉列表框 https://blog.csdn.net/qq_35865125/article/details/80228025 3 学习实践HELP:Deb ...
分类:其他   时间:2019-03-19 00:14:14    收藏:0  评论:0  赞:0  阅读:77
阅读之SQL优化
一、性能不理想的系统中除了一部分是因为应用程序的负载确实超过了服务器的实际处理能力外,更多的是因为系统存在大量的SQL语句需要优化。 为了获得稳定的执行性能,SQL语句越简单越好。对复杂的SQL语句,要设法对之进行简化。 二、优化之前,首先要了解SQL的查询过程,大多数的查询优化工作实际上是遵循一些 ...
分类:数据库技术   时间:2019-03-10 23:10:17    收藏:0  评论:0  赞:0  阅读:92
javap 指令集
栈和局部变量操作 将常量压入栈的指令 aconst_null 将null对象引用压入栈 iconst_m1 将int类型常量-1压入栈 iconst_0 将int类型常量0压入栈 iconst_1 将int类型常量1压入栈 iconst_2 将int类型常量2压入栈 iconst_3 将int类型常... ...
分类:编程语言   时间:2019-02-28 21:49:51    收藏:0  评论:0  赞:0  阅读:57
Elasticsearch之优化
为什么es需要优化? 答: [[email protected] elasticsearch-2.4.0]# ulimit -a core file size (blocks, -c) 0 data seg size (kbytes, -d) unlimited scheduling priority (-e) ...
分类:其他   时间:2019-02-28 15:00:27    收藏:0  评论:0  赞:0  阅读:82
SP10707 COT2 - Count on a tree II
链接 https://vjudge.net/problem/SPOJ COT2 https://www.luogu.org/problemnew/show/SP10707 思路 dfs欧拉序转化为普通莫队(并不算树上莫队,不过也可做) 好神仙啊,原来欧拉序是可以求任意两点的点,不过要加lca。 代码 ...
分类:其他   时间:2019-02-16 19:29:36    收藏:0  评论:0  赞:0  阅读:178
django开发基础
一、配置静态文件 https://www.cnblogs.com/lshedward/p/10351051.html 二、路由分发 https://www.cnblogs.com/lshedward/p/10351098.html 三、视图函数 https://www.cnblogs.com/lsh ...
分类:其他   时间:2019-02-04 18:46:21    收藏:0  评论:0  赞:0  阅读:97
本地安装Cassandra
本地安装并启动Cassandra数据库 1. 安装条件 1.1 python连接条件:python2.7.x与python3.3.x或3.4.x 1.2 在启动Cassandra时,它会自动监测python2.7.x,如果没有,则不能顺利启动。 1.3 在启动cqlsh时,其只能与python3.3 ...
分类:其他   时间:2019-01-21 19:04:08    收藏:0  评论:0  赞:0  阅读:65
161条   1 2 3 4 ... 9 下一页
© 2014 bubuko.com 版权所有 鲁ICP备09046678号-4
打开技术之扣,分享程序人生!
             

鲁公网安备 37021202000002号