原文地址:http://blog.chinaunix.net/uid-22414998-id-3692113.html?page=3 数据抓取是一门艺术,和其他软件不同,世界上不存在完美的、一致的、通用的抓取工具。为了不同的目的,需要定制不同的代码。不过,我们不必Start from Scratch ...
分类:
其他 时间:
2016-05-15 02:20:23
收藏:
0 评论:
0 赞:
0 阅读:
142
原理: 1.首先判断是数值还是符号,如果是数值放进字符数组以#表示结束, 2.如果是符号,放进栈, 3.每个符号之间要比较优先级,如果栈顶符号优先级低,符号进栈,如果相等(即“(” “)”)出栈,栈顶符号优先级高,栈顶元素出栈进入字符数组,得到后缀表达式 4.计算后缀表达式,判断是数字还是符号。直到 ...
分类:
其他 时间:
2016-05-15 02:19:55
收藏:
0 评论:
0 赞:
0 阅读:
192
一、变量 1. 变量命名规则: 语法:(下划线或字母)+(任意数目的字母、数字或下划线) 如:a123,_a123,_a123_ 变量名必须以下划线或字母开头,而后面接任意数目的字母、数字或下划线。区分大小写,即:Name与name不是同一变量。禁止与python关键字及保留字相同。 python关 ...
分类:
编程语言 时间:
2016-05-15 02:19:43
收藏:
0 评论:
0 赞:
0 阅读:
161
首先创建DocumentBuilderFactory工厂产生DocumentBuilder对象 创建document对象: 使用documentBuilder对象的parse方法 如果这个时候我们直接输出document.toString()得到的只是一个null值。我们需要进一步的解析 不知道怎么 ...
分类:
编程语言 时间:
2016-05-15 02:18:53
收藏:
0 评论:
0 赞:
0 阅读:
208
《Core Java Volume I Fundamentals》介绍了三种创建Class对象的方法。本文将举例说明这三种创建Class对象 创建类的方法。 一、public final native Class<?> getClass() Object类中的getClass()方法将返回一个Cla ...
分类:
编程语言 时间:
2016-05-15 02:18:33
收藏:
0 评论:
0 赞:
0 阅读:
147
原文地址:http://blog.chinaunix.net/uid-22414998-id-3695673.html 续前文:《数据抓取的艺术(一):Selenium+Phantomjs数据抓取环境配置》。程序优化:第一步开始: for i in range(startx,total): for ...
分类:
其他 时间:
2016-05-15 02:17:03
收藏:
0 评论:
0 赞:
0 阅读:
158
Array类型是ECMAScript中最常用的类型了。 一、声明方式 1.使用Array构造函数 如果预先知道要保存数组的数量, 也可以给构造函数传递该数量,该数量会自动变成length属性值。 也可以向数组中传递包含的值。 在使用Array的时候也可以省略new操作符。 2. 数组字面量表示法 注 ...
分类:
编程语言 时间:
2016-05-15 02:15:46
收藏:
0 评论:
0 赞:
0 阅读:
189
安装supervisor sudo apt-get install supervsor 配置 打开 /etc/supervisor/supervisor.conf 可以看到 同目录文件夹下的 con.d 里面的.conf 都会被包含 编辑app.conf文件 [program : app] comm... ...
分类:
其他 时间:
2016-05-15 02:13:03
收藏:
0 评论:
0 赞:
0 阅读:
223
在实际使用 tesseract-orc 识别库的时候,初次制作的识别库很有可能识别率不太理想,需要后期慢慢补充 本文演示如何将多个修正过的box文件合并成一个识别库。 首先,需要图片样本.tif文件,位置文件.box ,只要有这两个文件在,就可以合并字典 假设已存在如下样品图片和修正过的box文件: ...
分类:
其他 时间:
2016-05-15 02:12:53
收藏:
0 评论:
0 赞:
0 阅读:
76
一、为什么要清除浮动? 1》父元素在未定义高的情况下,由于子元素全部浮动脱离文本流,而造成父元素高的塌陷(正常情况下,父元素的高是由未浮动的子元素撑起来) 2》因为部分子元素的而浮动,脱离文本流而造成其他元素的布局错乱。 二、常见的几种清除浮动方法 1》给没有浮动的子元素的CSS添加 clear: ...
分类:
Web开发 时间:
2016-05-15 02:10:03
收藏:
0 评论:
0 赞:
0 阅读:
213
有一个链表,怎样快速获取中间节点的元素。 方法1 遍历一下链表,确认长度,获取中间的节点元素,时间复杂度O(N) 方法2 设置两个指针,一个遍历p->nexr 一个 p->next->next,快慢指针的思想 时间复杂度为O(n/2) 代码: ...
分类:
其他 时间:
2016-05-15 02:08:43
收藏:
0 评论:
0 赞:
0 阅读:
98
9. Clustering Content 9. Clustering 9.1 Supervised Learning and Unsupervised Learning 9.2 K-means algorithm 9.3 Optimization objective 9.4 Random Init ...
分类:
其他 时间:
2016-05-15 02:08:13
收藏:
0 评论:
0 赞:
0 阅读:
234
一、源码编译 C++操作json字符串最好的库应该就是jsoncpp了,开源并且跨平台。它可以从这里下载。 下载后将其解压到任意目录,它默认提供VS2003和VS2010的工程文件,使用VS2010可以直接打开makefiles\msvc2010目录下的sln文件。 工程文件提供Jsoncpp的wi... ...
分类:
编程语言 时间:
2016-05-15 02:07:33
收藏:
0 评论:
0 赞:
0 阅读:
550
...
分类:
编程语言 时间:
2016-05-15 02:06:24
收藏:
0 评论:
0 赞:
0 阅读:
260
子曰:里仁为美,择不处仁,焉得知? 子曰:不仁者,不可以久处约,不可以长处乐;仁者安仁,知者利仁. 子曰:唯仁者,能好人,能恶人。 子曰:苟志于仁矣,无恶也。 子曰:富与贵,是人之所欲也,不以其道得之,不处也。贫与贱,是人之所恶也。不以其道得之,不去也。君子去仁,恶乎成名?君子无终食之间违仁,造次必 ...
分类:
其他 时间:
2016-05-15 02:05:44
收藏:
0 评论:
0 赞:
0 阅读:
230
Type操作符 返回值 : 1undefined 这个未定义 2.boolean 这个为boolean类型 3.string 这个是字符串 4.number 这个就是数值 5.object 这个是对象或者为null 6.function 这个是数值 ...
分类:
其他 时间:
2016-05-15 02:05:23
收藏:
0 评论:
0 赞:
0 阅读:
239
函数 def sayHi(): print 'Hi' def cheng(a,b): return a*b print cheng(3,4) 局部变量:函数内部定义,函数调用结束后释放 全局变量:函数内外都可调用,global >>> def hanshu2():... global x #x为全局 ...
分类:
其他 时间:
2016-05-15 02:05:03
收藏:
0 评论:
0 赞:
0 阅读:
263
课件内容(有注释): 页面的自动滚动效果,可由javascript来实现, 但是有一个html标签 - <marquee></marquee>可以实现多种滚动效果,无需js控制。 使用marquee标记不仅可以移动文字,也可以移动图片,表格等. 语法:<marquee>...</marquee>; ...
分类:
其他 时间:
2016-05-15 02:03:54
收藏:
0 评论:
0 赞:
0 阅读:
233
原文地址:http://blog.chinaunix.net/uid-22414998-id-3696649.html 本来是想把这部分内容放到前一篇《数据抓取的艺术(二):数据抓取程序优化》之中。但是随着任务的完成,我越来越感觉到其中深深的趣味,现总结如下: (1)时间 时间是一个与抓取规模相形而 ...
分类:
其他 时间:
2016-05-15 02:03:23
收藏:
0 评论:
0 赞:
0 阅读:
209
一、第一句Python代码 1. 打开python shell --》 2. 输入 print("hello world!"), Enter回车 3.至此,我们的第一个python程序就执行完了,这个程序的作用就是向控制台输出“hello world!” python内部执行过程如下: 二、创建代码 ...
分类:
编程语言 时间:
2016-05-15 02:03:03
收藏:
0 评论:
0 赞:
0 阅读:
240