bigram初始化完毕,bigram数据条数:
1519443
?
二元模型?人民:共和国?获得分值:
3.3166249
二元模型?人民:共?获得分值:
4.0
二元模型?人民:共和国?获得分值:
3.3166249
二元模型?人民:共?获得分值:
4.0
?
人民共和国?获得分值:
3.3166249
人民共和国?获得分值:
3.3166249
?
ngram分值:
????
1
、词个数=
5
ngram分值=
4.0
[中华,?人民,?共,?和,?国]
????
2
、词个数=
6
ngram分值=
4.0
[中,?华,?人民,?共,?和,?国]
????
3
、词个数=
4
ngram分值=
3.3166249
?? [中,?华,?人民,?共和国]
????
4
、词个数=
3
ngram分值=
3.3166249
?? [中华,?人民,?共和国]
????
5
、词个数=
2
ngram分值=
3.3166249
?? [中华,?人民共和国]
????
6
、词个数=
3
ngram分值=
3.3166249
?? [中,?华,?人民共和国]
????
7
、词个数=
5
ngram分值=
0.0
[中,?华,?人民,?共和,?国]
????
8
、词个数=
4
ngram分值=
0.0
[中华人民,?共,?和,?国]
????
9
、词个数=
3
ngram分值=
0.0
[中华人民,?共和,?国]
????
10
、词个数=
4
??? ngram分值=
0.0
[中华,?人,?民,?共和国]
????
11
、词个数=
6
??? ngram分值=
0.0
[中,?华,?人,?民,?共和,?国]
????
12
、词个数=
5
??? ngram分值=
0.0
[中,?华人,?民,?共和,?国]
????
13
、词个数=
5
??? ngram分值=
0.0
[中,?华,?人,?民,?共和国]
????
14
、词个数=
6
??? ngram分值=
0.0
[中华,?人,?民,?共,?和,?国]
????
15
、词个数=
4
??? ngram分值=
0.0
[中华,?人民,?共和,?国]
????
16
、词个数=
7
??? ngram分值=
0.0
[中,?华,?人,?民,?共,?和,?国]
????
17
、词个数=
1
??? ngram分值=
0.0
[中华人民共和国]
????
18
、词个数=
4
??? ngram分值=
0.0
[中,?华人,?民,?共和国]
????
19
、词个数=
2
??? ngram分值=
0.0
[中华人民,?共和国]
????
20
、词个数=
6
??? ngram分值=
0.0
[中,?华人,?民,?共,?和,?国]
????
21
、词个数=
5
??? ngram分值=
0.0
[中华,?人,?民,?共和,?国]
????
?
只保留最大分值:
????
1
、词个数=
5
ngram分值=
4.0
[中华,?人民,?共,?和,?国]
????
2
、词个数=
6
ngram分值=
4.0
[中,?华,?人民,?共,?和,?国]
????
?
分值相同则选择词个数最少的:[中华,?人民,?共,?和,?国],词个数:
5