bigram初始化完毕,bigram数据条数:1519443
?
二元模型?人民:共和国?获得分值:3.3166249
二元模型?人民:共?获得分值:4.0
二元模型?人民:共和国?获得分值:3.3166249
二元模型?人民:共?获得分值:4.0
?
人民共和国?获得分值:3.3166249
人民共和国?获得分值:3.3166249
?
ngram分值:
????1、词个数=5 ngram分值=4.0 [中华,?人民,?共,?和,?国]
????2、词个数=6 ngram分值=4.0 [中,?华,?人民,?共,?和,?国]
????3、词个数=4 ngram分值=3.3166249?? [中,?华,?人民,?共和国]
????4、词个数=3 ngram分值=3.3166249?? [中华,?人民,?共和国]
????5、词个数=2 ngram分值=3.3166249?? [中华,?人民共和国]
????6、词个数=3 ngram分值=3.3166249?? [中,?华,?人民共和国]
????7、词个数=5 ngram分值=0.0 [中,?华,?人民,?共和,?国]
????8、词个数=4 ngram分值=0.0 [中华人民,?共,?和,?国]
????9、词个数=3 ngram分值=0.0 [中华人民,?共和,?国]
????10、词个数=4??? ngram分值=0.0 [中华,?人,?民,?共和国]
????11、词个数=6??? ngram分值=0.0 [中,?华,?人,?民,?共和,?国]
????12、词个数=5??? ngram分值=0.0 [中,?华人,?民,?共和,?国]
????13、词个数=5??? ngram分值=0.0 [中,?华,?人,?民,?共和国]
????14、词个数=6??? ngram分值=0.0 [中华,?人,?民,?共,?和,?国]
????15、词个数=4??? ngram分值=0.0 [中华,?人民,?共和,?国]
????16、词个数=7??? ngram分值=0.0 [中,?华,?人,?民,?共,?和,?国]
????17、词个数=1??? ngram分值=0.0 [中华人民共和国]
????18、词个数=4??? ngram分值=0.0 [中,?华人,?民,?共和国]
????19、词个数=2??? ngram分值=0.0 [中华人民,?共和国]
????20、词个数=6??? ngram分值=0.0 [中,?华人,?民,?共,?和,?国]
????21、词个数=5??? ngram分值=0.0 [中华,?人,?民,?共和,?国]
?????
只保留最大分值:
????1、词个数=5 ngram分值=4.0 [中华,?人民,?共,?和,?国]
????2、词个数=6 ngram分值=4.0 [中,?华,?人民,?共,?和,?国]
?????
分值相同则选择词个数最少的:[中华,?人民,?共,?和,?国],词个数:5