考虑典型的文本分类,一个经典的方法就是
? ?
Feature hashing怎么做?
不使用特征词典了,不用考虑额外的存储词典的空间,直接对特征进行hash编号。
有冲突? 后面会说明对效果影响不大!
同样的内存占用下 我们可以存储更多的weights!
Feature hashing相关 - 1
原文:http://www.cnblogs.com/rocketfan/p/4143108.html