今天早上,中秋给我发了一个压缩包,里面有战德臣的课件,昨天我说我SQL没学好,他说给我发战徳臣课件,然后说我SQL不会的话可以看这个,还有两篇文
章《LDA数学八卦》以及《A Note on EM Algorithm and PLSA》,分别是讲LDA和PLSA的。
让我看说明:
1.有个文件里面有专门讲sql的;
2.LDA
和PLSA的文件,可以看一下,大概了解下输入输出,算法过程。我建议你现在想想共同作者或者机构的问题,了解下主题模型可能会有帮助,找出作者的
topic这个我正在做(可能会去微软学术搜索里面去抓取会议的信息,比如ICML这个会对应MachineLearning and Pattern
Recognition然后在对应着Computer
Science,这样可以直接通过作者发论文的期刊名字找到其topic),有新进展或者新想法一定要多讨论。
原文:http://www.cnblogs.com/SnakeHunt2012/p/3553052.html