q
1.用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)进行词频统计。
我统计的是博客园2018年到4月底的新闻词频统计,统计的结果大部分为中文,统计的最后几个单词如下图
首先在本地把统计好的词频转化成csv格式和txt格式
通过软件WinSCP把文件上传到虚拟机
然后要启动hdfs
上传到hdfs并显示前10条
启动mysql
启动hive
创建数据库
创建表
导入数据
查看数据
原文:https://www.cnblogs.com/zzrf/p/9068456.html