首页 > Web开发 > 详细

网站用户行为分析

时间:2020-12-26 17:50:02      阅读:23      评论:0      收藏:0      [点我收藏+]

二、网站用户行为分析

  1. 步骤

1.1 本地数据集上传到数据仓库Hive

  1. 数据集下载与查看
  2. 数据集预处理
  3. 把数据集导入HDFS中
  4. 在Hive上创建数据库

1.2 Hive数据分析

  1. 给出数据分析需求
  2. 用select语句实现数据分析
  3. 数据分析结果查看与保存

     

1.3 Hive、MySQL、HBase数据互导

  1. 操作过程

2.1 数据准备

移动文件到dataset文件夹下

技术分享图片

 

 

 语句:sed -i ‘1d‘ raw_user

技术分享图片

 

 

 语句:vim pre_deal.sh

技术分享图片

 

 

 语句:head - 10 user_table.txt

技术分享图片

 

 

 

 

2.2 Hive数据分析

(1)用户行为分析需求:2014-12-11~12号有多少条购买商品的记录

    分析步骤

  • 语句:select count(*) from bigdata_user where visit_date >‘2014-12-10‘ and visit_date <‘2014-12-13‘ and behavior_type=‘4‘ limit 10;
  • 结果截图:运行或存为表格后的查询显示

技术分享图片

 

 

 

(2)用户行为分析需求:分析每月1-31号购买情况

 语句:select count(distinct uid),month(visit_date) from bigdata_user where buhavior_type = ‘4‘ group by month(visit_date);

截图:技术分享图片

 

 

 

(3)自定义需求:

1、2014-12-12号当天广东购买商品数

语句:select * from bigdata_user where behavior_type = ‘4‘ and visit_date = ‘2014-12-12‘;

截图:技术分享图片

 

 

 

2、按照省份统计购买数量

语句:select count(*) from bigdata_user where buhavior_type=‘4‘ group by province;

截图:技术分享图片

 

 

3、2014-12-12号当天的商品购买与浏览比例

 语句:

select count(*) from bigdata_user where visit_date=‘2014-12-12‘and behavior_type=‘4‘;
截图:
技术分享图片

 

 

 
语句:
select count(*) from bigdata_user where visit_date =‘2014-12-12‘;

   截图:

技术分享图片

 

 

4、用户10001082在2014-12-12号当天活跃度;该用户点击行为占该当天所有点击行为的比例

语句:select count(*) from bigdata_user where uid=10001082 and visit_date=‘2014-12-12‘;

截图:技术分享图片

 

 

语句:select count(*) from bigdata_user where visit_date=‘2014-12-12‘;

截图技术分享图片

 

 

5、2014-12-12号当天购买4件商品以上的用户

语句:select uid from bigdata_user where behavior_type=‘4‘ and visit_date=‘2014-12-12‘ group by uid having count(behavior_type=‘4‘)>4;

截图:技术分享图片

 

网站用户行为分析

原文:https://www.cnblogs.com/kayss/p/14188145.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!