铭文一级:[木有笔记]
铭文二级:
第12章 Spark Streaming项目实战
行为日志分析:
1.访问量的统计
2.网站黏性
3.推荐
Python实时产生数据
访问URL->IP信息->referer和状态码->日志访问时间->写入到文件中
本地与虚拟机都要装了python才能运行
重要代码:
#coding=UTF-8
#数组最后一个没有“,”
url_paths = [
"class/128.html",
"class/112.html",
"class/143.html",
"class/141.html",
"learn/821",
"course/list"
]
#增强for循环
#sample(seq, n) 从序列seq中选择n个随机且独立的元素;
return ".".join([str(item) for item in slice])
def sample_url()
return random.sample(url_paths,1)[0]
query_log = "{url}".format(url=sample_url())
一张图让你学会Python基础语法(看不清可另存为):