铭文一级:[木有笔记]
铭文二级:
第12章 Spark Streaming项目实战
行为日志分析:
1.访问量的统计
2.网站黏性
3.推荐
Python实时产生数据
访问URL->IP信息->referer和状态码->日志访问时间->写入到文件中
本地与虚拟机都要装了python才能运行
重要代码:
#coding=UTF-8
#数组最后一个没有“,”
url_paths = [ "class/128.html", "class/112.html", "class/143.html", "class/141.html", "learn/821", "course/list" ] #增强for循环 #sample(seq, n) 从序列seq中选择n个随机且独立的元素; return ".".join([str(item) for item in slice]) def sample_url() return random.sample(url_paths,1)[0] query_log = "{url}".format(url=sample_url())
一张图让你学会Python基础语法(看不清可另存为):