使用Hadoop统计日志数据


用户行为日志:为什么要记录用户访问行为日志:用户行为日志生成渠道:用户行为日志大致内容:用户行为日志分析的意义:离线数据处理流程:流程示意图:
需求:日志片段如下:首先我们需要根据日志信息抽取出浏览器信息,针对不同的浏览器进行统计操作。虽然可以自己实现这个功能,但是懒得再造轮子了,所以我在GitHub找到了一个小工具可以完成这个功能,GitHub地址如下:https://github.com/LeeKemp/UserAgentParser通过git clone或者浏览器下载到本地后,使用命令行进入到其主目录下,然后通过maven命令对其进行打包并安装到本地仓库里:安装完成后,在工程中添加依赖以及插件:然后我们编写一个测试用例来测试一下这个解析类,因为之前并没有使用过这个工具,所以对于一个未使用过的工具,要养成在工程中使用之前 香港云主机对其进行测试的好习惯:控制台输出结果如下:从打印结果可以看到,UserAgent的相关信息都正常获取到了,我们就可以在工程中进行使用这个工具了。创建一个类,编写代码如下:在工程目录下打开控制台,输入如下命令进行打包:打包成功:
将这个jar包上传到服务器上:把事先准备好的日志文件上传到HDFS文件系统中:执行如下命令执行成功:
查看处理结果:

相关推荐: 如何解决win7系统计算机图标消失问题

这篇文章给大家分享的是有关如何解决win7系统计算机图标消失问题的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。1.右击桌面空白处,选中“个性化”选项。2.点击“个性化”左框中的“更改桌面图标”。3.在“桌面图标设置”,当看到桌面图标…

免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。

Like (0)
Donate 微信扫一扫 微信扫一扫
Previous 07/23 18:09
Next 07/23 18:09

相关推荐