首页 最新 热门 推荐

  • 首页
  • 最新
  • 热门
  • 推荐

深入理解与应用Hadoop中的MapReduce

  • 24-03-05 00:01
  • 3314
  • 11772
blog.csdn.net

戳蓝字“CSDN云计算”关注我们哦!

 

作者:安静的技术控 

来源:CSDN 

原文:

https://blog.csdn.net/a2011480169/article/details/52924955 

版权声明:本文为博主原创文章,转载请附上博文链接!


现在大数据是越来越火了,而我自己研究这方面也很长时间了,今天就根据我自己的经验教会大家学会如何使用MapReduce,下文中将MapReduce简写为MR。


本篇博客将结合实际案例来具体说明MR的每一个知识点。


1、本篇博客核心内容


640?wx_fmt=png


2、MR的基本概念


640?wx_fmt=png


3、MR中map函数和reduce函数如何编写


640?wx_fmt=png


4、MR程序的基本编写流程(MR的基本执行过程)


640?wx_fmt=png


下面将用一个具体的电信业务说明MR最基本的编写过程:
实验所用数据:
640?wx_fmt=png
具体字段描述:
640?wx_fmt=png
业务要求:统计同一个用户的上行总流量和,下行总流量和以及上下总流量和
例如:
640?wx_fmt=png

代码示例:


640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

运行结果:

640?wx_fmt=png

640?wx_fmt=png

5、MR程序的优化方式1---分区


640?wx_fmt=png


具体业务描述:对于上面的电信数据,统计同一个用户的上行总流量和,下行总流量和以及上下总流量和,并且手机号(11位)的信息输出到一个文件中,非手机号(8位)的信息输出到一个文件中


代码示例


640?wx_fmt=png

640?wx_fmt=png


640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png


运行结果:

640?wx_fmt=png

6、MR程序的优化方式2---自定义排序


640?wx_fmt=png

业务描述:
对于上面业务得到的统计结果:
640?wx_fmt=png


先按照总流量由低到高排序,在总流量相同的情况下,按照下行流量和从低到高排序:


实例代码:

640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png


运行结果:
640?wx_fmt=png
640?wx_fmt=png

7、MR程序的优化方式3---本地归并Combine


640?wx_fmt=png


具体业务描述:对于上面的电信数据,统计同一个用户的上行总流量和,下行总流量和以及上下总流量和,代码中要求加入本地归并优化方式:
代码示例:


640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

运行结果:

640?wx_fmt=png
640?wx_fmt=png

8、MR程序的优化方式4---自定义计数器


640?wx_fmt=png


9、如何用MR实现某个业务的方式总结


640?wx_fmt=png



1.微信群:

添加小编微信:color_ld,备注“进群+姓名+公司职位”即可,加入【云计算学习交流群】,和志同道合的朋友们共同打卡学习!


2.征稿:

投稿邮箱:[email protected];微信号:color_ld。请备注投稿+姓名+公司职位。



推荐阅读

  • 云计算到底是怎么玩的?

  • 面向对象编程,再见!

  • AI女性界的“扛把子”,凭一己之力迫使NIPS改名

  • 00后也会「玩」区块链,你对「朝阳」行业焦虑啥 ?| 圣诞特辑

  • 20k~65k, 2018年最后一波热门技术岗位, 立刻投简历, 跳槽才是加薪的捷径

  • 可替代Android的6大开源移动操作系统

  • 程序员求助:被领导强行要求写Bug该怎么办?网友的回答让我笑翻


640?wx_fmt=jpeg

640?wx_fmt=gif点击“阅读原文”,查看原文

640?wx_fmt=png 喜欢就点击“好看”吧!
注:本文转载自blog.csdn.net的CSDN云计算的文章"https://blog.csdn.net/FL63Zv9Zou86950w/article/details/85604448"。版权归原作者所有,此博客不拥有其著作权,亦不承担相应法律责任。如有侵权,请联系我们删除。
复制链接
复制链接
相关推荐
发表评论
登录后才能发表评论和回复 注册

/ 登录

评论记录:

未查询到任何数据!
回复评论:

分类栏目

后端 (14832) 前端 (14280) 移动开发 (3760) 编程语言 (3851) Java (3904) Python (3298) 人工智能 (10119) AIGC (2810) 大数据 (3499) 数据库 (3945) 数据结构与算法 (3757) 音视频 (2669) 云原生 (3145) 云平台 (2965) 前沿技术 (2993) 开源 (2160) 小程序 (2860) 运维 (2533) 服务器 (2698) 操作系统 (2325) 硬件开发 (2492) 嵌入式 (2955) 微软技术 (2769) 软件工程 (2056) 测试 (2865) 网络空间安全 (2948) 网络与通信 (2797) 用户体验设计 (2592) 学习和成长 (2593) 搜索 (2744) 开发工具 (7108) 游戏 (2829) HarmonyOS (2935) 区块链 (2782) 数学 (3112) 3C硬件 (2759) 资讯 (2909) Android (4709) iOS (1850) 代码人生 (3043) 阅读 (2841)

热门文章

101
推荐
关于我们 隐私政策 免责声明 联系我们
Copyright © 2020-2025 蚁人论坛 (iYenn.com) All Rights Reserved.
Scroll to Top