什么是MapReduce
1 | - 源自Google的MapReduce论文 |
特点
1 | - 易于编程 |
不擅长的场景
1 | - 实时计算 |
MapReduce编程模型
1 | - input&splitting |
1
2
3
4
5
6
7
8- Input:输入数据
- Splitting:切分
- *Mapping(开发)*:将Splitting的数据进行拆分,单条数据统计
- Shuffling:按照key的规则,放置到一起
- *Reducding(开发)*:归并处理
- output:输出
- 易开发:仅仅在Mapping和Reducding我们进行开发
WordCount实例
1 | import java.io.IOException; |