Map

09

17-08

译者注：想要程序的性能得到提升吗？尝试下通过找到慢的东西，然后用更快的东西来代

14

15-01

摘要：Hive查询生成多个map reduce job，一个map reduce job又有map，reduce，spill，shuffle，sort等多个阶段，所以针对hive查询的优化可以大致分为针对MR中单个步骤的优化，针对MR全局的优化以及针对整个查询的优化。一个Hive查询生成多个Map Reduce Job，一个Map Reduce Job又有Map，Reduce，Spill，S...

21

14-05

腾讯大数据之TDW计算引擎解析——Shuffle

摘要：腾讯分布式数据仓库基于开源软件Hadoop和Hive进行构建,TDW计算引擎包括两部分：MapReduce和Spark，两者内部都包含了一个重要的过程—Shuffle。本文对Shuffle过程进行解析，并对两个计算引擎的Shuffle过程进行比较。腾讯分布式数据仓库（Tencent distributed Data Warehouse, 简

沙克云

定制

关于