时间: 2020-09-16|32次围观|0 条评论

为什幺要压缩?

压缩会提高计算速度?这是因为mapreduce计算会将数据文件分散拷贝到所有datanode上,压缩可以减少数据浪费在带宽上的时间,当这些时间大于压缩/解压缩本身的时间时,计算速度就会提高了。 
    hadoop的压缩除了将输入文件进行压缩外,hadoop本身还可以在计算过程中将map输出以及将reduce输出进行压缩。

 

合理设置Map和Reduce个数:通过设置分片大小

文章转载于:https://www.cnblogs.com/kxdblog/p/4316709.html

原著是一个有趣的人,若有侵权,请通知删除

本博客所有文章如无特别注明均为原创。
复制或转载请以超链接形式注明转自起风了,原文地址《Hadoop压缩
   

还没有人抢沙发呢~