关于

MapReduce

的集合

05

14-11

摘要:本文将介绍基于物品的协同过滤推荐算法案例在TDW Spark与MapReudce上的实现对比,相比于MapReduce,TDW Spark执行时间减少了66%,计算成本降低了40%。MapReduce为大数据挖掘提供了有力的支持,但是复杂的挖掘算法往往需要多个MapReduce作业才能完成,多个作业之间存在着冗余的磁盘读写开销和多次资...

23

14-07

摘要:亚马逊Web服务的弹性MapReduce是一项基于Hadoop的实施,它可允许你运行大型的预处理工作,Mrjob、Dumbo以及PyDoop是三个基于Python可满足以上需求的弹性MapReduce框架。【编者】当你开发一些EMR任务时,Hadoop的Python框架是有用的。 mrjob、Dumbo以及PyDoop三个开发框架都可以在弹性MapRedu...

04

14-06

摘要:对于刚接触大数据的用户来说,要想区分Hive与HBase是有一定难度的。本文将尝试从其各自的定义、特点、限制、应用场景等角度来进行分析,以作抛砖引玉之用。对于刚接触大数据的用户来说,要想区分Hive与HBase是有一定难度的。本文将尝试从其各自的定义、特点、限制、应用场景等角度来进行分析,以作抛砖引玉之用...

14条记录
回到顶部
嘿,我来帮您!