为什么输入输出一般都是"write once"或者"immutable"个文件?另外,MapReduce 程序的结构是什么?
Why are input and output generally "write once" or "immutable" files? Also what is the structure of a MapReduce program?
我这周有考试,正在学习学习指南。我正在为这两个问题的答案而苦苦挣扎。我已经给我的教授发了邮件,但他还没有回复我,所以我想我会在这里试试。有人知道这两个问题的答案吗?
为什么输入输出一般都是"write once"或"immutable"个文件?
MapReduce程序的结构是什么?
https://developer.yahoo.com/hadoop/tutorial/module4.html
相反,MapReduce 中的所有数据元素都是不可变的,这意味着它们无法更新。如果在映射任务中更改输入(键、值)对,它不会反映在输入文件中;通信仅通过生成新的输出(键、值)对发生,然后由 Hadoop 系统转发到下一个执行阶段。
以上 link 中的这一段可能有所帮助
您不能更改您发送或接收的值,也不能更改该值。
一个map操作returns一个与单个输入对象相关的新对象。
reduce 操作从其输入聚合单个值。
map-reduce 程序可以做到这两点。
我这周有考试,正在学习学习指南。我正在为这两个问题的答案而苦苦挣扎。我已经给我的教授发了邮件,但他还没有回复我,所以我想我会在这里试试。有人知道这两个问题的答案吗?
为什么输入输出一般都是"write once"或"immutable"个文件?
MapReduce程序的结构是什么?
https://developer.yahoo.com/hadoop/tutorial/module4.html
相反,MapReduce 中的所有数据元素都是不可变的,这意味着它们无法更新。如果在映射任务中更改输入(键、值)对,它不会反映在输入文件中;通信仅通过生成新的输出(键、值)对发生,然后由 Hadoop 系统转发到下一个执行阶段。
以上 link 中的这一段可能有所帮助
您不能更改您发送或接收的值,也不能更改该值。
一个map操作returns一个与单个输入对象相关的新对象。
reduce 操作从其输入聚合单个值。
map-reduce 程序可以做到这两点。