当我们 select * table_name where id = 10 时有多少映射器和缩减器 运行;在蜂巢
How many mappers and reducers run when we select * table_name where id = 10; in hive
当我们 select * table_name where id = 10 时,有多少映射器和缩减器 运行;在蜂巢?它是基于输入分割还是文件大小?在这种情况下如何确定 no.of 映射器和缩减器?
有什么建议吗?
对于输入的每个输入拆分 table 将调度一个映射器,其中输入拆分的默认大小将是块大小。
您可以通过修改 mapreduce.input.fileinputformat.split.maxsize
和 mapreduce.input.fileinputformat.split.minsize
属性来改变映射器的数量。
关于 Hive 中 reducer 的数量,默认情况下使用 hive.exec.reducers.bytes.per.reducer
属性 计算,其默认值为 1GB。
您将可以通过修改以上属性来配置减速器的数量。您仍然可以使用 mapred.reduce.tasks
属性.
为作业设置固定数量的减速器
希望这对您有所帮助。
当我们 select * table_name where id = 10 时,有多少映射器和缩减器 运行;在蜂巢?它是基于输入分割还是文件大小?在这种情况下如何确定 no.of 映射器和缩减器? 有什么建议吗?
对于输入的每个输入拆分 table 将调度一个映射器,其中输入拆分的默认大小将是块大小。
您可以通过修改 mapreduce.input.fileinputformat.split.maxsize
和 mapreduce.input.fileinputformat.split.minsize
属性来改变映射器的数量。
关于 Hive 中 reducer 的数量,默认情况下使用 hive.exec.reducers.bytes.per.reducer
属性 计算,其默认值为 1GB。
您将可以通过修改以上属性来配置减速器的数量。您仍然可以使用 mapred.reduce.tasks
属性.
希望这对您有所帮助。