当我们 select * table_name where id = 10 时有多少映射器和缩减器运行；在蜂巢

How many mappers and reducers run when we select * table_name where id = 10; in hive

当我们 select * table_name where id = 10 时，有多少映射器和缩减器运行；在蜂巢？它是基于输入分割还是文件大小？在这种情况下如何确定 no.of 映射器和缩减器？有什么建议吗？

对于输入的每个输入拆分 table 将调度一个映射器，其中输入拆分的默认大小将是块大小。

您可以通过修改 mapreduce.input.fileinputformat.split.maxsize 和 mapreduce.input.fileinputformat.split.minsize 属性来改变映射器的数量。

关于 Hive 中 reducer 的数量，默认情况下使用 hive.exec.reducers.bytes.per.reducer 属性计算，其默认值为 1GB。

您将可以通过修改以上属性来配置减速器的数量。您仍然可以使用 mapred.reduce.tasks 属性.

为作业设置固定数量的减速器

希望这对您有所帮助。