配置单元聚合查询从缓存中获取错误值

hive aggregate query takes wrong value from cache

我正在 运行 蜂巢会话聚合查询。

hive>select count(1) from table_name;

第一次运行mapreduce程序和returns结果。但是对于当天晚些时候的连续运行,它 returns 来自缓存的相同计数(尽管 table 每小时更新一次)。这是错误的计数。

尝试过:-

set hive.metastore.aggregate.stats.cache.enabled=false

hive.cache.expr.evaluation=false

set hive.fetch.task.conversion=none

但运气不好。使用 Hive 1.2.1.2.3.4.29-5 配置单元版本。谢谢

禁止使用统计数据进行查询计算:

set hive.compute.query.using.stats=false;

另请参阅此答案了解更多详情: