如何获取配置单元中仅具有 NULL 值的所有列的列表?
How to get the list of all columns having NULL values only in hive?
我正在 Hive 中处理一个拥有超过 10k 行和超过 600 列的庞大数据集。
有多个行列,所有行都具有 NULL
值。
我怎样才能得到只有 NULL
值的所有列的列表?
使用 count(col)
计算某列的所有 NOT NULL
行。
包含所有 NULL
的列将具有 0
个计数:
select
count(col1) as col1_cnt,
count(col2) as col2_cnt,
...
count(colN) as colN_cnt
from table
我正在 Hive 中处理一个拥有超过 10k 行和超过 600 列的庞大数据集。
有多个行列,所有行都具有 NULL
值。
我怎样才能得到只有 NULL
值的所有列的列表?
使用 count(col)
计算某列的所有 NOT NULL
行。
包含所有 NULL
的列将具有 0
个计数:
select
count(col1) as col1_cnt,
count(col2) as col2_cnt,
...
count(colN) as colN_cnt
from table