有没有办法在另一列中找到一列中每个值的出现次数?
Is there a way to find the number of occurrences of each value in a column in another column?
我有两个数据框,分别称为数据集 1 和数据集 2(如下所示)。 “模式”和“SAX”列包含字符串值。
dataset1=
pattern tstamps
0 glngsyu 1610460
1 zicobgm 1610466
2 eerptow .
3 cqbsynt .
4 zvmqben .
.. ...
475 rfikekw
476 bnbzvqx
477 rsuhgax
478 ckhloio
479 lbzujtw
480 rows × 1 columns
dataset2 =
SAX timestamp
0 hssrlcu 16015
1 ktyuymp 16016
2 xncqmfr 16017
3 aanlmna 16018
4 urvahvo 16019
... ... ...
263455 jeivqzo 279470
263456 bzasxgw 279471
263457 jspqnqv 279472
263458 sxwfchj 279473
263459 gxqnhfr 279474
263460 rows × 2 columns
有没有办法检查SAX(dataset2)中pattern(dataset1)每一行的出现次数。基本上,(dataset1) 的模式列中的值存在于 (dataset2) 的 SAX 列中的次数?
基本上是这样的:
dataset1=
pattern no. of occurrences
0 glngsyu 3
1 zicobgm 0
2 eerptow 1
. . .
. . .
. . .
479 lbzujtw 2
480 rows × 2 columns
谢谢。
应该这样做
dataset2_SAX_value_counts = dataset2["SAX"].value_counts()
dataset1["no. of occurrences"] = dataset1["pattern"].apply(lambda x: dataset2_SAX_value_counts.loc[x])
我有两个数据框,分别称为数据集 1 和数据集 2(如下所示)。 “模式”和“SAX”列包含字符串值。
dataset1=
pattern tstamps
0 glngsyu 1610460
1 zicobgm 1610466
2 eerptow .
3 cqbsynt .
4 zvmqben .
.. ...
475 rfikekw
476 bnbzvqx
477 rsuhgax
478 ckhloio
479 lbzujtw
480 rows × 1 columns
dataset2 =
SAX timestamp
0 hssrlcu 16015
1 ktyuymp 16016
2 xncqmfr 16017
3 aanlmna 16018
4 urvahvo 16019
... ... ...
263455 jeivqzo 279470
263456 bzasxgw 279471
263457 jspqnqv 279472
263458 sxwfchj 279473
263459 gxqnhfr 279474
263460 rows × 2 columns
有没有办法检查SAX(dataset2)中pattern(dataset1)每一行的出现次数。基本上,(dataset1) 的模式列中的值存在于 (dataset2) 的 SAX 列中的次数?
基本上是这样的:
dataset1=
pattern no. of occurrences
0 glngsyu 3
1 zicobgm 0
2 eerptow 1
. . .
. . .
. . .
479 lbzujtw 2
480 rows × 2 columns
谢谢。
应该这样做
dataset2_SAX_value_counts = dataset2["SAX"].value_counts()
dataset1["no. of occurrences"] = dataset1["pattern"].apply(lambda x: dataset2_SAX_value_counts.loc[x])