有没有办法在另一列中找到一列中每个值的出现次数？

Question

我有两个数据框，分别称为数据集 1 和数据集 2（如下所示）。 “模式”和“SAX”列包含字符串值。

dataset1=
       pattern   tstamps
0    glngsyu     1610460
1    zicobgm     1610466
2    eerptow        .
3    cqbsynt        .
4    zvmqben        .
..       ...
475  rfikekw
476  bnbzvqx
477  rsuhgax
478  ckhloio
479  lbzujtw

480 rows × 1 columns

dataset2 =
    SAX     timestamp
0   hssrlcu 16015
1   ktyuymp 16016
2   xncqmfr 16017
3   aanlmna 16018
4   urvahvo 16019
... ... ...
263455  jeivqzo 279470
263456  bzasxgw 279471
263457  jspqnqv 279472
263458  sxwfchj 279473
263459  gxqnhfr 279474

263460 rows × 2 columns

有没有办法检查SAX(dataset2)中pattern(dataset1)每一行的出现次数。基本上，(dataset1) 的模式列中的值存在于 (dataset2) 的 SAX 列中的次数？

基本上是这样的：

dataset1=
       pattern  no. of occurrences
0    glngsyu          3
1    zicobgm          0
2    eerptow          1
.       .             .
.       .             .
.       .             .
479  lbzujtw          2

480 rows × 2 columns

谢谢。

Answer 1

应该这样做

dataset2_SAX_value_counts = dataset2["SAX"].value_counts()
dataset1["no. of occurrences"] = dataset1["pattern"].apply(lambda x: dataset2_SAX_value_counts.loc[x])

有没有办法在另一列中找到一列中每个值的出现次数？

Is there a way to find the number of occurrences of each value in a column in another column?

python

string

dataframe

data-science