合并这些数据框时的 Nan 值

Nan values when I merge these data frames

我想合并 pandas 中的两个数据框,但我得到的是 Nan 值。

data_orig = url
data_orig.head(3) #data frame 1

   sex  length  diameter    height      
0   M   0.455   0.365      0.095    
1   M   0.350   0.265      0.090    
2   F   0.530   0.420      0.135    


def parse_label(label):
    options = {'I': 0, 'F': 1, 'M': 2}
    return options[label]

data = pd.DataFrame()
data['sex'] = data_orig['sex'].map(parse_label)

data.head() #data frame 2

    sex
0   2
1   2
2   1
3   2

pd.merge(data, data_orig, on ='sex', how= 'left')

sex length  diameter    height  
2    NaN     NaN         NaN    
2    NaN     NaN         NaN

为什么我在合并后的数据框中得到 NaN 值??

我需要这样的数据框,我该怎么做?

  sex  length   diameter  height
    2   0.455    0.365     0.095
    2   0.350    0.265     0.090

您得到 NaN 个值,因为您的值在左侧 df 和右侧 df 中没有匹配:

In [3]:
   data

Out[3]:
   sex
0    2
1    2
2    1
In [4]:

df
Out[4]:
  sex  length  diameter  height
0   M   0.455     0.365   0.095
1   M   0.350     0.265   0.090
2   F   0.530     0.420   0.135

'M' 没有与对应的 int 值 2 匹配。 目前还不清楚你在这里试图做什么,你将你的性别特征值转换为它们相应的 int 值,然后你尝试将其合并回来,为什么不直接在 orig df:

中转换它们
In [6]:

df['sex'] = df['sex'].map(parse_label)
df
Out[6]:
   sex  length  diameter  height
0    2   0.455     0.365   0.095
1    2   0.350     0.265   0.090
2    1   0.530     0.420   0.135