pandas chained_assignment 警告异常处理

pandas chained_assignment warning exception handling

如果您在 python 中使用 pandas 工作,您已经知道在处理数据帧切片时的 chained_assignment 警告(如 所述)。

我找到了可以设置为

的选项 pandas.options.mode.chained_assignment

比较documentation

我包含了一个最小示例,在 try..except..else 块中触发此警告以进行异常处理。我希望仅通过设置 pandas.options.mode.chained_assignment = "raise" 触发异常,如下面的示例 3 所示。

在这个最小的示例中,行为符合预期,因此示例 2 具有 pandas.options.mode.chained_assignment = "warn" 只会导致打印警告消息,但不会引发异常。

然而,在更大的框架中,即使参数设置为 pandas.options.mode.chained_assignment = "warn",我也看到出现异常,就像在最小示例中一样(参见示例 4)

是否有任何其他 pandas 参数影响有关引发异常的警告消息的行为?


这是一个最小的代码示例,setting/printing pd.options.mode.chained_assignment 参数并显示 try..catch..except 块中的行为。

import pandas as pd

# set the chained_assignment option
pd.options.mode.chained_assignment = "raise" # raises exception in case of warning
pd.options.mode.chained_assignment = "warn"  # prints warning in case of warning, no exception is raised
pd.options.mode.chained_assignment = None    # no warning message and no exception is raised

print "pd.options.mode.chained_assignment :", pd.options.mode.chained_assignment

# create a default pandas dataframe with two columns A,B
df = pd.DataFrame({"A" : [0, 1, 2], "B" : [3, 4, 5]})

print df

# exctract a slice of the given pandas dataframe
df2 = df[df["A"] > 0]

# exception handling
try :
    # try to modify the slice, triggering the pandas warning
    df2["C"] = 2
except :
    print "EXCEPTION RAISED"
else :
    print "NO EXCEPTION"

print df2

示例 1 设置 pd.options.mode.chained_assignment = None 会导致以下输出(无警告,无异常)

pd.options.mode.chained_assignment : None
   A  B
0  0  3
1  1  4
2  2  5
NO EXCEPTION
   A  B  C
1  1  4  2
2  2  5  2

示例 2 设置 pd.options.mode.chained_assignment = "warn" 会导致以下输出(打印警告,但无异常)

pd.options.mode.chained_assignment : warn
   A  B
0  0  3
1  1  4
2  2  5
NO EXCEPTION
C:\Users\my.name\my\directory\test.py:14:SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  df2["C"] = 2
   A  B  C
1  1  4  2
2  2  5  2

示例 3 设置 pd.options.mode.chained_assignment = "raise" 会导致以下输出(引发异常)

pd.options.mode.chained_assignment : raise
A  B
0  0  3
1  1  4
2  2  5
EXCEPTION RAISED
   A  B  C
1  1  4  2
2  2  5  2

示例 4 这是我在一个更大的框架中看到的,具有完全相同的测试代码。我没有明确设置链式 pd.options.mode.chained_assignment 参数,但我看到它设置为 "warn",即使出现异常

pd.options.mode.chained_assignment warn
   A  B
0  0  3
1  1  4
2  2  5
EXCEPTION RAISED
   A  B  C
1  1  4  2
2  2  5  2

经过长时间的搜索,找到了"bad guy"。 另一位开发人员在他的模块中包含以下几行

import warnings
warnings.filterwarnings('error')

这会将警告变成异常。有关详细信息,请参阅 warnings package documentation

因此我的警告被视为例外,尽管 pandas 选项设置为 "warn"