如何使用 Pandas DataFrame 标记具有 2 列的 CSV 文件中的单列

Question

我正在尝试使用贝叶斯分类器执行情绪分析，并且我有一个 CSV 文件，其中包含具有以下结构的行：

Column 1: Either 1 or 0 
Column 2: String 

Example: 1 | This is a great movie

我在读取 CSV 文件 (read_csv) 时使用 Pandas。

从 CSV 文件中读取每一行后具有以下结构：

1;This is a great movie
0;This is a bad movie

我想标记第 2 列中的每个字符串。但是，我还没有成功。我该如何解决这个问题？

Answer 1

假设 df 看起来像（只需将列名从 0 替换为 column_name，您将其作为 header:

                        0
0  1;This is a great movie
1    0;This is a bad movie

pd.DataFrame(df[0].apply(lambda x: x.split(";")).values.tolist(),columns=['A','B'])
   A                      B
0  1  This is a great movie
1  0    This is a bad movie

如何使用 Pandas DataFrame 标记具有 2 列的 CSV 文件中的单列

How to tokenize a single column in a CSV file with 2 columns using Pandas DataFrame

csv

tokenize

dataframe

pandas