如何使用 Pandas DataFrame 标记具有 2 列的 CSV 文件中的单列
How to tokenize a single column in a CSV file with 2 columns using Pandas DataFrame
我正在尝试使用贝叶斯分类器执行情绪分析,并且我有一个 CSV 文件,其中包含具有以下结构的行:
Column 1: Either 1 or 0
Column 2: String
Example: 1 | This is a great movie
我在读取 CSV 文件 (read_csv) 时使用 Pandas。
从 CSV 文件中读取每一行后具有以下结构:
1;This is a great movie
0;This is a bad movie
我想标记第 2 列中的每个字符串。但是,我还没有成功。我该如何解决这个问题?
假设 df 看起来像(只需将列名从 0 替换为 column_name
,您将其作为 header:
0
0 1;This is a great movie
1 0;This is a bad movie
pd.DataFrame(df[0].apply(lambda x: x.split(";")).values.tolist(),columns=['A','B'])
A B
0 1 This is a great movie
1 0 This is a bad movie
我正在尝试使用贝叶斯分类器执行情绪分析,并且我有一个 CSV 文件,其中包含具有以下结构的行:
Column 1: Either 1 or 0
Column 2: String
Example: 1 | This is a great movie
我在读取 CSV 文件 (read_csv) 时使用 Pandas。
从 CSV 文件中读取每一行后具有以下结构:
1;This is a great movie
0;This is a bad movie
我想标记第 2 列中的每个字符串。但是,我还没有成功。我该如何解决这个问题?
假设 df 看起来像(只需将列名从 0 替换为 column_name
,您将其作为 header:
0
0 1;This is a great movie
1 0;This is a bad movie
pd.DataFrame(df[0].apply(lambda x: x.split(";")).values.tolist(),columns=['A','B'])
A B
0 1 This is a great movie
1 0 This is a bad movie