Python

Question

我是 Python 的新手，刚刚开始掌握使用它进行大数据分析。

我想知道是否可以将查询结果转换为 Dataframe。

我的结果是基于拆分先前的字符串以获得出现次数

   database_desired = df_ddny.DatabaseDesireNextYear.apply(lambda x: pd.value_counts(str(x).split(";"))).sum(axis=0)
print(database_desired)

输出：

Microsoft SQL Server     9409.0
nan                     11632.0
MySQL                   14827.0
PostgreSQL              17023.0
MongoDB                 15221.0
Firebase                 8149.0
Redis                   11543.0
MariaDB                  5843.0
Elasticsearch            9870.0
Cassandra                4027.0
SQLite                  10422.0
dtype: float64

然后我只想拥有一个如下所示的 DataFrame：

    DatabaseName     Count
Microsoft SQL Server    9409.0
MySQL                   14827.0

等等。我曾尝试创建一个新的 DataFrame 并将结果作为新列插入，但该 DataFrame 没有我使用过的属性（我预料到了）

new_df = pd.DataFrame({'Databases Worked':[df_ddny.DatabaseDesireNextYear]})
new_df['Count'] = df_ddny.DatabaseDesireNextYear.apply(lambda x: pd.value_counts(str(x).split(";"))).sum(axis=0)
new_df.info()

我看过其他几篇文章，但无法完全根据我的情况进行配置。谢谢！

Answer 1

调用to_frame创建一个frame，可以传列名给它，最后重新设置索引，重命名索引列，重新设置后变成0

database_desired = database_desired.to_frame('Counts').reset_index().rename(columns={0:'DatabaseName'})

Python - 将查询转换为 DataFrame

Python - Convert Query to DataFrame

split

series

dataframe

pandas