Python - 将查询转换为 DataFrame
Python - Convert Query to DataFrame
我是 Python 的新手,刚刚开始掌握使用它进行大数据分析。
我想知道是否可以将查询结果转换为 Dataframe。
我的结果是基于拆分先前的字符串以获得出现次数
database_desired = df_ddny.DatabaseDesireNextYear.apply(lambda x: pd.value_counts(str(x).split(";"))).sum(axis=0)
print(database_desired)
输出:
Microsoft SQL Server 9409.0
nan 11632.0
MySQL 14827.0
PostgreSQL 17023.0
MongoDB 15221.0
Firebase 8149.0
Redis 11543.0
MariaDB 5843.0
Elasticsearch 9870.0
Cassandra 4027.0
SQLite 10422.0
dtype: float64
然后我只想拥有一个如下所示的 DataFrame:
DatabaseName Count
Microsoft SQL Server 9409.0
MySQL 14827.0
等等。
我曾尝试创建一个新的 DataFrame 并将结果作为新列插入,但该 DataFrame 没有我使用过的属性(我预料到了)
new_df = pd.DataFrame({'Databases Worked':[df_ddny.DatabaseDesireNextYear]})
new_df['Count'] = df_ddny.DatabaseDesireNextYear.apply(lambda x: pd.value_counts(str(x).split(";"))).sum(axis=0)
new_df.info()
我看过其他几篇文章,但无法完全根据我的情况进行配置。
谢谢!
调用to_frame
创建一个frame,可以传列名给它,最后重新设置索引,重命名索引列,重新设置后变成0
database_desired = database_desired.to_frame('Counts').reset_index().rename(columns={0:'DatabaseName'})
我是 Python 的新手,刚刚开始掌握使用它进行大数据分析。
我想知道是否可以将查询结果转换为 Dataframe。
我的结果是基于拆分先前的字符串以获得出现次数
database_desired = df_ddny.DatabaseDesireNextYear.apply(lambda x: pd.value_counts(str(x).split(";"))).sum(axis=0)
print(database_desired)
输出:
Microsoft SQL Server 9409.0
nan 11632.0
MySQL 14827.0
PostgreSQL 17023.0
MongoDB 15221.0
Firebase 8149.0
Redis 11543.0
MariaDB 5843.0
Elasticsearch 9870.0
Cassandra 4027.0
SQLite 10422.0
dtype: float64
然后我只想拥有一个如下所示的 DataFrame:
DatabaseName Count
Microsoft SQL Server 9409.0
MySQL 14827.0
等等。 我曾尝试创建一个新的 DataFrame 并将结果作为新列插入,但该 DataFrame 没有我使用过的属性(我预料到了)
new_df = pd.DataFrame({'Databases Worked':[df_ddny.DatabaseDesireNextYear]})
new_df['Count'] = df_ddny.DatabaseDesireNextYear.apply(lambda x: pd.value_counts(str(x).split(";"))).sum(axis=0)
new_df.info()
我看过其他几篇文章,但无法完全根据我的情况进行配置。 谢谢!
调用to_frame
创建一个frame,可以传列名给它,最后重新设置索引,重命名索引列,重新设置后变成0
database_desired = database_desired.to_frame('Counts').reset_index().rename(columns={0:'DatabaseName'})