我怎样才能遍历这个字典而不是对键进行硬编码
How can I loop through this dictionary instead of hardcoding the keys
到目前为止,我有这段代码(来自cs50/pset6/DNA):
import csv
data_dict = {}
with open(argv[1]) as data_file:
reader = csv.DictReader(data_file)
for record in reader:
# `record` is a dictionary of column-name & value
name = record["name"]
data = {
"AGATC": record["AGATC"],
"AATG": record["AATG"],
"TATC": record["TATC"],
}
data_dict[name] = data
print(data_dict)
输出
{'Alice': {'AATG': '8', 'AGATC': '2', 'TATC': '3'},
'Bob': {'AATG': '1', 'AGATC': '4', 'TATC': '5'},
'Charlie': {'AATG': '2', 'AGATC': '3', 'TATC': '5'}}
这是 csv 文件:
name,AGATC,AATG,TATC
Alice,2,8,3
Bob,4,1,5
Charlie,3,2,5
但我的目标是实现完全相同的目标,但不是对键 AATG
等进行硬编码,而且因为我将使用包含更多值的更大的数据库,我想要能够遍历数据,而不是这样做:
data = {
"AGATC": record["AGATC"],
"AATG": record["AATG"],
"TATC": record["TATC"],
}
你能帮帮我吗?谢谢
您可以像这样简单地遍历 python 中的字典:
for key in dictionary:
print(key, dictionary[key])
您也可以尝试使用 pandas。
将您的示例数据用作 .csv 文件:
pandas.read_csv('example.csv', index_col = 0).transpose().to_dict()
输出:
{'Alice': {'AGATC': 2, 'AATG': 8, 'TATC': 3},
'Bob': {'AGATC': 4, 'AATG': 1, 'TATC': 5},
'Charlie': {'AGATC': 3, 'AATG': 2, 'TATC': 5}}
index_col = 0
因为你有我设置为索引的名称列(以便以后成为字典中的顶级键)
.transpose()
所以顶级键是名称而不是功能(AGATC、AATG 等)
.to_dict()
将 pandas.DataFrame 转换为 python 字典
你可以简单地使用 pandas
:
import csv
import pandas as pd
data_dict = {}
with open(argv[1]) as data_file:
reader = csv.DictReader(data_file)
df = pd.DataFrame(reader)
df = df.set_index('name') # set name column as index
data_dict = df.transpose().to_dict() # transpose to make dict with indexes
print(data_dict)
您使用 csv.DictReader 的方法是正确的。
import csv
from pprint import pprint
data_dict = {}
with open('fasta.csv', 'r') as f:
reader = csv.DictReader(f)
for record in reader:
name = record.pop('name')
data_dict[name] = record
pprint(data_dict)
版画
{'Alice': {'AATG': '8', 'AGATC': '2', 'TATC': '3'},
'Bob': {'AATG': '1', 'AGATC': '4', 'TATC': '5'},
'Charlie': {'AATG': '2', 'AGATC': '3', 'TATC': '5'}}
到目前为止,我有这段代码(来自cs50/pset6/DNA):
import csv
data_dict = {}
with open(argv[1]) as data_file:
reader = csv.DictReader(data_file)
for record in reader:
# `record` is a dictionary of column-name & value
name = record["name"]
data = {
"AGATC": record["AGATC"],
"AATG": record["AATG"],
"TATC": record["TATC"],
}
data_dict[name] = data
print(data_dict)
输出
{'Alice': {'AATG': '8', 'AGATC': '2', 'TATC': '3'},
'Bob': {'AATG': '1', 'AGATC': '4', 'TATC': '5'},
'Charlie': {'AATG': '2', 'AGATC': '3', 'TATC': '5'}}
这是 csv 文件:
name,AGATC,AATG,TATC
Alice,2,8,3
Bob,4,1,5
Charlie,3,2,5
但我的目标是实现完全相同的目标,但不是对键 AATG
等进行硬编码,而且因为我将使用包含更多值的更大的数据库,我想要能够遍历数据,而不是这样做:
data = {
"AGATC": record["AGATC"],
"AATG": record["AATG"],
"TATC": record["TATC"],
}
你能帮帮我吗?谢谢
您可以像这样简单地遍历 python 中的字典:
for key in dictionary:
print(key, dictionary[key])
您也可以尝试使用 pandas。
将您的示例数据用作 .csv 文件:
pandas.read_csv('example.csv', index_col = 0).transpose().to_dict()
输出:
{'Alice': {'AGATC': 2, 'AATG': 8, 'TATC': 3},
'Bob': {'AGATC': 4, 'AATG': 1, 'TATC': 5},
'Charlie': {'AGATC': 3, 'AATG': 2, 'TATC': 5}}
index_col = 0
因为你有我设置为索引的名称列(以便以后成为字典中的顶级键)
.transpose()
所以顶级键是名称而不是功能(AGATC、AATG 等)
.to_dict()
将 pandas.DataFrame 转换为 python 字典
你可以简单地使用 pandas
:
import csv
import pandas as pd
data_dict = {}
with open(argv[1]) as data_file:
reader = csv.DictReader(data_file)
df = pd.DataFrame(reader)
df = df.set_index('name') # set name column as index
data_dict = df.transpose().to_dict() # transpose to make dict with indexes
print(data_dict)
您使用 csv.DictReader 的方法是正确的。
import csv
from pprint import pprint
data_dict = {}
with open('fasta.csv', 'r') as f:
reader = csv.DictReader(f)
for record in reader:
name = record.pop('name')
data_dict[name] = record
pprint(data_dict)
版画
{'Alice': {'AATG': '8', 'AGATC': '2', 'TATC': '3'},
'Bob': {'AATG': '1', 'AGATC': '4', 'TATC': '5'},
'Charlie': {'AATG': '2', 'AGATC': '3', 'TATC': '5'}}