我怎样才能遍历这个字典而不是对键进行硬编码

Question

到目前为止，我有这段代码（来自cs50/pset6/DNA）：

import csv

data_dict = {}
with open(argv[1]) as data_file:
    reader = csv.DictReader(data_file)
    for record in reader:
        # `record` is a dictionary of column-name & value
        name = record["name"]
        data = {
            "AGATC": record["AGATC"],
            "AATG": record["AATG"],
            "TATC": record["TATC"],
        }

        data_dict[name] = data

print(data_dict)

输出

{'Alice': {'AATG': '8', 'AGATC': '2', 'TATC': '3'},
     'Bob': {'AATG': '1', 'AGATC': '4', 'TATC': '5'},
 'Charlie': {'AATG': '2', 'AGATC': '3', 'TATC': '5'}}

这是 csv 文件：

name,AGATC,AATG,TATC
Alice,2,8,3
Bob,4,1,5
Charlie,3,2,5

但我的目标是实现完全相同的目标，但不是对键 AATG 等进行硬编码，而且因为我将使用包含更多值的更大的数据库，我想要能够遍历数据，而不是这样做：

data = {
            "AGATC": record["AGATC"],
            "AATG": record["AATG"],
            "TATC": record["TATC"],
        }

你能帮帮我吗？谢谢

Answer 1

您可以像这样简单地遍历 python 中的字典：

for key in dictionary:
  print(key, dictionary[key])

Answer 2

您也可以尝试使用 pandas。

将您的示例数据用作 .csv 文件：

pandas.read_csv('example.csv', index_col = 0).transpose().to_dict()

输出：

{'Alice': {'AGATC': 2, 'AATG': 8, 'TATC': 3},
 'Bob': {'AGATC': 4, 'AATG': 1, 'TATC': 5},
 'Charlie': {'AGATC': 3, 'AATG': 2, 'TATC': 5}}

index_col = 0 因为你有我设置为索引的名称列（以便以后成为字典中的顶级键）

.transpose() 所以顶级键是名称而不是功能（AGATC、AATG 等）

.to_dict() 将 pandas.DataFrame 转换为 python 字典

Answer 3

你可以简单地使用 pandas:

import csv
import pandas as pd

data_dict = {}
with open(argv[1]) as data_file:
    reader = csv.DictReader(data_file)
    df = pd.DataFrame(reader)
    df = df.set_index('name') # set name column as index
    data_dict = df.transpose().to_dict() # transpose to make dict with indexes
   
print(data_dict)

Answer 4

您使用 csv.DictReader 的方法是正确的。

import csv
from pprint import pprint

data_dict = {}

with open('fasta.csv', 'r') as f:
    reader = csv.DictReader(f)

    for record in reader:
        name = record.pop('name')
        data_dict[name] = record

pprint(data_dict)

版画

{'Alice': {'AATG': '8', 'AGATC': '2', 'TATC': '3'},
 'Bob': {'AATG': '1', 'AGATC': '4', 'TATC': '5'},
 'Charlie': {'AATG': '2', 'AGATC': '3', 'TATC': '5'}}

我怎样才能遍历这个字典而不是对键进行硬编码

How can I loop through this dictionary instead of hardcoding the keys

python

csv

dictionary

nested

cs50