将文件转换为字典列表

Convert a file to a list of dictionaries

我的文件格式如下:

MN_N3 net48 sout VSS VBN lvtnfet l=0.116u nf=1 M=1 nfin=4 
MN_N10 net082 net48 VSS VBN lvtnfet l=0.116u nf=1 M=1 nfin=4 
MN_N11 nclk_net CK VSS VBN lvtnfet l=0.068u nf=1 M=1 nfin=4 
MN_N9 SO SE net082 VBN lvtnfet l=0.116u nf=1 M=1 nfin=4 

我想把它读成字典列表,这样每一行就形成一个这样的字典

{'name': 'MN_N3' , 'source': 'net48' , 'gate': 'sout', 'Drain':'VSS'}

我试过这个:

d{'name':line.split(' ')[0], 'source':line.split(' ')[1], 'gate':line.split(' ')[2], 'drain':line.split(' ')[3]}

哪个给了我:

File "task2.py", line 24
  d{'name':line.split(' ')[0], 'source':line.split(' ')[1], 'gate':line.split(' ')[2], 'drain':line.split(' ')[3]}
   ^
SyntaxError: invalid syntax

我该怎么做/修复这个错误?

你不能那样编词典。你必须使用:

d = {'name': line.split(' ')[0], ...}

不过,更好的方法是使用 for 循环。

for line in input.split('\n'): # \n is the new line character
    for item in line.split(' '):
        print(item)

这会为您提供每个项目,您可以通过在内部 for 循环中使用计数器(或 enumerate function)将每个项目添加到字典中。然后您可以创建一个名称列表并通过计数器的索引访问单词。

f = open('tp.txt','r').readlines()
for line in f:
    print({'name':line.split(' ')[0], 'source':line.split(' ')[1], 'gate':line.split(' ')[2], 'drain':line.split(' ')[3]})

这将打印字典。如果要保存,可以将打印更改为作业。

最省时的解决方案是使用Pandas。它会让你免于分裂字符串、形成字典,甚至有循环的痛苦:

import pandas as pd
names = ['name' , 'source', 'gate', 'Drain']
pd.read_csv("your_file.dat", sep='\s+', header=None,
            usecols=range(len(names)), names=names).to_dict(orient='records')
#[{'name': 'MN_N3', 'source': 'net48', 'gate': 'sout', 'Drain': 'VSS'},
# {'name': 'MN_N10', 'source': 'net082', 'gate': 'net48', 'Drain': 'VSS'}, 
# {'name': 'MN_N11', 'source': 'nclk_net', 'gate': 'CK', 'Drain': 'VSS'},
# {'name': 'MN_N9', 'source': 'SO', 'gate': 'SE', 'Drain': 'net082'}]

这是一种更易于管理的方法。当您的需求发生变化时更新此代码会容易得多,例如将 lvtnfet 也添加到字典中。

# Or file.readlines()
ls = ['MN_N3 net48 sout VSS VBN lvtnfet l=0.116u nf=1 M=1 nfin=4',
'MN_N10 net082 net48 VSS VBN lvtnfet l=0.116u nf=1 M=1 nfin=4',
'MN_N11 nclk_net CK VSS VBN lvtnfet l=0.068u nf=1 M=1 nfin=4',
'MN_N9 SO SE net082 VBN lvtnfet l=0.116u nf=1 M=1 nfin=4']


word_list = [[word for word in item.split(' ')[:4]] for item in ls ] # Only first 4 elements from the list

final_dict = {index:{'name': ls[0], 'source':ls[1], 'gate':ls[2], 'Drain': ls[3]} for index, ls in enumerate(word_list)}

print(final_dict)

输出:

 {0: {'Drain': 'VSS', 'gate': 'sout', 'name': 'MN_N3', 'source': 'net48'},
 1: {'Drain': 'VSS', 'gate': 'net48', 'name': 'MN_N10', 'source': 'net082'},
 2: {'Drain': 'VSS', 'gate': 'CK', 'name': 'MN_N11', 'source': 'nclk_net'},
 3: {'Drain': 'net082', 'gate': 'SE', 'name': 'MN_N9', 'source': 'SO'}}

下面是final_dict听写理解的扩展形式,供参考。

final_dict = {}
for index, ls in enumerate(word_list):
    final_dict.update({index:{'name': ls[0], 'source':ls[1], 'gate':ls[2], 'Drain': ls[3]}})
print(final_dict)