将文件转换为字典列表
Convert a file to a list of dictionaries
我的文件格式如下:
MN_N3 net48 sout VSS VBN lvtnfet l=0.116u nf=1 M=1 nfin=4
MN_N10 net082 net48 VSS VBN lvtnfet l=0.116u nf=1 M=1 nfin=4
MN_N11 nclk_net CK VSS VBN lvtnfet l=0.068u nf=1 M=1 nfin=4
MN_N9 SO SE net082 VBN lvtnfet l=0.116u nf=1 M=1 nfin=4
我想把它读成字典列表,这样每一行就形成一个这样的字典
{'name': 'MN_N3' , 'source': 'net48' , 'gate': 'sout', 'Drain':'VSS'}
我试过这个:
d{'name':line.split(' ')[0], 'source':line.split(' ')[1], 'gate':line.split(' ')[2], 'drain':line.split(' ')[3]}
哪个给了我:
File "task2.py", line 24
d{'name':line.split(' ')[0], 'source':line.split(' ')[1], 'gate':line.split(' ')[2], 'drain':line.split(' ')[3]}
^
SyntaxError: invalid syntax
我该怎么做/修复这个错误?
你不能那样编词典。你必须使用:
d = {'name': line.split(' ')[0], ...}
不过,更好的方法是使用 for 循环。
for line in input.split('\n'): # \n is the new line character
for item in line.split(' '):
print(item)
这会为您提供每个项目,您可以通过在内部 for 循环中使用计数器(或 enumerate function)将每个项目添加到字典中。然后您可以创建一个名称列表并通过计数器的索引访问单词。
f = open('tp.txt','r').readlines()
for line in f:
print({'name':line.split(' ')[0], 'source':line.split(' ')[1], 'gate':line.split(' ')[2], 'drain':line.split(' ')[3]})
这将打印字典。如果要保存,可以将打印更改为作业。
最省时的解决方案是使用Pandas。它会让你免于分裂字符串、形成字典,甚至有循环的痛苦:
import pandas as pd
names = ['name' , 'source', 'gate', 'Drain']
pd.read_csv("your_file.dat", sep='\s+', header=None,
usecols=range(len(names)), names=names).to_dict(orient='records')
#[{'name': 'MN_N3', 'source': 'net48', 'gate': 'sout', 'Drain': 'VSS'},
# {'name': 'MN_N10', 'source': 'net082', 'gate': 'net48', 'Drain': 'VSS'},
# {'name': 'MN_N11', 'source': 'nclk_net', 'gate': 'CK', 'Drain': 'VSS'},
# {'name': 'MN_N9', 'source': 'SO', 'gate': 'SE', 'Drain': 'net082'}]
这是一种更易于管理的方法。当您的需求发生变化时更新此代码会容易得多,例如将 lvtnfet
也添加到字典中。
# Or file.readlines()
ls = ['MN_N3 net48 sout VSS VBN lvtnfet l=0.116u nf=1 M=1 nfin=4',
'MN_N10 net082 net48 VSS VBN lvtnfet l=0.116u nf=1 M=1 nfin=4',
'MN_N11 nclk_net CK VSS VBN lvtnfet l=0.068u nf=1 M=1 nfin=4',
'MN_N9 SO SE net082 VBN lvtnfet l=0.116u nf=1 M=1 nfin=4']
word_list = [[word for word in item.split(' ')[:4]] for item in ls ] # Only first 4 elements from the list
final_dict = {index:{'name': ls[0], 'source':ls[1], 'gate':ls[2], 'Drain': ls[3]} for index, ls in enumerate(word_list)}
print(final_dict)
输出:
{0: {'Drain': 'VSS', 'gate': 'sout', 'name': 'MN_N3', 'source': 'net48'},
1: {'Drain': 'VSS', 'gate': 'net48', 'name': 'MN_N10', 'source': 'net082'},
2: {'Drain': 'VSS', 'gate': 'CK', 'name': 'MN_N11', 'source': 'nclk_net'},
3: {'Drain': 'net082', 'gate': 'SE', 'name': 'MN_N9', 'source': 'SO'}}
下面是final_dict
听写理解的扩展形式,供参考。
final_dict = {}
for index, ls in enumerate(word_list):
final_dict.update({index:{'name': ls[0], 'source':ls[1], 'gate':ls[2], 'Drain': ls[3]}})
print(final_dict)
我的文件格式如下:
MN_N3 net48 sout VSS VBN lvtnfet l=0.116u nf=1 M=1 nfin=4
MN_N10 net082 net48 VSS VBN lvtnfet l=0.116u nf=1 M=1 nfin=4
MN_N11 nclk_net CK VSS VBN lvtnfet l=0.068u nf=1 M=1 nfin=4
MN_N9 SO SE net082 VBN lvtnfet l=0.116u nf=1 M=1 nfin=4
我想把它读成字典列表,这样每一行就形成一个这样的字典
{'name': 'MN_N3' , 'source': 'net48' , 'gate': 'sout', 'Drain':'VSS'}
我试过这个:
d{'name':line.split(' ')[0], 'source':line.split(' ')[1], 'gate':line.split(' ')[2], 'drain':line.split(' ')[3]}
哪个给了我:
File "task2.py", line 24
d{'name':line.split(' ')[0], 'source':line.split(' ')[1], 'gate':line.split(' ')[2], 'drain':line.split(' ')[3]}
^
SyntaxError: invalid syntax
我该怎么做/修复这个错误?
你不能那样编词典。你必须使用:
d = {'name': line.split(' ')[0], ...}
不过,更好的方法是使用 for 循环。
for line in input.split('\n'): # \n is the new line character
for item in line.split(' '):
print(item)
这会为您提供每个项目,您可以通过在内部 for 循环中使用计数器(或 enumerate function)将每个项目添加到字典中。然后您可以创建一个名称列表并通过计数器的索引访问单词。
f = open('tp.txt','r').readlines()
for line in f:
print({'name':line.split(' ')[0], 'source':line.split(' ')[1], 'gate':line.split(' ')[2], 'drain':line.split(' ')[3]})
这将打印字典。如果要保存,可以将打印更改为作业。
最省时的解决方案是使用Pandas。它会让你免于分裂字符串、形成字典,甚至有循环的痛苦:
import pandas as pd
names = ['name' , 'source', 'gate', 'Drain']
pd.read_csv("your_file.dat", sep='\s+', header=None,
usecols=range(len(names)), names=names).to_dict(orient='records')
#[{'name': 'MN_N3', 'source': 'net48', 'gate': 'sout', 'Drain': 'VSS'},
# {'name': 'MN_N10', 'source': 'net082', 'gate': 'net48', 'Drain': 'VSS'},
# {'name': 'MN_N11', 'source': 'nclk_net', 'gate': 'CK', 'Drain': 'VSS'},
# {'name': 'MN_N9', 'source': 'SO', 'gate': 'SE', 'Drain': 'net082'}]
这是一种更易于管理的方法。当您的需求发生变化时更新此代码会容易得多,例如将 lvtnfet
也添加到字典中。
# Or file.readlines()
ls = ['MN_N3 net48 sout VSS VBN lvtnfet l=0.116u nf=1 M=1 nfin=4',
'MN_N10 net082 net48 VSS VBN lvtnfet l=0.116u nf=1 M=1 nfin=4',
'MN_N11 nclk_net CK VSS VBN lvtnfet l=0.068u nf=1 M=1 nfin=4',
'MN_N9 SO SE net082 VBN lvtnfet l=0.116u nf=1 M=1 nfin=4']
word_list = [[word for word in item.split(' ')[:4]] for item in ls ] # Only first 4 elements from the list
final_dict = {index:{'name': ls[0], 'source':ls[1], 'gate':ls[2], 'Drain': ls[3]} for index, ls in enumerate(word_list)}
print(final_dict)
输出:
{0: {'Drain': 'VSS', 'gate': 'sout', 'name': 'MN_N3', 'source': 'net48'},
1: {'Drain': 'VSS', 'gate': 'net48', 'name': 'MN_N10', 'source': 'net082'},
2: {'Drain': 'VSS', 'gate': 'CK', 'name': 'MN_N11', 'source': 'nclk_net'},
3: {'Drain': 'net082', 'gate': 'SE', 'name': 'MN_N9', 'source': 'SO'}}
下面是final_dict
听写理解的扩展形式,供参考。
final_dict = {}
for index, ls in enumerate(word_list):
final_dict.update({index:{'name': ls[0], 'source':ls[1], 'gate':ls[2], 'Drain': ls[3]}})
print(final_dict)