如何只使用一列导入的文本文件?
How do I only use one column of imported text file?
在我的代码中,我导入了 3 个不同的姓名和号码列表,我想获取出现次数最少的姓名。现在我得到了所有名字的列表以及它们出现的次数。但是代码还计算了我不需要的所有其他列。
- 如何只分析文本文件中1列的数据?
2.Only出去用出现一次的词回答,而不是多次?
import re
filelist = ['D.txt','A.txt','S.txt']
wordbank = {}
for file in filelist:
article_one = re.findall('\w+', open(file,).read().lower())
for word in article_one:
word = word.lower().strip(string.punctuation)
if word not in wordbank:
wordbank[word] = 1
else:
wordbank[word] += 1
sortedwords = sorted(wordbank.items(), key=operator.itemgetter(1))
for word in sortedwords:
print (word[1], word[0])
用什么分隔文本文件中的列?为了举例,假设它们是制表符分隔的列。您无需使用正则表达式,只需读取文本文件的每一行并将该行拆分为 '\t'
。然后只使用第一列,取包含分割线的列表的索引零。
您使用词库所做的应该足以找到只出现一次的词。您所要做的就是检查每个单词的计数以确保它不大于 1。例如:
filelist = ['D.txt','A.txt','S.txt']
wordbank = {}
for file in filelist:
f = open(file, 'r')
lines = f.readlines()
for l in lines:
line = l.split('\t')
word = line[0]
if word not in wordbank:
wordbank[word] = 1
else:
wordbank[word] += 1
f.close()
# Gather unique words
unique_words = []
for word in wordbank.keys():
if wordbank[word] == 1:
unique_words.append(word)
在我的代码中,我导入了 3 个不同的姓名和号码列表,我想获取出现次数最少的姓名。现在我得到了所有名字的列表以及它们出现的次数。但是代码还计算了我不需要的所有其他列。
- 如何只分析文本文件中1列的数据?
2.Only出去用出现一次的词回答,而不是多次?
import re
filelist = ['D.txt','A.txt','S.txt']
wordbank = {}
for file in filelist:
article_one = re.findall('\w+', open(file,).read().lower())
for word in article_one:
word = word.lower().strip(string.punctuation)
if word not in wordbank:
wordbank[word] = 1
else:
wordbank[word] += 1
sortedwords = sorted(wordbank.items(), key=operator.itemgetter(1))
for word in sortedwords:
print (word[1], word[0])
用什么分隔文本文件中的列?为了举例,假设它们是制表符分隔的列。您无需使用正则表达式,只需读取文本文件的每一行并将该行拆分为 '\t'
。然后只使用第一列,取包含分割线的列表的索引零。
您使用词库所做的应该足以找到只出现一次的词。您所要做的就是检查每个单词的计数以确保它不大于 1。例如:
filelist = ['D.txt','A.txt','S.txt']
wordbank = {}
for file in filelist:
f = open(file, 'r')
lines = f.readlines()
for l in lines:
line = l.split('\t')
word = line[0]
if word not in wordbank:
wordbank[word] = 1
else:
wordbank[word] += 1
f.close()
# Gather unique words
unique_words = []
for word in wordbank.keys():
if wordbank[word] == 1:
unique_words.append(word)