如何只使用一列导入的文本文件？

Question

在我的代码中，我导入了 3 个不同的姓名和号码列表，我想获取出现次数最少的姓名。现在我得到了所有名字的列表以及它们出现的次数。但是代码还计算了我不需要的所有其他列。

如何只分析文本文件中1列的数据？

2.Only出去用出现一次的词回答，而不是多次？

import re

filelist = ['D.txt','A.txt','S.txt']
wordbank = {}
for file in filelist:
    article_one = re.findall('\w+', open(file,).read().lower())

    for word in article_one:
        word = word.lower().strip(string.punctuation)
        if word not in wordbank:
            wordbank[word] = 1
        else:
            wordbank[word] += 1

sortedwords = sorted(wordbank.items(), key=operator.itemgetter(1))

for word in sortedwords:
    print (word[1], word[0])

Answer 1

用什么分隔文本文件中的列？为了举例，假设它们是制表符分隔的列。您无需使用正则表达式，只需读取文本文件的每一行并将该行拆分为 '\t'。然后只使用第一列，取包含分割线的列表的索引零。

您使用词库所做的应该足以找到只出现一次的词。您所要做的就是检查每个单词的计数以确保它不大于 1。例如：

filelist = ['D.txt','A.txt','S.txt']
wordbank = {}
for file in filelist:
    f = open(file, 'r')
    lines = f.readlines()
    for l in lines:
        line = l.split('\t')
        word = line[0]

        if word not in wordbank:
            wordbank[word] = 1
        else:
            wordbank[word] += 1
    f.close()

# Gather unique words
unique_words = []
for word in wordbank.keys():
    if wordbank[word] == 1:
        unique_words.append(word)

如何只使用一列导入的文本文件？

How do I only use one column of imported text file?

python

text-files

multiple-columns

python-3.x