如何只使用一列导入的文本文件?

How do I only use one column of imported text file?

在我的代码中,我导入了 3 个不同的姓名和号码列表,我想获取出现次数最少的姓名。现在我得到了所有名字的列表以及它们出现的次数。但是代码还计算了我不需要的所有其他列。

  1. 如何只分析文本文件中1列的数据?

2.Only出去用出现一次的词回答,而不是多次?

import re

filelist = ['D.txt','A.txt','S.txt']
wordbank = {}
for file in filelist:
    article_one = re.findall('\w+', open(file,).read().lower())

    for word in article_one:
        word = word.lower().strip(string.punctuation)
        if word not in wordbank:
            wordbank[word] = 1
        else:
            wordbank[word] += 1

sortedwords = sorted(wordbank.items(), key=operator.itemgetter(1))

for word in sortedwords:
    print (word[1], word[0])

用什么分隔文本文件中的列?为了举例,假设它们是制表符分隔的列。您无需使用正则表达式,只需读取文本文件的每一行并将该行拆分为 '\t'。然后只使用第一列,取包含分割线的列表的索引零。

您使用词库所做的应该足以找到只出现一次的词。您所要做的就是检查每个单词的计数以确保它不大于 1。例如:

filelist = ['D.txt','A.txt','S.txt']
wordbank = {}
for file in filelist:
    f = open(file, 'r')
    lines = f.readlines()
    for l in lines:
        line = l.split('\t')
        word = line[0]

        if word not in wordbank:
            wordbank[word] = 1
        else:
            wordbank[word] += 1
    f.close()

# Gather unique words
unique_words = []
for word in wordbank.keys():
    if wordbank[word] == 1:
        unique_words.append(word)