Python: 从字符串中获取单词计数频率?

Python: Get word count frequency from a string?

科罗拉多!

如何从 Python 中的字符串中获取单词计数频率?

应用步数 -- (1) 运行 从 Word 中提取文本的 getText() 函数 document.Docx (2) 输出是500字的字符串

getText() function code
def getText(filename):
doc = docx.Document(filename)
fullText = []
for para in doc.paragraphs:
    fullText.append(para.text)
return '\n'.join(fullText)

示例数据业务技能 分析:数据分析、数据库、仪表板、报告、定量数学、可视化 薪酬:佣金、咨询、数据集成、薪资分析、销售佣金申请 行业:工程、金融服务、医疗保健、保险、房地产和技术

技术技能 软件:ADP、HR Cube、渠道管理、Jama Requirements Management PayScale、PeopleSoft、Salary CompAnalyst、Salesforce、SAP 商业智能:Power Business Intelligence (Power BI)、Power Query、Tableau 编程:Python、SQL、VBA、XML
数据库:Access、MySQL、Oracle、Toad 工具:Apple、Google、Microsoft Office、Lucidchart、Slack、Smartsheet、SFTP 和 Visio

工作经验 开发了薪资数据库、数据映射、数据挖掘、设计分析、报告和仪表板。 用于根据专有标准搜索工作和市场薪水的优化数据库算法。 传达的销售激励计划年度变化、新注册、促销和转移。 对基本薪酬和可变薪酬、薪酬市场定价、薪酬咨询和总薪酬报表进行薪酬规划。 使用 Excel Vlookups、数据透视表、Power Pivot 和 Visual Basic 协调财务数据以供分析。 使用 Access、HR Cube 和 SQL 规范化 HRIS 数据库以改进数据仓库。 为薪酬趋势、预测和合规性定期报告提取数据。

非常感谢您的帮助和分享知识。 -麦娜

有许多涵盖此内容的优秀教程。我喜欢 this one,因为它提供了一些视觉效果,可以帮助解释正在发生的事情。

上述教程中的代码(为方便起见张贴在这里):

def word_count(str):
    counts = dict()
    words = str.split()

    for word in words:
        if word in counts:
            counts[word] += 1
        else:
            counts[word] = 1

    return counts

print( word_count('the quick brown fox jumps over the lazy dog.'))