首页 > 解决方案 > Python:从字符串中获取字数频率?

问题描述

科罗拉多!

如何从 Python 中的字符串中获取字数频率?

应用的步骤 -- (1) 运行 getText() 函数从 Word 文档中提取文本。Docx (2) 输出为 500 个单词作为字符串

getText() function code
def getText(filename):
doc = docx.Document(filename)
fullText = []
for para in doc.paragraphs:
    fullText.append(para.text)
return '\n'.join(fullText)

样本数据 业务技能 分析:数据分析、数据库、仪表板、报告、定量数学、可视化 薪酬:佣金、咨询、数据集成、薪酬分析、销售佣金 应用行业:工程、金融服务、医疗保健、保险、房地产和技术

技术技能 软件:ADP、HR Cube、渠道管理、Jama 需求管理 PayScale、PeopleSoft、Salary CompAnalyst、Salesforce、SAP 商业智能:Power Business Intelligence (Power BI)、Power Query、Tableau 编程:Python、SQL、VBA、XML
数据库:Access、MySQL、Oracle、Toad 工具:Apple、Google、Microsoft Office、Lucidchart、Slack、Smartsheet、SFTP 和 Visio

工作经验 开发薪资数据库、数据映射、数据挖掘、设计分析、报告和仪表板。基于专有标准搜索工作和市场薪水的优化数据库算法。沟通的销售激励计划年度变更、新注册、促销和转移。执行基本工资和浮动工资的工资计划、工资市场定价、工资咨询和总奖励报表。使用 Excel Vlookups、数据透视表、Power Pivot 和 Visual Basic 协调财务数据以进行分析。规范化 HRIS 数据库,以使用 Access、HR Cube 和 SQL 改进数据仓库。为薪酬趋势、预测和合规定期报告提取数据。

非常感谢您的帮助和分享知识。-myrna

标签: python-3.xcountfrequencyword

解决方案


有许多很好的教程涵盖了这一点。我喜欢这个,因为它提供了一些可以帮助解释正在发生的事情的视觉效果。

所述教程中的代码(为方便起见,在此处发布):

def word_count(str):
    counts = dict()
    words = str.split()

    for word in words:
        if word in counts:
            counts[word] += 1
        else:
            counts[word] = 1

    return counts

print( word_count('the quick brown fox jumps over the lazy dog.'))

推荐阅读