python-3.x - Python:从字符串中获取字数频率?
问题描述
科罗拉多!
如何从 Python 中的字符串中获取字数频率?
应用的步骤 -- (1) 运行 getText() 函数从 Word 文档中提取文本。Docx (2) 输出为 500 个单词作为字符串
getText() function code
def getText(filename):
doc = docx.Document(filename)
fullText = []
for para in doc.paragraphs:
fullText.append(para.text)
return '\n'.join(fullText)
样本数据 业务技能 分析:数据分析、数据库、仪表板、报告、定量数学、可视化 薪酬:佣金、咨询、数据集成、薪酬分析、销售佣金 应用行业:工程、金融服务、医疗保健、保险、房地产和技术
技术技能 软件:ADP、HR Cube、渠道管理、Jama 需求管理 PayScale、PeopleSoft、Salary CompAnalyst、Salesforce、SAP 商业智能:Power Business Intelligence (Power BI)、Power Query、Tableau 编程:Python、SQL、VBA、XML
数据库:Access、MySQL、Oracle、Toad 工具:Apple、Google、Microsoft Office、Lucidchart、Slack、Smartsheet、SFTP 和 Visio
工作经验 开发薪资数据库、数据映射、数据挖掘、设计分析、报告和仪表板。基于专有标准搜索工作和市场薪水的优化数据库算法。沟通的销售激励计划年度变更、新注册、促销和转移。执行基本工资和浮动工资的工资计划、工资市场定价、工资咨询和总奖励报表。使用 Excel Vlookups、数据透视表、Power Pivot 和 Visual Basic 协调财务数据以进行分析。规范化 HRIS 数据库,以使用 Access、HR Cube 和 SQL 改进数据仓库。为薪酬趋势、预测和合规定期报告提取数据。
非常感谢您的帮助和分享知识。-myrna
解决方案
有许多很好的教程涵盖了这一点。我喜欢这个,因为它提供了一些可以帮助解释正在发生的事情的视觉效果。
所述教程中的代码(为方便起见,在此处发布):
def word_count(str):
counts = dict()
words = str.split()
for word in words:
if word in counts:
counts[word] += 1
else:
counts[word] = 1
return counts
print( word_count('the quick brown fox jumps over the lazy dog.'))
推荐阅读
- c# - 可以在代码中简化 Path.Data 创建吗?
- node.js - Express 及其 json 解析器出现“结束后写入”错误
- azure - Azure 认知服务:缺少自定义视觉性能统计信息在哪里?
- animation - Instagram 在 nativescript 中的应用评论框动画
- vbscript - 循环遍历 .CSV 文件时的总计
- android - Nativescript 5.4.0 构建失败并显示“找不到 sbg-bindings.txt”
- amazon-web-services - 如何通过节点 js 中的 AWS API Gateway 和 AWS lambda 获取我的谷歌智能家居操作的令牌 ID?
- wpf - 为什么 DragDrop.DoDragDrop 挤压 DataGridHyperlinkColumn 单击事件?
- php - 如何将命名的 Doctrine Entity Manager 获取到存储库?
- javascript - 如何为打字稿编写的模块编写插件加载器