awk - 在 Windows 中使用 awk 计算文件夹中多个文本文件中唯一单词的数量
问题描述
我在一个文件夹 (d:\text) 中有多个文件。
使用 gawk(在 Windows 中),我想生成一个单词列表及其出现次数,格式如下:
12145 22483 但是754
等等
解决方案
考虑输入:
$ ls ./in*
./in1.txt ./in2.txt
$ cat in*
What's up Buddy. How are you doin Buddy?
What's up Man. I am happy and good and awesome.
AWK 使用关联数组计算单词,将单词视为字母字符(您需要调整并为大写/小写等创建逻辑)。请注意,还为空字符串添加了计数 4:
$ gawk 'BEGIN { RS="[^A-Za-z]"; } { words[$0]++; } END { for ( i in words ) print(i " " words[i]); }' ./in*
happy 1
are 1
4
What 2
awesome 1
How 1
Buddy 2
and 2
I 1
up 2
good 1
doin 1
am 1
Man 1
you 1
s 2
推荐阅读
- javascript - js - querySelector 在伪类 ::before 中选择和编辑样式
- html - 在 org.apache.pdfbox.pdmodel.graphics.color.PDPattern.toRGB 获取 java.lang.UnsupportedOperationException
- python - 列表字典的键到行枚举、制表符分隔的 csv 文件
- jmeter - 如何计算 JMeter Webdriver 采样器中两个不同操作的时间
- ruby-on-rails - 为什么 gem 在用户登录后设计重定向到注册路径?
- javascript - 在 AngularJS 表格组件中计算值
- javascript - 浏览器zendframework找不到javascript脚本源
- javascript - 在javascript中更改按钮的背景颜色不起作用
- c# - 更改 SearchView 搜索图标 Xamarin.Android
- javascript - 在 lity.js 弹出窗口上自动播放视频