bash - 使用 wc 计算文本文件中的多个字符 -
问题描述
我在下面有一个给定的文件文本:
aatgcacatgttgcatatcaagtggatatgggtggtggaaaactgtataatggccaagcc
aatttccgtttattatttgacccaactcaagcagtagctattccgagtagcgaatttcca
我正在尝试找到一个grep
字数统计wc
命令,该命令允许我找到并计算文件文本中的所有“a”和“g”。
我以前尝试过使用
egrep 'a|g' outputSequence.txt|wc -c
我试过使用:
grep -o 'a|g' outputSequence.txt|wc -l
编码:
grep -o 'a|g' outputSequence.txt|wc -l
输出 0。
我找不到可以让我在每行中同时对 a 和 g 进行 grep 和字数计数的资源。
解决方案
您的方法还可以,需要改进:
grep -o 'a|g'
搜索a
后跟|
后跟g
. 您需要逃脱|
以使其成为 OR。将在输出中grep -o 'a\|g'
搜索a
字母 OR 字母g
。它将输出由换行符分隔的字符a
。g
- 然后用于
sort | uniq -c
对字母进行排序并打印计数。 - 不要使用
egrep
,它已被弃用。改为使用grep -E
。
命令:
grep -o 'a\|g' outputSequence.txt | sort | uniq -c
应该输出:
36 a
26 g
a
但也许你想要s 和s的计数之和g
,那么你已经足够接近了:
grep -o 'a\|g' outputSequence.txt | wc -l
推荐阅读
- javascript - 当我的汉堡菜单打开时如何禁用滚动?
- c# - 仅当它为值类型属性指定值时才反序列化 JSON
- reactjs - 从子路径创建 React App,以 HTML 形式返回脚本
- rust - try_into() 在 u8 上使用时会中断
- amazon-web-services - ElasticBeanStalk 环境运行缓慢 - 降级
- typescript - 将泛型类型传递给内部函数
- javascript - javascript函数来确定一个数组是否包含一个值
- python - VS 代码 - urllib.error.URLError:
- json - 在 bat 文件中解析 JSON
- javascript - 如何在javascript代码中访问从服务器发送的数据(使用flask)?