查找文件夹中重复次数最多的单词
Find the most repeated word in a folder
linux 中有没有一种方法可以找到当前文件夹和子文件夹中文件中重复次数最多的单词。
我需要它来找到我项目中最常用的 c++ classes。
输出可能是这样的:
class alpha : 157,
class beta : 98,
class gamma : 13,
...
表示 157 次引用 class alpha 等...
可以使用 Linux 命令(也许是 grep)来完成吗?或者我应该为此使用工具吗?
要查找文件中最常用的词,您可以使用
grep -hoE "\w+" * | sort | uniq -c | sort -g
这会计算您问题所要求的所有字数。
grep -hoE "\w{7,}" * | sort | uniq -c | sort -g
计算长度超过六个字符的单词。
linux 中有没有一种方法可以找到当前文件夹和子文件夹中文件中重复次数最多的单词。 我需要它来找到我项目中最常用的 c++ classes。 输出可能是这样的:
class alpha : 157,
class beta : 98,
class gamma : 13,
...
表示 157 次引用 class alpha 等...
可以使用 Linux 命令(也许是 grep)来完成吗?或者我应该为此使用工具吗?
要查找文件中最常用的词,您可以使用
grep -hoE "\w+" * | sort | uniq -c | sort -g
这会计算您问题所要求的所有字数。
grep -hoE "\w{7,}" * | sort | uniq -c | sort -g
计算长度超过六个字符的单词。