如何确定哪个字符在 php 中分布最均匀

How to determine which character is most evenly distributed in php

我想弄清楚哪个字符在文件中分布最均匀。因此,对于我正在分析的每个字符,我都有一个如下所示的数组...

[
    [10.5, 0, 0, 25.1, 0, 10.0, 0, 12.5, 12.5, 0],
    [2.66, 2.33, 0, 0, 0, 10.0, 0, 10.0, 12.5, 0.5],
    ... and so on ...
]

每一行代表一行被切成十分之一的文本。每个值代表相关字符所占部分的百分比

到现在为止?现在我想弄清楚如何提出一个指标来比较这些字符的分布。比如,使用这个,哪个字符在每一行中的分布最均匀?每个角色我都有一个这样的 table。如果我可以使用这个 table 为每个字符得出一个指标,那么我可以简单地比较该指标以确定分布最均匀的字符。这个问题很难描述,更不用说解决了。希望这是有道理的。即使只是朝着正确方向的一点也会非常有帮助。

在对最佳解决方案以及为什么存储定界符不是一个选项进行了深入讨论之后(请参阅两者的评论),我的想法如下:

  1. 在建议的分隔符(例如逗号、斜杠等)上拆分字符串
  2. 将多条线拼成一个数组,方便计算
  3. 计算所述数组元素长度的标准差
  4. 最小的标准差是最大的分隔符