postgres替换文本中的计算值

Question

我有一个 table 列 numbers 包含如下字符串：

1, 2, 2A, 14, 14A, 20

以所需的升序排列。

如何制定 ORDER BY 子句来实现此顺序？

默认情况下，postgres 必须采用字母顺序，即：

1, 2, 14, 20, 2A, 14A

是否可以仅使用 Postgres 附带的字符串操作功能来完成此操作？（replace()、regex_replace() 等等？）

我的第一个想法是：

如果有的话，剪下这封信
个数 * 100
添加字母的 ascii，如果存在的话

这将产生所需的结果，因为映射值将是：

100, 200, 265, 1400, 1465, 2000

我也可以索引这个操纵值来加速排序。

附加限制：

我不能对十六进制数字进行强制转换，因为例如：14Z 也是有效的。

理想情况下，结果是单个表达式。我需要使用此转换进行过滤和排序，例如：

SELECT * FROM table WHERE transform(numbers) < 15 ORDER BY transform(numbers)
RESULT:

 1, 2, 2A, 14, 14A

我尝试使用我从@klin 的回答中学到的知识来实现我的想法：

把字母剪下来，把数字乘以100：

substring('12A' from '(\d+).*')::int*100

截取数字得到字母的ASCII码：

ascii(substring('12A' from '\d+([A-Z])'))

两者相加

这适用于 12A，但不适用于 12，因为第二个表达式 returns NULL 而不是 0（数字零).有什么想法吗？

Answer 1

我是 PostgreSQL 的新手，但我发现这非常有用 post： Alphanumeric sorting with PostgreSQL

那么像这样的事情呢：

select val
from test
order by (substring(val, '^[0-9]+'))::int, substring(val, '[^0-9_].*$') desc

希望对您有所帮助

Answer 2

基于这些假设：

数字由数字和可选的一个未决字母组成。
始终至少有一位前导数字。
所有字母都是大写 [A-Z] 或小写 [a-z]，但不能混合。

我会在 table 列上使用 CHECK 约束来确保绝对可靠。

创建一个微型 IMMUTABLE SQL 函数：

CREATE OR REPLACE FUNCTION f_nr2sort(text)
  RETURNS int AS
$func$
   SELECT CASE WHEN right(, 1) > '9' COLLATE "C"  -- no collation
               THEN left(, -1)::int * 100 + ascii(right(, 1))
               ELSE ::int * 100 END  -- only digits
$func$ LANGUAGE SQL IMMUTABLE;

基于上述假设针对性能进行了优化。我用便宜得多的 left() and right().

替换了所有正则表达式

I disabled collation rules with COLLATE "C" 用于 CASE 表达式（它也更便宜）以确保 ASCII 字母的默认字节顺序。 [a-zA-Z] 中的字母排序在“9”之上，如果最后一个字母也是如此，我们将相应地进行处理。
这样我们就避免了添加 NULL 值，也不需要用 COALESCE.

来修复

那么您的查询可以是：

SELECT *
FROM   tbl
WHERE  f_nr2sort(numbers) < f_nr2sort('15C')
ORDER  BY f_nr2sort(numbers);

由于函数是 IMMUTABLE，您甚至可以创建一个简单的 functional index 来支持此 class 查询：

CREATE INDEX tbl_foo_id ON tbl (f_nr2sort(numbers));

postgres替换文本中的计算值

postgres replace calculated value in text

sql

postgresql

natural-sort

sql-order-by

pattern-matching