postgres替换文本中的计算值
postgres replace calculated value in text
我有一个 table 列 numbers
包含如下字符串:
1, 2, 2A, 14, 14A, 20
以所需的升序排列。
如何制定 ORDER BY
子句来实现此顺序?
默认情况下,postgres 必须采用字母顺序,即:
1, 2, 14, 20, 2A, 14A
是否可以仅使用 Postgres 附带的字符串操作功能来完成此操作? (replace()
、regex_replace()
等等?)
我的第一个想法是:
- 如果有的话,剪下这封信
- 个数 * 100
- 添加字母的 ascii,如果存在的话
这将产生所需的结果,因为映射值将是:
100, 200, 265, 1400, 1465, 2000
我也可以索引这个操纵值来加速排序。
附加限制:
我不能对十六进制数字进行强制转换,因为例如:14Z
也是有效的。
理想情况下,结果是单个表达式。我需要使用此转换进行过滤和排序,例如:
SELECT * FROM table WHERE transform(numbers) < 15 ORDER BY transform(numbers)
RESULT:
1, 2, 2A, 14, 14A
我尝试使用我从@klin 的回答中学到的知识来实现我的想法:
把字母剪下来,把数字乘以100:
substring('12A' from '(\d+).*')::int*100
截取数字得到字母的ASCII码:
ascii(substring('12A' from '\d+([A-Z])'))
两者相加
这适用于 12A
,但不适用于 12
,因为第二个表达式 returns NULL
而不是 0
(数字零).有什么想法吗?
我是 PostgreSQL 的新手,但我发现这非常有用 post:
Alphanumeric sorting with PostgreSQL
那么像这样的事情呢:
select val
from test
order by (substring(val, '^[0-9]+'))::int, substring(val, '[^0-9_].*$') desc
希望对您有所帮助
基于这些假设:
- 数字由数字和可选的一个未决字母组成。
- 始终至少有一位前导数字。
- 所有字母都是大写
[A-Z]
或小写 [a-z]
,但不能混合。
我会在 table 列上使用 CHECK
约束来确保绝对可靠。
创建一个微型 IMMUTABLE
SQL 函数:
CREATE OR REPLACE FUNCTION f_nr2sort(text)
RETURNS int AS
$func$
SELECT CASE WHEN right(, 1) > '9' COLLATE "C" -- no collation
THEN left(, -1)::int * 100 + ascii(right(, 1))
ELSE ::int * 100 END -- only digits
$func$ LANGUAGE SQL IMMUTABLE;
基于上述假设针对性能进行了优化。我用便宜得多的 left()
and right()
.
替换了所有正则表达式
I disabled collation rules with COLLATE "C"
用于 CASE
表达式(它也更便宜)以确保 ASCII 字母的默认字节顺序。 [a-zA-Z]
中的字母排序在“9”之上,如果最后一个字母也是如此,我们将相应地进行处理。
这样我们就避免了添加 NULL 值,也不需要用 COALESCE
.
来修复
那么您的查询可以是:
SELECT *
FROM tbl
WHERE f_nr2sort(numbers) < f_nr2sort('15C')
ORDER BY f_nr2sort(numbers);
由于函数是 IMMUTABLE
,您甚至可以创建一个简单的 functional index 来支持此 class 查询:
CREATE INDEX tbl_foo_id ON tbl (f_nr2sort(numbers));
我有一个 table 列 numbers
包含如下字符串:
1, 2, 2A, 14, 14A, 20
以所需的升序排列。
如何制定 ORDER BY
子句来实现此顺序?
默认情况下,postgres 必须采用字母顺序,即:
1, 2, 14, 20, 2A, 14A
是否可以仅使用 Postgres 附带的字符串操作功能来完成此操作? (replace()
、regex_replace()
等等?)
我的第一个想法是:
- 如果有的话,剪下这封信
- 个数 * 100
- 添加字母的 ascii,如果存在的话
这将产生所需的结果,因为映射值将是:
100, 200, 265, 1400, 1465, 2000
我也可以索引这个操纵值来加速排序。
附加限制:
我不能对十六进制数字进行强制转换,因为例如:14Z
也是有效的。
理想情况下,结果是单个表达式。我需要使用此转换进行过滤和排序,例如:
SELECT * FROM table WHERE transform(numbers) < 15 ORDER BY transform(numbers)
RESULT:
1, 2, 2A, 14, 14A
我尝试使用我从@klin 的回答中学到的知识来实现我的想法:
把字母剪下来,把数字乘以100:
substring('12A' from '(\d+).*')::int*100
截取数字得到字母的ASCII码:
ascii(substring('12A' from '\d+([A-Z])'))
两者相加
这适用于 12A
,但不适用于 12
,因为第二个表达式 returns NULL
而不是 0
(数字零).有什么想法吗?
我是 PostgreSQL 的新手,但我发现这非常有用 post: Alphanumeric sorting with PostgreSQL
那么像这样的事情呢:
select val
from test
order by (substring(val, '^[0-9]+'))::int, substring(val, '[^0-9_].*$') desc
希望对您有所帮助
基于这些假设:
- 数字由数字和可选的一个未决字母组成。
- 始终至少有一位前导数字。
- 所有字母都是大写
[A-Z]
或小写[a-z]
,但不能混合。
我会在 table 列上使用 CHECK
约束来确保绝对可靠。
创建一个微型 IMMUTABLE
SQL 函数:
CREATE OR REPLACE FUNCTION f_nr2sort(text)
RETURNS int AS
$func$
SELECT CASE WHEN right(, 1) > '9' COLLATE "C" -- no collation
THEN left(, -1)::int * 100 + ascii(right(, 1))
ELSE ::int * 100 END -- only digits
$func$ LANGUAGE SQL IMMUTABLE;
基于上述假设针对性能进行了优化。我用便宜得多的 left()
and right()
.
I disabled collation rules with COLLATE "C"
用于 CASE
表达式(它也更便宜)以确保 ASCII 字母的默认字节顺序。 [a-zA-Z]
中的字母排序在“9”之上,如果最后一个字母也是如此,我们将相应地进行处理。
这样我们就避免了添加 NULL 值,也不需要用 COALESCE
.
那么您的查询可以是:
SELECT *
FROM tbl
WHERE f_nr2sort(numbers) < f_nr2sort('15C')
ORDER BY f_nr2sort(numbers);
由于函数是 IMMUTABLE
,您甚至可以创建一个简单的 functional index 来支持此 class 查询:
CREATE INDEX tbl_foo_id ON tbl (f_nr2sort(numbers));