如何使用 psycopg2 读取和插入 bytea 列?

How to read and insert bytea columns using psycopg2?

我正在开发一个 Python 脚本来将一些 Postgresql table 从一个环境复制到另一个环境(比 pg_dump 做的多一点)。它有效,除非我正在复制具有 bytea 数据类型的 table。

我读取了内存中的源 table 数据,然后我将内存转储到目标数据库中并进行了串联插入。

这是我生成插入语句的方法:

def generateInsert(self, argCachedRow):

    colOrd = 0;

    valClauseList = []

    hasBinary = False

    for colData in argCachedRow:
        colOrd += 1
        colName = self.colOrdLookup.get(colOrd)
        col = self.colLookup.get(colName)
        dataType = col.dataType

        insVal = None

        if colData is not None:

            strVal = str(colData)
            if dataType.useQuote:

                if "'" in strVal:
                    strVal = strVal.replace("'", "''")
                insVal = "'%s'" % strVal
            else:
                if dataType.binary:
                    hasBinary = True
                    #insVal = psycopg2.Binary(colData)
                #else:

                insVal = strVal
        else:
            insVal = "NULL"

        valClauseList.append(insVal)

    valClause = ", ".join(valClauseList)

    if hasBinary:
        valClause = psycopg2.Binary(valClause)

    result = "INSERT INTO %s VALUES (%s)" % (self.name, valClause)

    return result

它适用于所有没有二进制数据的 table。

我还尝试(凭直觉)将二进制列数据包装在 psycopg2.Binary 中,这是注释掉的行,然后不对整个行值列表进行包装,但这也不起作用。

这是我的简单 DataType 包装器,它是通过阅读 Postgres 的 information_schema tables:

加载的
class DataType(object):
    def __init__(self, argDispName, argSqlName, argUseQuote, argBin):
        self.dispName = argDispName
        self.sqlName = argSqlName
        self.useQuote = argUseQuote
        self.binary = argBin

如何使用 psycopg2 读取和插入 bytea 列?

如果你有这样的数据库结构:

CREATE TABLE test (a bytea,
                   b int,
                   c text)

然后可以像这样将二进制数据插入到请求中,无需任何包装器:

bin_data = b'bytes object'
db = psycopg2.connect(*args)  # DB-API 2.0
c = db.cursor()
c.execute('''INSERT INTO test VALUES (%s, %s, %s)''', (bin_data, 1337, 'foo'))
c.execute('''UPDATE test SET a = %s''', (bin_data + b'1',))

那么,当你查询的时候:

c.execute('''SELECT a FROM test''')

您将收到一个 memoryview,它很容易转换回 bytes:

mview = c.fetchone()
new_bin_data = bytes(mview)
print(new_bin_data)

输出:b'bytes object1'

此外,我建议您不要 assemble 按字符串格式进行查询。 psycopg2 的内置参数替换更加方便,您不必担心验证数据以防止 SQL 注入。