如何使用 psycopg2 读取和插入 bytea 列?
How to read and insert bytea columns using psycopg2?
我正在开发一个 Python
脚本来将一些 Postgresql
table 从一个环境复制到另一个环境(比 pg_dump
做的多一点)。它有效,除非我正在复制具有 bytea
数据类型的 table。
我读取了内存中的源 table 数据,然后我将内存转储到目标数据库中并进行了串联插入。
这是我生成插入语句的方法:
def generateInsert(self, argCachedRow):
colOrd = 0;
valClauseList = []
hasBinary = False
for colData in argCachedRow:
colOrd += 1
colName = self.colOrdLookup.get(colOrd)
col = self.colLookup.get(colName)
dataType = col.dataType
insVal = None
if colData is not None:
strVal = str(colData)
if dataType.useQuote:
if "'" in strVal:
strVal = strVal.replace("'", "''")
insVal = "'%s'" % strVal
else:
if dataType.binary:
hasBinary = True
#insVal = psycopg2.Binary(colData)
#else:
insVal = strVal
else:
insVal = "NULL"
valClauseList.append(insVal)
valClause = ", ".join(valClauseList)
if hasBinary:
valClause = psycopg2.Binary(valClause)
result = "INSERT INTO %s VALUES (%s)" % (self.name, valClause)
return result
它适用于所有没有二进制数据的 table。
我还尝试(凭直觉)将二进制列数据包装在 psycopg2.Binary
中,这是注释掉的行,然后不对整个行值列表进行包装,但这也不起作用。
这是我的简单 DataType 包装器,它是通过阅读 Postgres 的 information_schema tables:
加载的
class DataType(object):
def __init__(self, argDispName, argSqlName, argUseQuote, argBin):
self.dispName = argDispName
self.sqlName = argSqlName
self.useQuote = argUseQuote
self.binary = argBin
如何使用 psycopg2
读取和插入 bytea 列?
如果你有这样的数据库结构:
CREATE TABLE test (a bytea,
b int,
c text)
然后可以像这样将二进制数据插入到请求中,无需任何包装器:
bin_data = b'bytes object'
db = psycopg2.connect(*args) # DB-API 2.0
c = db.cursor()
c.execute('''INSERT INTO test VALUES (%s, %s, %s)''', (bin_data, 1337, 'foo'))
c.execute('''UPDATE test SET a = %s''', (bin_data + b'1',))
那么,当你查询的时候:
c.execute('''SELECT a FROM test''')
您将收到一个 memoryview
,它很容易转换回 bytes
:
mview = c.fetchone()
new_bin_data = bytes(mview)
print(new_bin_data)
输出:b'bytes object1'
此外,我建议您不要 assemble 按字符串格式进行查询。 psycopg2
的内置参数替换更加方便,您不必担心验证数据以防止 SQL 注入。
我正在开发一个 Python
脚本来将一些 Postgresql
table 从一个环境复制到另一个环境(比 pg_dump
做的多一点)。它有效,除非我正在复制具有 bytea
数据类型的 table。
我读取了内存中的源 table 数据,然后我将内存转储到目标数据库中并进行了串联插入。
这是我生成插入语句的方法:
def generateInsert(self, argCachedRow):
colOrd = 0;
valClauseList = []
hasBinary = False
for colData in argCachedRow:
colOrd += 1
colName = self.colOrdLookup.get(colOrd)
col = self.colLookup.get(colName)
dataType = col.dataType
insVal = None
if colData is not None:
strVal = str(colData)
if dataType.useQuote:
if "'" in strVal:
strVal = strVal.replace("'", "''")
insVal = "'%s'" % strVal
else:
if dataType.binary:
hasBinary = True
#insVal = psycopg2.Binary(colData)
#else:
insVal = strVal
else:
insVal = "NULL"
valClauseList.append(insVal)
valClause = ", ".join(valClauseList)
if hasBinary:
valClause = psycopg2.Binary(valClause)
result = "INSERT INTO %s VALUES (%s)" % (self.name, valClause)
return result
它适用于所有没有二进制数据的 table。
我还尝试(凭直觉)将二进制列数据包装在 psycopg2.Binary
中,这是注释掉的行,然后不对整个行值列表进行包装,但这也不起作用。
这是我的简单 DataType 包装器,它是通过阅读 Postgres 的 information_schema tables:
加载的class DataType(object):
def __init__(self, argDispName, argSqlName, argUseQuote, argBin):
self.dispName = argDispName
self.sqlName = argSqlName
self.useQuote = argUseQuote
self.binary = argBin
如何使用 psycopg2
读取和插入 bytea 列?
如果你有这样的数据库结构:
CREATE TABLE test (a bytea,
b int,
c text)
然后可以像这样将二进制数据插入到请求中,无需任何包装器:
bin_data = b'bytes object'
db = psycopg2.connect(*args) # DB-API 2.0
c = db.cursor()
c.execute('''INSERT INTO test VALUES (%s, %s, %s)''', (bin_data, 1337, 'foo'))
c.execute('''UPDATE test SET a = %s''', (bin_data + b'1',))
那么,当你查询的时候:
c.execute('''SELECT a FROM test''')
您将收到一个 memoryview
,它很容易转换回 bytes
:
mview = c.fetchone()
new_bin_data = bytes(mview)
print(new_bin_data)
输出:b'bytes object1'
此外,我建议您不要 assemble 按字符串格式进行查询。 psycopg2
的内置参数替换更加方便,您不必担心验证数据以防止 SQL 注入。