"Maximum number of parameters" 使用 pyodbc 的过滤器 .in_(list) 出错
"Maximum number of parameters" error with filter .in_(list) using pyodbc
我们的一个在 Python 2 + mxODBC 中工作的查询在 Python 3 + pyodbc 中不工作;它引发了这样的错误: Maximum number of parameters in the sql query is 2100.
while connecting to SQL Server.由于两个打印的查询都有 3000 个参数,我认为它在两种环境中都应该失败,但显然这里似乎不是这种情况。在 Python 2 环境中,MSODBC 11 或 MSODBC 17 都可以工作,因此我立即排除了与驱动程序相关的问题。
所以我的问题是:
- 在 SQLAlchemy 中将
list
作为多个参数发送是否正确,因为参数列表将与 list
的长度成正比?我觉得它看起来有点奇怪;我宁愿将 list
连接成一个 string
因为数据库不理解 list
数据类型。
- 是否有关于为什么它可以在 mxODBC 而不是 pyodbc 中工作的任何提示? mxODBC 是否优化了 pyodbc 没有的东西?如果有任何指示,请告诉我 - 我可以尝试在此处粘贴更多信息。 (我对调试 SQLAlchemy 还是个新手。)
脚注:我看到很多答案建议 分块数据 ,但由于 1 和 2,我想知道是否我首先做的是正确的事情。
(因为好像和pyodbc有关,所以在官方仓库里提了一个internal issue)
import sqlalchemy
import sqlalchemy.orm
from sqlalchemy import MetaData, Table
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.orm.session import Session
Base = declarative_base()
create_tables = """
CREATE TABLE products(
idn NUMERIC(8) PRIMARY KEY
);
"""
check_tables = """
SELECT * FROM products;
"""
insert_values = """
INSERT INTO products
(idn)
values
(1),
(2);
"""
delete_tables = """
DROP TABLE products;
"""
engine = sqlalchemy.create_engine('mssql+pyodbc://user:password@dsn')
connection = engine.connect()
cursor = engine.raw_connection().cursor()
Session = sqlalchemy.orm.sessionmaker(bind=connection)
session = Session()
session.execute(create_tables)
metadata = MetaData(connection)
class Products(Base):
__table__ = Table('products', metadata, autoload=True)
try:
session.execute(check_tables)
session.execute(insert_values)
session.commit()
query = session.query(Products).filter(
Products.idn.in_(list(range(0, 3000)))
)
query.all()
f = open("query.sql", "w")
f.write(str(query))
f.close()
finally:
session.execute(delete_tables)
session.commit()
当你做一个简单的 .in_(list_of_values)
SQLAlchemy 呈现以下 SQL ...
SELECT team.prov AS team_prov, team.city AS team_city
FROM team
WHERE team.prov IN (?, ?)
... 其中 IN 子句中的每个值都指定为单独的参数值。 pyodbc 将此发送到 SQL 服务器作为 ...
exec sp_prepexec @p1 output,N'@P1 nvarchar(4),@P2 nvarchar(4)',N'SELECT team.prov AS team_prov, team.city AS team_city, team.team_name AS team_team_name
FROM team
WHERE team.prov IN (@P1, @P2)',N'AB',N'ON'
... 所以如果你的列表很长,你就达到了 2100 个参数的限制。据推测,mxODBC 在将参数值发送到 SQL 服务器之前内联插入了参数值,例如
SELECT team.prov AS team_prov, team.city AS team_city
FROM team
WHERE team.prov IN ('AB', 'ON')
你可以让 SQLAlchemy 为你完成
provinces = ["AB", "ON"]
stmt = (
session.query(Team)
.filter(
Team.prov.in_(sa.bindparam("p1", expanding=True, literal_execute=True))
)
.statement
)
result = list(session.query(Team).params(p1=provinces).from_statement(stmt))
我们的一个在 Python 2 + mxODBC 中工作的查询在 Python 3 + pyodbc 中不工作;它引发了这样的错误: Maximum number of parameters in the sql query is 2100.
while connecting to SQL Server.由于两个打印的查询都有 3000 个参数,我认为它在两种环境中都应该失败,但显然这里似乎不是这种情况。在 Python 2 环境中,MSODBC 11 或 MSODBC 17 都可以工作,因此我立即排除了与驱动程序相关的问题。
所以我的问题是:
- 在 SQLAlchemy 中将
list
作为多个参数发送是否正确,因为参数列表将与list
的长度成正比?我觉得它看起来有点奇怪;我宁愿将list
连接成一个string
因为数据库不理解list
数据类型。 - 是否有关于为什么它可以在 mxODBC 而不是 pyodbc 中工作的任何提示? mxODBC 是否优化了 pyodbc 没有的东西?如果有任何指示,请告诉我 - 我可以尝试在此处粘贴更多信息。 (我对调试 SQLAlchemy 还是个新手。)
脚注:我看到很多答案建议 分块数据 ,但由于 1 和 2,我想知道是否我首先做的是正确的事情。
(因为好像和pyodbc有关,所以在官方仓库里提了一个internal issue)
import sqlalchemy
import sqlalchemy.orm
from sqlalchemy import MetaData, Table
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.orm.session import Session
Base = declarative_base()
create_tables = """
CREATE TABLE products(
idn NUMERIC(8) PRIMARY KEY
);
"""
check_tables = """
SELECT * FROM products;
"""
insert_values = """
INSERT INTO products
(idn)
values
(1),
(2);
"""
delete_tables = """
DROP TABLE products;
"""
engine = sqlalchemy.create_engine('mssql+pyodbc://user:password@dsn')
connection = engine.connect()
cursor = engine.raw_connection().cursor()
Session = sqlalchemy.orm.sessionmaker(bind=connection)
session = Session()
session.execute(create_tables)
metadata = MetaData(connection)
class Products(Base):
__table__ = Table('products', metadata, autoload=True)
try:
session.execute(check_tables)
session.execute(insert_values)
session.commit()
query = session.query(Products).filter(
Products.idn.in_(list(range(0, 3000)))
)
query.all()
f = open("query.sql", "w")
f.write(str(query))
f.close()
finally:
session.execute(delete_tables)
session.commit()
当你做一个简单的 .in_(list_of_values)
SQLAlchemy 呈现以下 SQL ...
SELECT team.prov AS team_prov, team.city AS team_city
FROM team
WHERE team.prov IN (?, ?)
... 其中 IN 子句中的每个值都指定为单独的参数值。 pyodbc 将此发送到 SQL 服务器作为 ...
exec sp_prepexec @p1 output,N'@P1 nvarchar(4),@P2 nvarchar(4)',N'SELECT team.prov AS team_prov, team.city AS team_city, team.team_name AS team_team_name
FROM team
WHERE team.prov IN (@P1, @P2)',N'AB',N'ON'
... 所以如果你的列表很长,你就达到了 2100 个参数的限制。据推测,mxODBC 在将参数值发送到 SQL 服务器之前内联插入了参数值,例如
SELECT team.prov AS team_prov, team.city AS team_city
FROM team
WHERE team.prov IN ('AB', 'ON')
你可以让 SQLAlchemy 为你完成
provinces = ["AB", "ON"]
stmt = (
session.query(Team)
.filter(
Team.prov.in_(sa.bindparam("p1", expanding=True, literal_execute=True))
)
.statement
)
result = list(session.query(Team).params(p1=provinces).from_statement(stmt))