"Maximum number of parameters" 使用 pyodbc 的过滤器 .in_(list) 出错

Question

我们的一个在 Python 2 + mxODBC 中工作的查询在 Python 3 + pyodbc 中不工作；它引发了这样的错误： Maximum number of parameters in the sql query is 2100. while connecting to SQL Server.由于两个打印的查询都有 3000 个参数，我认为它在两种环境中都应该失败，但显然这里似乎不是这种情况。在 Python 2 环境中，MSODBC 11 或 MSODBC 17 都可以工作，因此我立即排除了与驱动程序相关的问题。

所以我的问题是：

在 SQLAlchemy 中将 list 作为多个参数发送是否正确，因为参数列表将与 list 的长度成正比？我觉得它看起来有点奇怪；我宁愿将 list 连接成一个 string 因为数据库不理解 list 数据类型。
是否有关于为什么它可以在 mxODBC 而不是 pyodbc 中工作的任何提示？ mxODBC 是否优化了 pyodbc 没有的东西？如果有任何指示，请告诉我 - 我可以尝试在此处粘贴更多信息。（我对调试 SQLAlchemy 还是个新手。）

脚注：我看到很多答案建议 分块数据 ，但由于 1 和 2，我想知道是否我首先做的是正确的事情。

（因为好像和pyodbc有关，所以在官方仓库里提了一个internal issue）

import sqlalchemy
import sqlalchemy.orm

from sqlalchemy import MetaData, Table
from sqlalchemy.ext.declarative import declarative_base

from  sqlalchemy.orm.session import Session

Base = declarative_base()

create_tables = """
CREATE TABLE products(
    idn NUMERIC(8) PRIMARY KEY
);
"""

check_tables = """   
SELECT * FROM products;
"""

insert_values = """
INSERT INTO products
(idn)
values
(1),
(2);
"""

delete_tables = """
DROP TABLE products;
"""

engine = sqlalchemy.create_engine('mssql+pyodbc://user:password@dsn')
connection = engine.connect()
cursor = engine.raw_connection().cursor()
Session = sqlalchemy.orm.sessionmaker(bind=connection)
session = Session()

session.execute(create_tables)

metadata = MetaData(connection)

class Products(Base):
   __table__ = Table('products', metadata, autoload=True)

try:
    session.execute(check_tables)
    session.execute(insert_values)
    session.commit()
    query = session.query(Products).filter(
        Products.idn.in_(list(range(0, 3000)))
    )
    query.all()
    f = open("query.sql", "w")
    f.write(str(query))
    f.close()
finally:
    session.execute(delete_tables)
    session.commit()

Answer 1

当你做一个简单的 .in_(list_of_values) SQLAlchemy 呈现以下 SQL ...

SELECT team.prov AS team_prov, team.city AS team_city 
FROM team 
WHERE team.prov IN (?, ?)

... 其中 IN 子句中的每个值都指定为单独的参数值。 pyodbc 将此发送到 SQL 服务器作为 ...

exec sp_prepexec @p1 output,N'@P1 nvarchar(4),@P2 nvarchar(4)',N'SELECT team.prov AS team_prov, team.city AS team_city, team.team_name AS team_team_name 
FROM team 
WHERE team.prov IN (@P1, @P2)',N'AB',N'ON'

... 所以如果你的列表很长，你就达到了 2100 个参数的限制。据推测，mxODBC 在将参数值发送到 SQL 服务器之前内联插入了参数值，例如

SELECT team.prov AS team_prov, team.city AS team_city 
FROM team 
WHERE team.prov IN ('AB', 'ON')

你可以让 SQLAlchemy 为你完成

provinces = ["AB", "ON"]
stmt = (
    session.query(Team)
    .filter(
        Team.prov.in_(sa.bindparam("p1", expanding=True, literal_execute=True))
    )
    .statement
)
result = list(session.query(Team).params(p1=provinces).from_statement(stmt))

"Maximum number of parameters" 使用 pyodbc 的过滤器 .in_(list) 出错

"Maximum number of parameters" error with filter .in_(list) using pyodbc

python

sqlalchemy

pyodbc