SQL CTE 与温度 Table
SQL CTE vs Temp Table
我运行在这里遇到了一些困难。我的主要目标是能够在 C# 和 Entity Framework 中使用它,我们的高层指令是远离存储过程。
我有 2 个 table:一个外部参照和一个 (Celko) 树 table。
/**
** Table [dbo].[EntityXref]
**/
IF EXISTS(SELECT * FROM sys.tables WHERE name = N'EntityXref' AND type = N'U')
DROP TABLE [dbo].[EntityXref]
GO
CREATE TABLE dbo.[EntityXref]
( Id BIGINT IDENTITY(1,1) NOT NULL
, EntityId INT NOT NULL
, EntityTypeId INT NOT NULL
, ChildEntityId INT NOT NULL
, ChildEntityTypeId INT NOT NULL
, CONSTRAINT [PK_EntityXref] PRIMARY KEY NONCLUSTERED ([Id] ASC) WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]
, CONSTRAINT [UQ_EntityXref] UNIQUE CLUSTERED (EntityId, EntityTypeId, ChildEntityId, ChildEntityTypeId)
)
/**
** Table [dbo].[EntityTree]
**/
IF EXISTS(SELECT * FROM sys.tables WHERE name = N'EntityTree' AND type = N'U')
DROP TABLE dbo.EntityTree
GO
CREATE TABLE dbo.EntityTree
( Id BIGINT IDENTITY(1,1) NOT NULL
, SystemId INT NOT NULL DEFAULT 1
, EntityId INT NOT NULL -- could be an AgencyId, UserId, ClientId, VendorId, etc
, EntityTypeId INT NOT NULL -- Defines the entity type
, isActive BIT NOT NULL
, lft BIGINT NOT NULL
, rgt BIGINT NOT NULL
, CONSTRAINT [PK_EntityTree] PRIMARY KEY CLUSTERED ([Id] ASC) WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]
, CONSTRAINT [UQ_Entity] UNIQUE NONCLUSTERED (EntityId, EntityTypeId)
, CONSTRAINT [UQ_Left] UNIQUE NONCLUSTERED ([lft])
, CONSTRAINT [UQ_LeftRight] UNIQUE NONCLUSTERED ([lft], [rgt])
)
GO
基本树数据如下:
Customer -> Agencies -> Users -> Clients
我们也有管理多个机构的用户,因此使用了外部参照(糟糕的名称)table。我正在与一个拥有 98% 的机构概览的用户进行测试,我需要所有的客户。所以,我的难题:
注意:
- EntityTypeId = 7 --> 用于生成报告的用户帐户
- EntityTypeId = 4 --> 客户账户
这需要4秒才能运行但不能表达为观点:
DECLARE @t TABLE
( childentityid INT
, childentitytypeid INT
)
INSERT INTO @t
SELECT et.RootEntityId, et.RootEntityTypeId
FROM dbo.EntityXref et
WHERE et.EntityId = 17088 AND et.EntityTypeId = 7
SELECT *
FROM @t a
INNER JOIN dbo.GetMyCaseLoad b ON a.RootEntityId = b.ParentEntityId AND a.RootEntityTypeId = b.ParentEntityTypeId
GO
这需要 36-40 秒才能完成 运行(此连接有几个不同的排列!)
WITH xrefParent (parentEntityId, parentEntityTypeId) --, rootEntityId, rootEntityTypeId)
AS (SELECT ChildEntityId, ChildEntityTypeId /*, EntityId, EntityTypeId */ FROM dbo.EntityXref WHERE EntityId = 17088 AND EntityTypeId = 7)
SELECT *
FROM GetMyCaseLoad cl
INNER JOIN xrefParent p ON cl.ParentEntityId = p.parentEntityId AND cl.ParentEntityTypeId = p.parentEntityTypeId
-- WHERE p.rootEntityId = 17088 AND p.rootEntityTypeId = 7
GO
关于如何将临时 table 的 好处 转化为供 Entity Framework 使用的视图的任何想法?
添加的定义:
CREATE VIEW GetMyCaseLoad AS
SELECT Parent.Id [ParentRecordId]
, Parent.EntityId [ParentEntityId]
, Parent.EntityTypeId [ParentEntityTypeId]
, Child.SystemId [ChildSystemId]
, Child.Id [ChildRecordId]
, Child.EntityId [ChildEntityId]
, Child.EntityTypeId [ChildEntityTypeId]
, Child.isActive [ChildIsActive]
, Child.lft [ChildLeft]
, Child.rgt [ChildRight]
FROM dbo.EntityTree Parent
, dbo.EntityTree Child
WHERE Child.lft > Parent.lft
AND Child.rgt < Parent.rgt
AND Child.EntityTypeId = 4
GO
CREATE VIEW GetMyFullCaseLoad AS
SELECT x.Id [XrefRecordId]
, x.EntityId [XrefParentEntityId]
, x.EntityTypeId [XrefParentEntityTypeId]
, c.ParentRecordId
, c.ParentEntityId
, c.ParentEntityTypeId
, c.ChildRecordId
, c.ChildEntityId
, c.ChildEntityTypeId
, c.ChildIsActive
, c.ChildLeft
, c.ChildRight
, x.CanRead
, x.CanWrite
FROM EntityXref x
INNER JOIN dbo.GetMyCaseLoad c ON x.ChildEntityId = c.ParentEntityId AND x.ChildEntityTypeId = c.ParentEntityTypeId
GO
第二个视图是我们正在努力加速的。
旁注:当前系统大约需要 2-3 分钟才能恢复记录。第二个视图或 CTE 基于新的数据结构(邻接树与集合树)在 40 秒内完成。随着温度 table 4 秒。
在 dbo.EntityXref(EntityId, EntityTypeId) 上添加索引?
我猜这是因为这确实是临时 table 唯一的区别,如果您插入临时 table 时它只会 table 扫描一次没有索引。在其他排列中,它可能会变成循环 table 扫描。
唯一比 table 扫描更糟糕的是循环 table 扫描。
CTE 的问题在于它们没有具体化,它们没有专门的统计信息(它们依赖于底层对象的统计信息),它们没有索引(尽管在某些情况下它们可以在引用的对象上使用索引tables).
临时 tables 的优点是它们本质上是具体化的(在 tempdb 中),它们可以有索引(如果你定义它们)并且肯定有专门的统计信息。
在很多情况下,这意味着使用临时 tables 而不是 CTE 可以产生更好的执行计划。使用 CTE 几乎永远不会加快速度,而在很多情况下临时 table 会。
我会服从比我更高的权威,并留下他的名言:
A CTE should never be used for performance. You will almost never speed things up by using a CTE because it's just a disposable view. You can do some neat things with them but speeding up a query isn't really one of them.
这句话是从 accepted answer 到问题 "What's the difference between a CTE and a Temp Table?"
PS:我看到您在第一个查询中使用了 TABLE
变量。这与临时 table 不同。就性能而言,临时 table 几乎总是优于 TABLE
变量。有关 TABLE
变量和临时 table 之间的区别的好文章,请阅读此 accepted answer 关于 "What's the difference between a temp table and table variable in SQL Server?" 的问题。
我运行在这里遇到了一些困难。我的主要目标是能够在 C# 和 Entity Framework 中使用它,我们的高层指令是远离存储过程。
我有 2 个 table:一个外部参照和一个 (Celko) 树 table。
/**
** Table [dbo].[EntityXref]
**/
IF EXISTS(SELECT * FROM sys.tables WHERE name = N'EntityXref' AND type = N'U')
DROP TABLE [dbo].[EntityXref]
GO
CREATE TABLE dbo.[EntityXref]
( Id BIGINT IDENTITY(1,1) NOT NULL
, EntityId INT NOT NULL
, EntityTypeId INT NOT NULL
, ChildEntityId INT NOT NULL
, ChildEntityTypeId INT NOT NULL
, CONSTRAINT [PK_EntityXref] PRIMARY KEY NONCLUSTERED ([Id] ASC) WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]
, CONSTRAINT [UQ_EntityXref] UNIQUE CLUSTERED (EntityId, EntityTypeId, ChildEntityId, ChildEntityTypeId)
)
/**
** Table [dbo].[EntityTree]
**/
IF EXISTS(SELECT * FROM sys.tables WHERE name = N'EntityTree' AND type = N'U')
DROP TABLE dbo.EntityTree
GO
CREATE TABLE dbo.EntityTree
( Id BIGINT IDENTITY(1,1) NOT NULL
, SystemId INT NOT NULL DEFAULT 1
, EntityId INT NOT NULL -- could be an AgencyId, UserId, ClientId, VendorId, etc
, EntityTypeId INT NOT NULL -- Defines the entity type
, isActive BIT NOT NULL
, lft BIGINT NOT NULL
, rgt BIGINT NOT NULL
, CONSTRAINT [PK_EntityTree] PRIMARY KEY CLUSTERED ([Id] ASC) WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]
, CONSTRAINT [UQ_Entity] UNIQUE NONCLUSTERED (EntityId, EntityTypeId)
, CONSTRAINT [UQ_Left] UNIQUE NONCLUSTERED ([lft])
, CONSTRAINT [UQ_LeftRight] UNIQUE NONCLUSTERED ([lft], [rgt])
)
GO
基本树数据如下:
Customer -> Agencies -> Users -> Clients
我们也有管理多个机构的用户,因此使用了外部参照(糟糕的名称)table。我正在与一个拥有 98% 的机构概览的用户进行测试,我需要所有的客户。所以,我的难题:
注意:
- EntityTypeId = 7 --> 用于生成报告的用户帐户
- EntityTypeId = 4 --> 客户账户
这需要4秒才能运行但不能表达为观点:
DECLARE @t TABLE
( childentityid INT
, childentitytypeid INT
)
INSERT INTO @t
SELECT et.RootEntityId, et.RootEntityTypeId
FROM dbo.EntityXref et
WHERE et.EntityId = 17088 AND et.EntityTypeId = 7
SELECT *
FROM @t a
INNER JOIN dbo.GetMyCaseLoad b ON a.RootEntityId = b.ParentEntityId AND a.RootEntityTypeId = b.ParentEntityTypeId
GO
这需要 36-40 秒才能完成 运行(此连接有几个不同的排列!)
WITH xrefParent (parentEntityId, parentEntityTypeId) --, rootEntityId, rootEntityTypeId)
AS (SELECT ChildEntityId, ChildEntityTypeId /*, EntityId, EntityTypeId */ FROM dbo.EntityXref WHERE EntityId = 17088 AND EntityTypeId = 7)
SELECT *
FROM GetMyCaseLoad cl
INNER JOIN xrefParent p ON cl.ParentEntityId = p.parentEntityId AND cl.ParentEntityTypeId = p.parentEntityTypeId
-- WHERE p.rootEntityId = 17088 AND p.rootEntityTypeId = 7
GO
关于如何将临时 table 的 好处 转化为供 Entity Framework 使用的视图的任何想法?
添加的定义:
CREATE VIEW GetMyCaseLoad AS
SELECT Parent.Id [ParentRecordId]
, Parent.EntityId [ParentEntityId]
, Parent.EntityTypeId [ParentEntityTypeId]
, Child.SystemId [ChildSystemId]
, Child.Id [ChildRecordId]
, Child.EntityId [ChildEntityId]
, Child.EntityTypeId [ChildEntityTypeId]
, Child.isActive [ChildIsActive]
, Child.lft [ChildLeft]
, Child.rgt [ChildRight]
FROM dbo.EntityTree Parent
, dbo.EntityTree Child
WHERE Child.lft > Parent.lft
AND Child.rgt < Parent.rgt
AND Child.EntityTypeId = 4
GO
CREATE VIEW GetMyFullCaseLoad AS
SELECT x.Id [XrefRecordId]
, x.EntityId [XrefParentEntityId]
, x.EntityTypeId [XrefParentEntityTypeId]
, c.ParentRecordId
, c.ParentEntityId
, c.ParentEntityTypeId
, c.ChildRecordId
, c.ChildEntityId
, c.ChildEntityTypeId
, c.ChildIsActive
, c.ChildLeft
, c.ChildRight
, x.CanRead
, x.CanWrite
FROM EntityXref x
INNER JOIN dbo.GetMyCaseLoad c ON x.ChildEntityId = c.ParentEntityId AND x.ChildEntityTypeId = c.ParentEntityTypeId
GO
第二个视图是我们正在努力加速的。
旁注:当前系统大约需要 2-3 分钟才能恢复记录。第二个视图或 CTE 基于新的数据结构(邻接树与集合树)在 40 秒内完成。随着温度 table 4 秒。
在 dbo.EntityXref(EntityId, EntityTypeId) 上添加索引?
我猜这是因为这确实是临时 table 唯一的区别,如果您插入临时 table 时它只会 table 扫描一次没有索引。在其他排列中,它可能会变成循环 table 扫描。
唯一比 table 扫描更糟糕的是循环 table 扫描。
CTE 的问题在于它们没有具体化,它们没有专门的统计信息(它们依赖于底层对象的统计信息),它们没有索引(尽管在某些情况下它们可以在引用的对象上使用索引tables).
临时 tables 的优点是它们本质上是具体化的(在 tempdb 中),它们可以有索引(如果你定义它们)并且肯定有专门的统计信息。
在很多情况下,这意味着使用临时 tables 而不是 CTE 可以产生更好的执行计划。使用 CTE 几乎永远不会加快速度,而在很多情况下临时 table 会。
我会服从比我更高的权威,并留下他的名言:
A CTE should never be used for performance. You will almost never speed things up by using a CTE because it's just a disposable view. You can do some neat things with them but speeding up a query isn't really one of them.
这句话是从 accepted answer 到问题 "What's the difference between a CTE and a Temp Table?"
PS:我看到您在第一个查询中使用了 TABLE
变量。这与临时 table 不同。就性能而言,临时 table 几乎总是优于 TABLE
变量。有关 TABLE
变量和临时 table 之间的区别的好文章,请阅读此 accepted answer 关于 "What's the difference between a temp table and table variable in SQL Server?" 的问题。