SQL CTE 与温度 Table

SQL CTE vs Temp Table

我运行在这里遇到了一些困难。我的主要目标是能够在 C# 和 Entity Framework 中使用它,我们的高层指令是远离存储过程。

我有 2 个 table:一个外部参照和一个 (Celko) 树 table。

/**
 ** Table [dbo].[EntityXref]
 **/
IF EXISTS(SELECT * FROM sys.tables WHERE name = N'EntityXref' AND type = N'U')
    DROP TABLE [dbo].[EntityXref]
GO
CREATE TABLE dbo.[EntityXref]
( Id                BIGINT IDENTITY(1,1) NOT NULL
, EntityId          INT NOT NULL
, EntityTypeId      INT NOT NULL
, ChildEntityId     INT NOT NULL
, ChildEntityTypeId INT NOT NULL
, CONSTRAINT [PK_EntityXref] PRIMARY KEY NONCLUSTERED ([Id] ASC) WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]
, CONSTRAINT [UQ_EntityXref] UNIQUE CLUSTERED (EntityId, EntityTypeId, ChildEntityId, ChildEntityTypeId)
)


/**
 ** Table [dbo].[EntityTree]
 **/
IF EXISTS(SELECT * FROM sys.tables WHERE name = N'EntityTree' AND type = N'U')
    DROP TABLE dbo.EntityTree
GO
CREATE TABLE dbo.EntityTree
( Id            BIGINT IDENTITY(1,1) NOT NULL
, SystemId      INT NOT NULL DEFAULT 1 
, EntityId      INT NOT NULL -- could be an AgencyId, UserId, ClientId, VendorId, etc
, EntityTypeId  INT NOT NULL -- Defines the entity type
, isActive      BIT NOT NULL
, lft           BIGINT NOT NULL 
, rgt           BIGINT NOT NULL 
, CONSTRAINT [PK_EntityTree] PRIMARY KEY CLUSTERED ([Id] ASC) WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]
, CONSTRAINT [UQ_Entity]     UNIQUE NONCLUSTERED (EntityId, EntityTypeId)
, CONSTRAINT [UQ_Left]       UNIQUE NONCLUSTERED ([lft])
, CONSTRAINT [UQ_LeftRight]  UNIQUE NONCLUSTERED ([lft], [rgt])
)
GO

基本树数据如下:

Customer -> Agencies -> Users -> Clients

我们也有管理多个机构的用户,因此使用了外部参照(糟糕的名称)table。我正在与一个拥有 98% 的机构概览的用户进行测试,我需要所有的客户。所以,我的难题:

注意:

这需要4秒才能运行但不能表达为观点:

DECLARE @t TABLE
( childentityid INT
, childentitytypeid INT
)

INSERT INTO @t
SELECT et.RootEntityId, et.RootEntityTypeId
  FROM dbo.EntityXref et
 WHERE et.EntityId = 17088 AND et.EntityTypeId = 7    

SELECT * 
  FROM @t a
 INNER JOIN dbo.GetMyCaseLoad b ON a.RootEntityId = b.ParentEntityId AND a.RootEntityTypeId = b.ParentEntityTypeId
GO

这需要 36-40 秒才能完成 运行(此连接有几个不同的排列!)

WITH xrefParent (parentEntityId, parentEntityTypeId)    --, rootEntityId, rootEntityTypeId)
  AS (SELECT ChildEntityId, ChildEntityTypeId /*, EntityId, EntityTypeId */ FROM dbo.EntityXref WHERE EntityId = 17088 AND EntityTypeId = 7) 
SELECT *
  FROM GetMyCaseLoad cl
 INNER JOIN xrefParent p ON cl.ParentEntityId = p.parentEntityId AND cl.ParentEntityTypeId = p.parentEntityTypeId
-- WHERE p.rootEntityId = 17088 AND p.rootEntityTypeId = 7
GO

关于如何将临时 table 的 好处 转化为供 Entity Framework 使用的视图的任何想法?


添加的定义:

CREATE VIEW GetMyCaseLoad AS
SELECT Parent.Id            [ParentRecordId]
     , Parent.EntityId      [ParentEntityId]
     , Parent.EntityTypeId  [ParentEntityTypeId]
     , Child.SystemId       [ChildSystemId]
     , Child.Id             [ChildRecordId]
     , Child.EntityId       [ChildEntityId]
     , Child.EntityTypeId   [ChildEntityTypeId]
     , Child.isActive       [ChildIsActive]
     , Child.lft            [ChildLeft]
     , Child.rgt            [ChildRight]
  FROM dbo.EntityTree Parent
     , dbo.EntityTree Child
 WHERE Child.lft > Parent.lft
   AND Child.rgt < Parent.rgt
   AND Child.EntityTypeId = 4
GO


CREATE VIEW GetMyFullCaseLoad AS
SELECT x.Id             [XrefRecordId]
     , x.EntityId       [XrefParentEntityId]
     , x.EntityTypeId   [XrefParentEntityTypeId]
     , c.ParentRecordId
     , c.ParentEntityId
     , c.ParentEntityTypeId
     , c.ChildRecordId
     , c.ChildEntityId
     , c.ChildEntityTypeId
     , c.ChildIsActive
     , c.ChildLeft
     , c.ChildRight
     , x.CanRead
     , x.CanWrite 
  FROM EntityXref x
 INNER JOIN dbo.GetMyCaseLoad c ON x.ChildEntityId = c.ParentEntityId AND x.ChildEntityTypeId = c.ParentEntityTypeId
GO

第二个视图是我们正在努力加速的。

旁注:当前系统大约需要 2-3 分钟才能恢复记录。第二个视图或 CTE 基于新的数据结构(邻接树与集合树)在 40 秒内完成。随着温度 table 4 秒。

在 dbo.EntityXref(EntityId, EntityTypeId) 上添加索引?

我猜这是因为这确实是临时 table 唯一的区别,如果您插入临时 table 时它只会 table 扫描一次没有索引。在其他排列中,它可能会变成循环 table 扫描。

唯一比 table 扫描更糟糕的是循环 table 扫描。

CTE 的问题在于它们没有具体化,它们没有专门的统计信息(它们依赖于底层对象的统计信息),它们没有索引(尽管在某些情况下它们可以在引用的对象上使用索引tables).

临时 tables 的优点是它们本质上是具体化的(在 tempdb 中),它们可以有索引(如果你定义它们)并且肯定有专门的统计信息。

在很多情况下,这意味着使用临时 tables 而不是 CTE 可以产生更好的执行计划。使用 CTE 几乎永远不会加快速度,而在很多情况下临时 table 会。

我会服从比我更高的权威,并留下他的名言:

A CTE should never be used for performance. You will almost never speed things up by using a CTE because it's just a disposable view. You can do some neat things with them but speeding up a query isn't really one of them.

这句话是从 accepted answer 到问题 "What's the difference between a CTE and a Temp Table?"

PS:我看到您在第一个查询中使用了 TABLE 变量。这与临时 table 不同。就性能而言,临时 table 几乎总是优于 TABLE 变量。有关 TABLE 变量和临时 table 之间的区别的好文章,请阅读此 accepted answer 关于 "What's the difference between a temp table and table variable in SQL Server?" 的问题。