混淆使用具有 class 继承的 Mypy - 列表与序列

Confusion with using Mypy with class inheritance - List vs Sequence

请原谅我的困惑 - 我刚开始使用打字并尝试将它与 mypy 一起用于检查。 看起来 problem/question 我似乎已经开始大量使用打字和 Mypy 的人。

问题

我正在尝试定义数据的抽象组合类,它将被子类化为具体的类以添加额外的数据。

因此,我尝试以简化形式执行以下操作:

from dataclasses import dataclass
from typing import List

@dataclass
class TestResultImage:
    base_var_a: int 


@dataclass
class TestSeries:
    imgs: List[TestResultImage]

# --- concrete instances -------

@dataclass
class SpecificImageType1(TestResultImage):
    specific_var_b: float
    specific_var_c: int 


@dataclass
class SpecificSeries(TestSeries):
    imgs: List[SpecificImageType1]

Mypy 执行上述操作失败并出现错误\

error: Incompatible types in assignment (expression has type "List[SpecificImageType1]", base class "TestSeries" defined the type as "List[TestResultImage]")
note: "List" is invariant -- see http://mypy.readthedocs.io/en/latest/common_issues.html#variance
note: Consider using "Sequence" instead, which is covariant

修复

将 {List} 更改为 {Sequence} 解决了问题 - 如错误中所述。

问题

我已经看到不少 SO 和 Mypy git 与此问题相关的问题和人们的困惑。

所以我去尝试尽可能多地阅读 Mypy 文档。

但它仍然是 - 恕我直言 - 为什么 List 在你子类化时会出现问题。 ...或者可能对为什么 'List is invariant, but Sequence is covariant'.

感到困惑

所以我想问,也许代表像我这样尝试真正使用打字的人,所以 Mypy,除了微不足道的例子之外 - 是否有关于 List 有问题的原因的任何好的解释,以及任何地方的一些例子?

假设我们将以下内容添加到您的原始代码中:

def check_specific_images(imgs: List[SpecificImageType1]) -> None:
    for img in imgs:
        print(img.specific_var_b)

def modify_series(series: TestSeries) -> None:
    series.append(TestResultImage(1))

specific = SpecificTestSeries(imgs=[
    SpecificImageType1(1, 2.0, 3),
    SpecificImageType1(4, 5.0, 6),
])

modify_series(specific)
check_specific_images(specific.imgs)

这个程序表面上应该进行类型检查:specific 是 TestSeries 的一个实例,因此 modify_series(specific) 是合法的。同样,specific.imgs 是 List[SpecificImageType1] 类型,所以 check_specific_images(specific.imgs) 也是合法的。

但是,如果我们真的尝试 运行 这个程序,我们会在调用 check_specific_images 时得到一个运行时错误! modify_series 向我们的列表 [SpecificImageType1] 添加了一个 TestResultImage 对象,导致随后对 check_specific_images 的调用在运行时崩溃。

这个问题从根本上解释了为什么 mypy(或几乎任何其他健全的类型系统)不会让 List[SpecificImageType1] 被视为 List[TestResultImage] 的子类型。为了使一种类型成为另一种类型的有效子类型,应该可以在需要父类型的任何位置安全地使用子类型。这对于列表来说是不正确的。

为什么?因为列表支持写操作。将 TestResultImage(或 TestResultImage 的任何子类型)插入到 List[TestResultImage] 中应该始终是安全的,而对于 List[SpecificImageType1].

则不是这样

因此,如果问题是列表是可变的,那么如果我们改为使用不可变的类型——仅支持读取操作,会怎样?这会让我们完全回避这个问题。

这正是 Sequence 的本质:它是一种包含列表支持的所有只读方法的类型(并且是 List 的超类型)。


更广泛地说,假设我们有某种泛型类型 Wrapper[T] 以及两个 classes Parent 和 Child,其中 Child 是 Parent 的子类型。

这就提出了一个问题:Wrapper[Parent] 与 Wrapper[Child] 有什么关系?

对此有四种可能的答案:

  • Wrapper 是 协变的:Wrapper[Child] 是 Wrapper[Parent] 的子类型。

  • Wrapper 是逆变:Wrapper[Parent] 是Wrapper[Child] 的子类型。

  • Wrapper 是 不变的:Wrapper[Parent] 和 Wrapper[Child] 彼此无关,也不是对方的子类型。

  • Wrapper 是双变量:Wrapper[Parent] 是 Wrapper[Child] 的子类型 and Wrapper[Child ] 是 Wrapper[Parent].

  • 的子类型

当您定义 Wrapper[T] 时,mypy 会让您选择您希望该类型是协变的、逆变的还是不变的。做出选择后,mypy 将执行以下规则:

  1. 如果 class 是协变的,它只能支持对 T 的读取操作。实际上,这意味着您不能定义接受任何类型 T 的方法。
  2. 如果 class 是逆变的,它只能支持对 T 的写操作。实际上,这意味着您不能定义 return 任何类型 T 的方法。
  3. 如果一个class是不变的,它可以同时支持对T的读和写操作。你可以定义什么类型的方法没有限制。

Mypy 不允许您创建双变类型:这种类型唯一安全的情况是它支持 既不 对 T 的读或写操作——这会毫无意义。

您通常只在编程中看到双变类型 languages/type 有意使泛型尽可能简单的系统,即使这意味着让用户将如上所示的错误引入他们的程序。

这里的高级直觉是支持对 T 的读取操作或写入操作将限制 Wrapper[Parent] 与 Wrapper[Child] 的关系——如果您支持这两种操作,则组合约束最终会使这两种类型完全无关。