如何在不导入文件的情况下从 python 文件中获取 类 和函数的列表

How to get a list of classes and functions from a python file without importing it

我有一个 python 文件,其中定义了一些 类 和函数:

class A(object):
    def __init__(self, an_arg, a_default_arg=None):
        pass

def doStuff(an_other_arg, an_other_default_arg=None):
    pass

而且我想获取此文件中所有 类 和函数的列表。 (他们的名字和参数定义就够了)

现在,我知道您可以使用 __import__(module_descriptor)inspect 执行此操作,但这不是一个选项,因为我正在扫描的文件来自不受信任的来源。

我的第一反应是尝试创建一个安全的环境来导入它们,但根据其他 Whosebug 问题,这似乎是不可能的。

除了实际执行文件之外,没有什么可以让您 100% 准确地回答这个问题。 Python 中有太多方法可以动态影响命名空间:从其他地方导入名称、有条件地执行定义、通过修改其 __dict__ 直接操纵命名空间等

如果您只能接受静态定义,Python 的 built-in ast(抽象语法树)模块可能是最简单的解决方案。您可以安全地将文件编译为 AST,然后遍历其顶层以查找 defclass 语句。 (在 classes 的情况下,你会走 class body 寻找 def __init__。不要忘记 class 的可能性没有自己的__init__,只是从超级class继承了一个!)

您可以使用ast模块来解析源文件,而无需实际执行任何代码。然后可以遍历节点树得到函数和class names/parameters.

import ast

def show_info(functionNode):
    print("Function name:", functionNode.name)
    print("Args:")
    for arg in functionNode.args.args:
        #import pdb; pdb.set_trace()
        print("\tParameter name:", arg.arg)


filename = "untrusted.py"
with open(filename) as file:
    node = ast.parse(file.read())

functions = [n for n in node.body if isinstance(n, ast.FunctionDef)]
classes = [n for n in node.body if isinstance(n, ast.ClassDef)]

for function in functions:
    show_info(function)

for class_ in classes:
    print("Class name:", class_.name)
    methods = [n for n in class_.body if isinstance(n, ast.FunctionDef)]
    for method in methods:
        show_info(method)

结果:

Function name: doStuff
Args:
        Parameter name: an_other_arg
        Parameter name: an_other_default_arg
Class name: A
Function name: __init__
Args:
        Parameter name: self
        Parameter name: an_arg
        Parameter name: a_default_arg

接受的解决方案不完整。考虑以下文件:

def regular_function():
    def nested_function():
        pass

async def async_function():
    pass

接受的解决方案只会打印:

Function name: regular_function
Args:

要获得所有功能,我们需要进行两处更改:

  1. 遍历整个 AST,而不仅仅是顶级节点
  2. 处理 async 函数以及常规函数

这是更正后的代码,用于查找函数:

import ast

from pathlib import Path

parsed_ast = ast.parse(Path(__file__).read_text())

functions = [
    node
    for node in ast.walk(parsed_ast)
    if isinstance(node, (ast.FunctionDef, ast.AsyncFunctionDef))
]

for function in functions:
    print(f"Function name: {function.name}")
    print(f"Args: {', '.join([arg.arg for arg in function.args.args])}")

请注意,这超出了 AST 行走的用途范围。对于更复杂的情况,请考虑使用 NodeVisitor