如何在不导入文件的情况下从 python 文件中获取 类 和函数的列表
How to get a list of classes and functions from a python file without importing it
我有一个 python 文件,其中定义了一些 类 和函数:
class A(object):
def __init__(self, an_arg, a_default_arg=None):
pass
def doStuff(an_other_arg, an_other_default_arg=None):
pass
而且我想获取此文件中所有 类 和函数的列表。 (他们的名字和参数定义就够了)
现在,我知道您可以使用 __import__(module_descriptor)
和 inspect
执行此操作,但这不是一个选项,因为我正在扫描的文件来自不受信任的来源。
我的第一反应是尝试创建一个安全的环境来导入它们,但根据其他 Whosebug 问题,这似乎是不可能的。
除了实际执行文件之外,没有什么可以让您 100% 准确地回答这个问题。 Python 中有太多方法可以动态影响命名空间:从其他地方导入名称、有条件地执行定义、通过修改其 __dict__
直接操纵命名空间等
如果您只能接受静态定义,Python 的 built-in ast
(抽象语法树)模块可能是最简单的解决方案。您可以安全地将文件编译为 AST,然后遍历其顶层以查找 def
和 class
语句。 (在 classes 的情况下,你会走 class body 寻找 def __init__
。不要忘记 class 的可能性没有自己的__init__
,只是从超级class继承了一个!)
您可以使用ast模块来解析源文件,而无需实际执行任何代码。然后可以遍历节点树得到函数和class names/parameters.
import ast
def show_info(functionNode):
print("Function name:", functionNode.name)
print("Args:")
for arg in functionNode.args.args:
#import pdb; pdb.set_trace()
print("\tParameter name:", arg.arg)
filename = "untrusted.py"
with open(filename) as file:
node = ast.parse(file.read())
functions = [n for n in node.body if isinstance(n, ast.FunctionDef)]
classes = [n for n in node.body if isinstance(n, ast.ClassDef)]
for function in functions:
show_info(function)
for class_ in classes:
print("Class name:", class_.name)
methods = [n for n in class_.body if isinstance(n, ast.FunctionDef)]
for method in methods:
show_info(method)
结果:
Function name: doStuff
Args:
Parameter name: an_other_arg
Parameter name: an_other_default_arg
Class name: A
Function name: __init__
Args:
Parameter name: self
Parameter name: an_arg
Parameter name: a_default_arg
接受的解决方案不完整。考虑以下文件:
def regular_function():
def nested_function():
pass
async def async_function():
pass
接受的解决方案只会打印:
Function name: regular_function
Args:
要获得所有功能,我们需要进行两处更改:
- 遍历整个 AST,而不仅仅是顶级节点
- 处理
async
函数以及常规函数
这是更正后的代码,用于查找函数:
import ast
from pathlib import Path
parsed_ast = ast.parse(Path(__file__).read_text())
functions = [
node
for node in ast.walk(parsed_ast)
if isinstance(node, (ast.FunctionDef, ast.AsyncFunctionDef))
]
for function in functions:
print(f"Function name: {function.name}")
print(f"Args: {', '.join([arg.arg for arg in function.args.args])}")
请注意,这超出了 AST 行走的用途范围。对于更复杂的情况,请考虑使用 NodeVisitor
我有一个 python 文件,其中定义了一些 类 和函数:
class A(object):
def __init__(self, an_arg, a_default_arg=None):
pass
def doStuff(an_other_arg, an_other_default_arg=None):
pass
而且我想获取此文件中所有 类 和函数的列表。 (他们的名字和参数定义就够了)
现在,我知道您可以使用 __import__(module_descriptor)
和 inspect
执行此操作,但这不是一个选项,因为我正在扫描的文件来自不受信任的来源。
我的第一反应是尝试创建一个安全的环境来导入它们,但根据其他 Whosebug 问题,这似乎是不可能的。
除了实际执行文件之外,没有什么可以让您 100% 准确地回答这个问题。 Python 中有太多方法可以动态影响命名空间:从其他地方导入名称、有条件地执行定义、通过修改其 __dict__
直接操纵命名空间等
如果您只能接受静态定义,Python 的 built-in ast
(抽象语法树)模块可能是最简单的解决方案。您可以安全地将文件编译为 AST,然后遍历其顶层以查找 def
和 class
语句。 (在 classes 的情况下,你会走 class body 寻找 def __init__
。不要忘记 class 的可能性没有自己的__init__
,只是从超级class继承了一个!)
您可以使用ast模块来解析源文件,而无需实际执行任何代码。然后可以遍历节点树得到函数和class names/parameters.
import ast
def show_info(functionNode):
print("Function name:", functionNode.name)
print("Args:")
for arg in functionNode.args.args:
#import pdb; pdb.set_trace()
print("\tParameter name:", arg.arg)
filename = "untrusted.py"
with open(filename) as file:
node = ast.parse(file.read())
functions = [n for n in node.body if isinstance(n, ast.FunctionDef)]
classes = [n for n in node.body if isinstance(n, ast.ClassDef)]
for function in functions:
show_info(function)
for class_ in classes:
print("Class name:", class_.name)
methods = [n for n in class_.body if isinstance(n, ast.FunctionDef)]
for method in methods:
show_info(method)
结果:
Function name: doStuff
Args:
Parameter name: an_other_arg
Parameter name: an_other_default_arg
Class name: A
Function name: __init__
Args:
Parameter name: self
Parameter name: an_arg
Parameter name: a_default_arg
接受的解决方案不完整。考虑以下文件:
def regular_function():
def nested_function():
pass
async def async_function():
pass
接受的解决方案只会打印:
Function name: regular_function
Args:
要获得所有功能,我们需要进行两处更改:
- 遍历整个 AST,而不仅仅是顶级节点
- 处理
async
函数以及常规函数
这是更正后的代码,用于查找函数:
import ast
from pathlib import Path
parsed_ast = ast.parse(Path(__file__).read_text())
functions = [
node
for node in ast.walk(parsed_ast)
if isinstance(node, (ast.FunctionDef, ast.AsyncFunctionDef))
]
for function in functions:
print(f"Function name: {function.name}")
print(f"Args: {', '.join([arg.arg for arg in function.args.args])}")
请注意,这超出了 AST 行走的用途范围。对于更复杂的情况,请考虑使用 NodeVisitor