如何指定决策树的 graphviz 表示形式的 figsize?

How can I specify the figsize of a graphviz representation of a decision tree?

我有一个在鸢尾花数据集上训练的决策树的 GraphViz 表示。

import graphviz 

dot_data = tree.export_graphviz(clf, out_file=None, 
                     feature_names=iris.feature_names,  
                     class_names=iris.target_names,  
                     filled=True, rounded=True,  
                     special_characters=True)

graph = graphviz.Source(dot_data)
graph

我正在使用上面的代码生成 GraphViz 图,但它创建了一个大图。

我想手动控制此图的figzise。我该怎么做?

最初编写自己的函数来修改 DOT 源代码字符串以添加大小属性后,我在 pydotplus.graphviz.Graph documentation:

中偶然发现了这一部分

All the attributes defined in the Graphviz dot language should be supported.

Attributes can be set through the dynamically generated methods:

 set_[attribute name], i.e. set_size, set_fontname

您可以在下面看到使用它的示例。请注意调用函数时的语法,因为 DOT 源代码需要在宽度和高度周围加上双引号。感叹号表示它将强制调整图像大小,直到其中一个维度与指定维度之一相匹配,这似乎只在指定维度大于图形的原始大小时才有意义。

import pydotplus
from sklearn.datasets import load_breast_cancer
from sklearn.tree import DecisionTreeClassifier, export_graphviz

# Load in the dataset from sklearn
dataset = load_breast_cancer()
X = dataset.data
y = dataset.target
col_names = dataset.feature_names

# Create and fit the decision tree
clf_dt = DecisionTreeClassifier(criterion = 'gini', max_depth = 3)
clf_dt.fit(X_train, y_train)

# Export resulting tree to DOT source code string
dot_data = export_graphviz(clf_dt,
                                feature_names=col_names,
                                out_file=None,
                                filled=True,
                                rounded=True)

pydot_graph = pydotplus.graph_from_dot_data(dot_data)
pydot_graph.write_png('original_tree.png')
pydot_graph.set_size('"5,5!"')
pydot_graph.write_png('resized_tree.png')

点击图片了解大小,因为它似乎无法在浏览器中正确显示。

original_tree.png:

resized_tree.png:

另请注意,pydotplus.graphviz.Graph 对象有一个 to_string() 方法,其中 returns 树的 DOT 源代码字符串,也可以与 graphviz.Source 对象一起使用在你的问题中:

import graphviz
gvz_graph = graphviz.Source(pydot_graph.to_string())
gvz_graph