Networkx:如何从 csv 文件创建图边?
Networkx : How to create graph edges from a csv file?
我正在尝试使用 networkx 创建一个图形,到目前为止,我已经从以下文本文件创建了节点:
文件 1(user_id.txt) 示例数据:
user_000001
user_000002
user_000003
user_000004
user_000005
user_000006
user_000007
文件 2(user_country.txt) 样本数据:如果用户没有输入他的国家详细信息,也包含一些空行
Japan
Peru
United States
Bulgaria
Russian Federation
United States
文件 3(user_agegroup.txt) 数据:包含四个年龄组
[12-18],[19-25],[26-32],[33-39]
我还有另外两个文件,其中包含用于在图中添加边的示例数据
文件 4(id,agegroup.txt)
user_000001,[19-25]
user_000002,[19-25]
user_000003,[33-39]
user_000004,[19-25]
user_000005,[19-25]
user_000006,[19-25]
user_000007,[26-32]
文件 5(id,country.txt)
(user_000001,Japan)
(user_000002,Peru)
(user_000003,United States)
(user_000004,)
(user_000005,Bulgaria)
(user_000006,Russian Federation)
(user_000007,United States)
到目前为止,我已经编写了以下代码来绘制仅包含节点的图形:
(请检查代码,因为 print g.number_of_nodes()
从不打印正确的节点数,尽管 print g.nodes()
显示正确的节点数。)
import csv
import networkx as nx
import matplotlib.pyplot as plt
g=nx.Graph()
#extract and add AGE_GROUP nodes in graph
f1 = csv.reader(open("user_agegroup.txt","rb"))
for row in f1:
g.add_nodes_from(row)
nx.draw_circular(g,node_color='blue')
#extract and add COUNTRY nodes in graph
f2 = csv.reader(open('user_country.txt','rb'))
for row in f2:
g.add_nodes_from(row)
nx.draw_circular(g,node_color='red')
#extract and add USER_ID nodes in graph
f3 = csv.reader(open('user_id.txt','rb'))
for row in f3:
g.add_nodes_from(row)
nx.draw_random(g,node_color='yellow')
print g.nodes()
plt.savefig("path.png")
print g.number_of_nodes()
plt.show()
除此之外,我不知道如何从 file4 和 file5 添加边。对此代码的任何帮助表示赞赏。
谢谢。
为了简化,我在 user_id.txt 和 id,country.txt 文件中创建了用户 ID 的 [1,2,3,4,5,6,7]。您的代码有一些问题:
1- 首先向图中添加一些节点(例如来自 user_id.txt 文件)然后绘制它,然后从另一个文件向图中添加一些其他节点然后重新绘制整个图再次出现在同一个图上。所以,最后你在一张图中有很多图。
2- 您使用 draw_circular 方法绘制了两次,这就是蓝色节点从未出现的原因,因为它们被 'red' 节点覆盖。
我对你的代码做了一些修改,最后只画了一次。为了绘制具有所需颜色的节点,我在添加节点时添加了一个名为 colors 的属性。然后我使用这个属性构建了一个颜色图,并将其发送到 draw_networkx 函数。
最后,由于 idcountry.txt 中的空字段,添加边有点棘手,所以我必须在创建图形之前删除空节点。下面是代码和后面出现的图
G=nx.Graph()
#extract and add AGE_GROUP nodes in graph
f1 = csv.reader(open("user_agegroup.txt","rb"))
for row in f1:
G.add_nodes_from(row, color = 'blue')
#extract and add COUNTRY nodes in graph
f2 = csv.reader(open('user_country.txt','rb'))
for row in f2:
G.add_nodes_from(row, color = 'red')
#extract and add USER_ID nodes in graph
f3 = csv.reader(open('user_id.txt','rb'))
for row in f3:
G.add_nodes_from(row, color = 'yellow')
f4 = csv.reader(open('id,agegroup.txt','rb'))
for row in f4:
if len(row) == 2 : # add an edge only if both values are provided
G.add_edge(row[0],row[1])
f5 = csv.reader(open('id,country.txt','rb'))
for row in f5:
if len(row) == 2 : # add an edge only if both values are provided
G.add_edge(row[0],row[1])
# Remove empty nodes
for n in G.nodes():
if n == '':
G.remove_node(n)
# color nodes according to their color attribute
color_map = []
for n in G.nodes():
color_map.append(G.node[n]['color'])
nx.draw_networkx(G, node_color = color_map, with_labels = True, node_size = 500)
plt.savefig("path.png")
plt.show()
您可以使用 for like:
for a,b in df_edges.iterrows():
G.add_edges_from([(b['source'], b['target'])])
我正在尝试使用 networkx 创建一个图形,到目前为止,我已经从以下文本文件创建了节点: 文件 1(user_id.txt) 示例数据:
user_000001
user_000002
user_000003
user_000004
user_000005
user_000006
user_000007
文件 2(user_country.txt) 样本数据:如果用户没有输入他的国家详细信息,也包含一些空行
Japan
Peru
United States
Bulgaria
Russian Federation
United States
文件 3(user_agegroup.txt) 数据:包含四个年龄组
[12-18],[19-25],[26-32],[33-39]
我还有另外两个文件,其中包含用于在图中添加边的示例数据
文件 4(id,agegroup.txt)
user_000001,[19-25]
user_000002,[19-25]
user_000003,[33-39]
user_000004,[19-25]
user_000005,[19-25]
user_000006,[19-25]
user_000007,[26-32]
文件 5(id,country.txt)
(user_000001,Japan)
(user_000002,Peru)
(user_000003,United States)
(user_000004,)
(user_000005,Bulgaria)
(user_000006,Russian Federation)
(user_000007,United States)
到目前为止,我已经编写了以下代码来绘制仅包含节点的图形:
(请检查代码,因为 print g.number_of_nodes()
从不打印正确的节点数,尽管 print g.nodes()
显示正确的节点数。)
import csv
import networkx as nx
import matplotlib.pyplot as plt
g=nx.Graph()
#extract and add AGE_GROUP nodes in graph
f1 = csv.reader(open("user_agegroup.txt","rb"))
for row in f1:
g.add_nodes_from(row)
nx.draw_circular(g,node_color='blue')
#extract and add COUNTRY nodes in graph
f2 = csv.reader(open('user_country.txt','rb'))
for row in f2:
g.add_nodes_from(row)
nx.draw_circular(g,node_color='red')
#extract and add USER_ID nodes in graph
f3 = csv.reader(open('user_id.txt','rb'))
for row in f3:
g.add_nodes_from(row)
nx.draw_random(g,node_color='yellow')
print g.nodes()
plt.savefig("path.png")
print g.number_of_nodes()
plt.show()
除此之外,我不知道如何从 file4 和 file5 添加边。对此代码的任何帮助表示赞赏。 谢谢。
为了简化,我在 user_id.txt 和 id,country.txt 文件中创建了用户 ID 的 [1,2,3,4,5,6,7]。您的代码有一些问题:
1- 首先向图中添加一些节点(例如来自 user_id.txt 文件)然后绘制它,然后从另一个文件向图中添加一些其他节点然后重新绘制整个图再次出现在同一个图上。所以,最后你在一张图中有很多图。
2- 您使用 draw_circular 方法绘制了两次,这就是蓝色节点从未出现的原因,因为它们被 'red' 节点覆盖。
我对你的代码做了一些修改,最后只画了一次。为了绘制具有所需颜色的节点,我在添加节点时添加了一个名为 colors 的属性。然后我使用这个属性构建了一个颜色图,并将其发送到 draw_networkx 函数。 最后,由于 idcountry.txt 中的空字段,添加边有点棘手,所以我必须在创建图形之前删除空节点。下面是代码和后面出现的图
G=nx.Graph()
#extract and add AGE_GROUP nodes in graph
f1 = csv.reader(open("user_agegroup.txt","rb"))
for row in f1:
G.add_nodes_from(row, color = 'blue')
#extract and add COUNTRY nodes in graph
f2 = csv.reader(open('user_country.txt','rb'))
for row in f2:
G.add_nodes_from(row, color = 'red')
#extract and add USER_ID nodes in graph
f3 = csv.reader(open('user_id.txt','rb'))
for row in f3:
G.add_nodes_from(row, color = 'yellow')
f4 = csv.reader(open('id,agegroup.txt','rb'))
for row in f4:
if len(row) == 2 : # add an edge only if both values are provided
G.add_edge(row[0],row[1])
f5 = csv.reader(open('id,country.txt','rb'))
for row in f5:
if len(row) == 2 : # add an edge only if both values are provided
G.add_edge(row[0],row[1])
# Remove empty nodes
for n in G.nodes():
if n == '':
G.remove_node(n)
# color nodes according to their color attribute
color_map = []
for n in G.nodes():
color_map.append(G.node[n]['color'])
nx.draw_networkx(G, node_color = color_map, with_labels = True, node_size = 500)
plt.savefig("path.png")
plt.show()
您可以使用 for like:
for a,b in df_edges.iterrows():
G.add_edges_from([(b['source'], b['target'])])