此处链接 table 的目的是什么?
What is the Purpose of Links table here?
我正在学习 Python 的 Everybody 专业化课程 5。
我从讲师那里得到了这段代码作为示例。
我无法理解的几件事是链接 table 的确切目的。
cur.execute('''CREATE TABLE IF NOT EXISTS Pages
(id INTEGER PRIMARY KEY , url TEXT UNIQUE, html TEXT,
error INTEGER, old_rank REAL, new_rank REAL)''')
cur.execute('''CREATE TABLE IF NOT EXISTS Links
(from_id INTEGER, to_id INTEGER)''')
cur.execute('''CREATE TABLE IF NOT EXISTS Webs (url TEXT UNIQUE)''')
因为我是编程新手,所以这是我真正需要解决的第一个大作业。
By the way this link to Spider.py
提前致谢
Links table是被抓取的页面之间的连接,并链接从该页面抓取的页面。当然,这不是最好的方法,它可以在很多方面进行改进,因为你是初学者,我不会详细介绍。
例子:
如果您只是在网站的 table 中添加网站 https://example.com,那么该网站也会添加到页面 table 中,因此假设这是您的第一个网站,我们从该网站获得的链接是两个所以链接 table 将存储它并保留它的记录。
链接 table 将是这样的。
1 2
1 3。
这是我通过查看您的代码得到的
我正在学习 Python 的 Everybody 专业化课程 5。 我从讲师那里得到了这段代码作为示例。 我无法理解的几件事是链接 table 的确切目的。
cur.execute('''CREATE TABLE IF NOT EXISTS Pages
(id INTEGER PRIMARY KEY , url TEXT UNIQUE, html TEXT,
error INTEGER, old_rank REAL, new_rank REAL)''')
cur.execute('''CREATE TABLE IF NOT EXISTS Links
(from_id INTEGER, to_id INTEGER)''')
cur.execute('''CREATE TABLE IF NOT EXISTS Webs (url TEXT UNIQUE)''')
因为我是编程新手,所以这是我真正需要解决的第一个大作业。 By the way this link to Spider.py 提前致谢
Links table是被抓取的页面之间的连接,并链接从该页面抓取的页面。当然,这不是最好的方法,它可以在很多方面进行改进,因为你是初学者,我不会详细介绍。 例子: 如果您只是在网站的 table 中添加网站 https://example.com,那么该网站也会添加到页面 table 中,因此假设这是您的第一个网站,我们从该网站获得的链接是两个所以链接 table 将存储它并保留它的记录。 链接 table 将是这样的。 1 2 1 3。 这是我通过查看您的代码得到的