如何使用 python 标记域和子域?

How to labeling domain and subdomain using python?

我正在处理 url 数据,但我无法使用 python

将 url 分类为域和子域

我正在尝试使用正则表达式提取域,但我不知道如何return将其转换为 True 或 False 子域

例如

a = ['facebook.com', 'profile.facebook.com']

我希望结果是

[False, True]

您需要决定对域名的限制有多宽松,休息 可以看起来像:

>>> import re
>>> a = re.compile('[0-9a-z\.]*\.[0-9a-z]*\.com')
>>> bool(a.match('facebook.com'))
False
>>> bool(a.match('sub.facebook.com'))
True

这里我假设域将和 .com 但你可以很容易地改变它。