如何使用 python 标记域和子域?
How to labeling domain and subdomain using python?
我正在处理 url 数据,但我无法使用 python
将 url 分类为域和子域
我正在尝试使用正则表达式提取域,但我不知道如何return将其转换为 True 或 False 子域
例如
a = ['facebook.com', 'profile.facebook.com']
我希望结果是
[False, True]
您需要决定对域名的限制有多宽松,休息
可以看起来像:
>>> import re
>>> a = re.compile('[0-9a-z\.]*\.[0-9a-z]*\.com')
>>> bool(a.match('facebook.com'))
False
>>> bool(a.match('sub.facebook.com'))
True
这里我假设域将和 .com
但你可以很容易地改变它。
我正在处理 url 数据,但我无法使用 python
将 url 分类为域和子域我正在尝试使用正则表达式提取域,但我不知道如何return将其转换为 True 或 False 子域
例如
a = ['facebook.com', 'profile.facebook.com']
我希望结果是
[False, True]
您需要决定对域名的限制有多宽松,休息 可以看起来像:
>>> import re
>>> a = re.compile('[0-9a-z\.]*\.[0-9a-z]*\.com')
>>> bool(a.match('facebook.com'))
False
>>> bool(a.match('sub.facebook.com'))
True
这里我假设域将和 .com
但你可以很容易地改变它。