Python 3 urllib urlparse 网址解析
Python 3 urlib urlparse URI parsing
我有点纳闷。我希望有人能帮助我 =)
Python urlparse 函数结果取决于 URI 中指定的方案。
比如这个调用returns '/path;'
urllib.parse.urlparse('some://foo.bar/path;').path
但是这个调用returns '/path'
urllib.parse.urlparse('http://foo.bar/path;').path
据我了解,第一个变体被解析为 RFC 3986。但第二个变体被解析为 RFC 2396。我说得对吗?以及如何解析 RFC 3986 描述的任何字符串?
如果您不想从路径中拆分参数,请使用 urlsplit
。
urllib.parse.urlsplit('http://foo.bar/path;')
输出
SplitResult(scheme='http', netloc='foo.bar', path='/path;', query='', fragment='')
我有点纳闷。我希望有人能帮助我 =)
Python urlparse 函数结果取决于 URI 中指定的方案。
比如这个调用returns '/path;'
urllib.parse.urlparse('some://foo.bar/path;').path
但是这个调用returns '/path'
urllib.parse.urlparse('http://foo.bar/path;').path
据我了解,第一个变体被解析为 RFC 3986。但第二个变体被解析为 RFC 2396。我说得对吗?以及如何解析 RFC 3986 描述的任何字符串?
如果您不想从路径中拆分参数,请使用 urlsplit
。
urllib.parse.urlsplit('http://foo.bar/path;')
输出
SplitResult(scheme='http', netloc='foo.bar', path='/path;', query='', fragment='')