Python-请求,从字符串中提取url参数
Python-Requests, extract url parameters from a string
我正在使用这个名为 requests
的很棒的库来保持 python 2 和 3 兼容性并简化我的应用程序请求管理。
我有一个案例需要解析 url 并替换其中一个参数。例如:
http://example.com?param1=a&token=TOKEN_TO_REPLACE¶m2=c
我想得到这个:
http://example.com?param1=a&token=NEW_TOKEN¶m2=c
有了 urllib
我可以这样实现:
from urllib.parse import urlparse
from urllib.parse import parse_qs
from urllib.parse import urlencode
url = 'http://example.com?param1=a&token=TOKEN_TO_REPLACE¶m2=c'
o = urlparse(url)
query = parse_qs(o.query)
if query.get('token'):
query['token'] = ['NEW_TOKEN', ]
new_query = urlencode(query, doseq=True)
url.split('?')[0] + '?' + new_query
>>> http://example.com?param2=c¶m1=a&token=NEW_TOKEN
如何使用 requests
库实现同样的效果?
您不能为此使用 requests
;库 构建 这样的 URLs 如果为参数传递了 Python 结构,但不提供任何工具来解析它们。这不是该项目的目标。
坚持urllib.parse
方法解析出参数。一旦你有了字典或键值元组列表,只需将其传递给 requests
以再次构建 URL:
try:
# Python 3
from urllib.parse import urlparse, parse_qs
except ImportError:
# Python 2
from urlparse import urlparse, parse_qs
o = urlparse(url)
query = parse_qs(o.query)
# extract the URL without query parameters
url = o._replace(query=None).geturl()
if 'token' in query:
query['token'] = 'NEW_TOKEN'
requests.get(url, params=query)
Python2和3中的urlparse
和parse_qs
函数都可以得到,如果出现异常,只需要调整导入位置即可。
Python 3 上的演示(没有导入异常保护)以演示 URL 已构建:
>>> from urllib.parse import urlparse, parse_qs
>>> url = "http://httpbin.org/get?token=TOKEN_TO_REPLACE¶m2=c"
>>> o = urlparse(url)
>>> query = parse_qs(o.query)
>>> url = o._replace(query=None).geturl()
>>> if 'token' in query:
... query['token'] = 'NEW_TOKEN'
...
>>> response = requests.get(url, params=query)
>>> print(response.text)
{
"args": {
"param2": "c",
"token": "NEW_TOKEN"
},
"headers": {
"Accept": "*/*",
"Accept-Encoding": "gzip, deflate",
"Host": "httpbin.org",
"User-Agent": "python-requests/2.5.1 CPython/3.4.2 Darwin/14.1.0"
},
"origin": "188.29.165.245",
"url": "http://httpbin.org/get?token=NEW_TOKEN¶m2=c"
}
仅使用 requests
:
query = requests.utils.urlparse(url).query
params = dict(x.split('=') for x in query.split('&'))
if 'token' in params:
params['token'] = 'NEW_TOKEN'
requests.get(url, params=params)
我正在使用这个名为 requests
的很棒的库来保持 python 2 和 3 兼容性并简化我的应用程序请求管理。
我有一个案例需要解析 url 并替换其中一个参数。例如:
http://example.com?param1=a&token=TOKEN_TO_REPLACE¶m2=c
我想得到这个:
http://example.com?param1=a&token=NEW_TOKEN¶m2=c
有了 urllib
我可以这样实现:
from urllib.parse import urlparse
from urllib.parse import parse_qs
from urllib.parse import urlencode
url = 'http://example.com?param1=a&token=TOKEN_TO_REPLACE¶m2=c'
o = urlparse(url)
query = parse_qs(o.query)
if query.get('token'):
query['token'] = ['NEW_TOKEN', ]
new_query = urlencode(query, doseq=True)
url.split('?')[0] + '?' + new_query
>>> http://example.com?param2=c¶m1=a&token=NEW_TOKEN
如何使用 requests
库实现同样的效果?
您不能为此使用 requests
;库 构建 这样的 URLs 如果为参数传递了 Python 结构,但不提供任何工具来解析它们。这不是该项目的目标。
坚持urllib.parse
方法解析出参数。一旦你有了字典或键值元组列表,只需将其传递给 requests
以再次构建 URL:
try:
# Python 3
from urllib.parse import urlparse, parse_qs
except ImportError:
# Python 2
from urlparse import urlparse, parse_qs
o = urlparse(url)
query = parse_qs(o.query)
# extract the URL without query parameters
url = o._replace(query=None).geturl()
if 'token' in query:
query['token'] = 'NEW_TOKEN'
requests.get(url, params=query)
Python2和3中的urlparse
和parse_qs
函数都可以得到,如果出现异常,只需要调整导入位置即可。
Python 3 上的演示(没有导入异常保护)以演示 URL 已构建:
>>> from urllib.parse import urlparse, parse_qs
>>> url = "http://httpbin.org/get?token=TOKEN_TO_REPLACE¶m2=c"
>>> o = urlparse(url)
>>> query = parse_qs(o.query)
>>> url = o._replace(query=None).geturl()
>>> if 'token' in query:
... query['token'] = 'NEW_TOKEN'
...
>>> response = requests.get(url, params=query)
>>> print(response.text)
{
"args": {
"param2": "c",
"token": "NEW_TOKEN"
},
"headers": {
"Accept": "*/*",
"Accept-Encoding": "gzip, deflate",
"Host": "httpbin.org",
"User-Agent": "python-requests/2.5.1 CPython/3.4.2 Darwin/14.1.0"
},
"origin": "188.29.165.245",
"url": "http://httpbin.org/get?token=NEW_TOKEN¶m2=c"
}
仅使用 requests
:
query = requests.utils.urlparse(url).query
params = dict(x.split('=') for x in query.split('&'))
if 'token' in params:
params['token'] = 'NEW_TOKEN'
requests.get(url, params=params)