如何从 vcrpy 二进制响应字符串中提取未压缩的文本？

Question

我正在使用 vcrpy 对我的应用程序进行自动 http 模拟测试。这很好用。然而，我的模拟包括编码 'gzip' 和 'deflate'，这意味着 vcrpy 记录响应是二进制格式。这是一个例子：

interactions:
- request:
    body: null
    headers:
      Accept: ['*/*']
      Accept-Encoding: ['gzip, deflate']
      Authorization: [Basic Y2hlc3RlcjpiYWRnZXI=]
      Connection: [keep-alive]
      User-Agent: [python-requests/2.9.1]
    method: GET
    uri: http://localhost:8153/go/compare/DeployProduction/14/with/15
  response:
    body:
      string: !!binary |
        H4sIAAAAAAAAAO08bXPbNpPf8ytQ9q6yp+Y7KZGKrU7quG1mEscXO7276XQ0IAlKjCmCQ0KW9TxP
        /vstAJIiJUpxkkvS3tmTiSRisVjsG3YXIE6/e/76/Oa/ry7QbzevXk6enM7ZIkX3izQrz5Q5Y/lY
        11erlbayNVrMdNP3ff2ewygcluBo8gTB3ylLWErk93O6yHFB0FWSkzTJSImu8IwgFf1Kn5zqFeCT
        U2i6RREJlrMzJcZpSRQ0L0h8pugzquOyJKzUcZ6nSYhZQjPVCG0PE9saObHthJbjE2L79tCPhhY2
        ImxZlhEH2Hbt0PB8NyCBZ8RO6NsksoZDi1haWJYKWpAowWcKTlMFFSQ9U0q2Tkk5J4QpSJ88jKwc
        M0aKrEtf6EeBEYXG0ByFERmR2A9sO8CmPzR8LyAYEyOwwpHj48COseOaLgmsUehiHAxjOzYfRt+T
        0+9UFV3fPHtzM0Z5QRll65ygOaW3JYppgQALSrJ3JOREIVWtu1xcPn94hzIskpxtsaEswr3CCYwA
        pjUMh8Qf+iZIY2hGpu063iiyTOyDUPxRbFrRyPJHxHRBIiChKIij2LfMUWxo70plcqrLcUEK3/2R

（省略附加输出）

我读过 decompressing zlib，但它没有解决二进制 yaml 的解码问题。

为了查看原文和验证测试结果，如何将这些二进制字符串转换成它们的原始格式？

Answer 1

yaml 文件中的主体字符串是 base64 编码的，但是当您加载它时，您将获得原始字节流。如果您好奇，请阅读 how to decode a base64 string，尽管这不是必需的。

如果前三个字节是 \x1f\x8b\x08，您就知道您拥有一个 gzip 字节流。如果你想手动解码，请阅读 here，但 vcr 有一个包装方法，它也会在解码正文后更新一些头信息。这个函数是vcr.filters.decode_response().

为了举例说明这一点，我将使用文件 \tests\fixtures\wild\domain_redirect.yaml。有两个交互，其中第二个包含编码数据。

import yaml
from vcr.filters import decode_response 

with open('domain_redirect.yaml', 'r') as f:
    doc = yaml.load(f)

response = doc['interactions'][1]['response']
decoded = decode_response(response)
print(decoded['body']['string'])

如何从 vcrpy 二进制响应字符串中提取未压缩的文本？

How can I extract the uncompressed text from vcrpy binary response strings?

python

yaml

mocking