如何对 Python 中的原始二进制数据使用按位运算符进行 CRC 检查?

How to use bitwise operators on raw binary data in Python for a CRC check?

这是我第一次在 Python 中使用按位运算符和原始二进制数据,我正在努力编写文档中定义的 CRC 检查代码。

文档在如下伪代码中定义了 CRC 校验:

GENERATOR = 1111111111111010000001001

MSG = binary("8D4840D6202CC371C32CE0576098")  # total 112 bits

FOR i FROM 0 TO 88:                           # 112 - 24 parity bits
  if MSG[i] is 1:
    MSG[i:i+24] = MSG[i:i+24] ^ GENERATOR

CRC = MSG[-24:]                               # last 24 bits

IF CRC not 0:
  MSG is corrupted

到目前为止,我已经编写了以下代码:

adsb_hex = "8D4840D6202CC371C32CE0576098"
adsb_dec = int(adsb_hex, 16)
adsb_bin = bin(adsb_dec)[2:].zfill(8)

generator = 0b1111111111111010000001001

adsb_bin_list = [int((adsb_dec >> bit) & 1) for bit in range(112 - 1, -1, -1)]

check = []
for i in range(88):
    curr_bit = adsb_bin_list[i]
    if curr_bit is 1:
        check[i:i+24] = int(adsb_bin_list[i:i+24]) ^ generator

crc = check[-24:]

我不知道 Pythonic 的正确方法:

MSG[i:i+24] = MSG[i:i+24] ^ GENERATOR

CRC = MSG[-24:]

我怎样才能正确地做到这一点,Pythonic 方式?

这里有一个你可以采用的更 pythonic 的方法,尽管它放弃了直接位算法。

msg_hex = "8D4840D6202CC371C32CE0576098"
msg_dec = int(msg_hex, 16)
msg_bin = list(bin(msg_dec)[2:].zfill(8))

generator = "1111111111111010000001001"

for i in range(88):
    if msg_bin[i] == "1":
        msg_bin[i:i+24] = ["1" if a != b else "0" for a, b in zip(msg_bin[i:i+24], generator)]

if int("".join(msg_bin[-24:])):
    print("corrupted")

如果你愿意,你可以用 "01"[a!=b] 替换 "1" if a != b else "0",但我认为前者更像 pythonic。

我无法验证此解决方案是否正确,因为您的代码无法编译并且没有提及给定的生成器和消息应该产生什么。我确实怀疑问题陈述中有错误,因为它正在检查最后 24 位,但生成器包含 25.

如果您可以使用图书馆,我建议搜索您最喜欢的 bitstring/bitvector 图书馆。例如,使用 BitVector==3.4.8 你可以写

from BitVector import BitVector

generator = BitVector(bitstring='1111111111111010000001001')
crc_length = len(generator) - 1

def compute_crc(message : BitVector) -> BitVector:
    content_length = len(message) - crc_length
    # to encode a message, you pad it with 0
    # to decode, you pass in the message with the crc appended
    assert content_length >= 0
    # operate on a copy of the data
    message = message.deep_copy()
    for i in range(content_length):
        if message[i]:
            message[i:i + len(generator)] ^= generator
    return message[-crc_length:]

if __name__ == "__main__":
    adsb_hex = "8D4840D6202CC371C32CE0576098"
    adsb_crc = compute_crc(BitVector(hexstring = adsb_hex))