对分子 RDKit 应用反应的消毒错误

Sanitization error applying reaction to molecule RDKit

对具有楔形键的分子应用反应时出现消毒错误。 我在对分子应用质子去除反应时遇到此错误,但我在 MolBlock 信息中没有看到任何错误。

这是一个反应问题,在这个问题中,我试图对给定同分异构体 SMILES 的分子应用一个简单的反应(质子去除)。

我创建了一个函数来使用 SMARTS 和 SMILES 应用反应,但我收到以下无法修复的错误。

我正在使用以下代码加载我的输入。

smile = rdkit.Chem.rdmolfiles.MolToSmiles(mol,isomericSmiles=True)

这导致:

C/C1=C\C[C@@H]([C+](C)C)CC/C(C)=C/CC1

我创建了以下字典来使用我的 SMILES 和 SMARTS:

reaction_smarts = {}

# proton removal reaction

reaction_smarts["proton_removal"] = "[Ch:1]-[C+1:2]>>[C:1]=[C+0:2].[H+]" 

reactions = {name: AllChem.ReactionFromSmarts(reaction_smarts[name])      for name in reaction_smarts}

# function to run reactions

def run_reaction(molecule, reaction):
    products = []
    for product in reaction.RunReactant(molecule, 0):
        Chem.SanitizeMol(product[0])
        products.append(product[0])
    return products

# apply reaction


products = run_reaction(cation_to_rdkit_mol["mol_name"],  reactions["proton_removal"])

在这一步我遇到了这个错误,但我无法修复它。 RDKit ERROR: [10:43:23] Explicit valence for atom # 0 C, 5, is greater than permitted

预期结果应该是带有双键的分子及其立体异构体:

第一个产品:CC(C)=C1C/C=C(\C)CC/C=C(\C)CC1

第二个产品:C=C(C)[C@@H]1C/C=C(\C)CC/C=C(\C)CC1

第三个产品:C=C(C)[C@H]1C/C=C(\C)CC/C=C(\C)CC1

我正在使用 Chem.EnumerateStereoisomers.EnumerateStereoisomers() 来获取所有立体异构体,但我只获取了第一个和第二个产品。我还添加了您的初始提案 product[0].GetAtomWithIdx(0).SetNumExplicitHs(0),它实际上修复了显式价错误。但现在我正试图弄清楚如何获得所有这三种立体异构体。

任何提示为什么会发生这种情况?因为如果我用所有关于化合价的信息检查 mol 块,它似乎没问题。

错误表明原子 0(碳)的显式化合价为 5,这表明显式氢尚未被移除,尽管该键现在是双键,因此化合价为 5。我我对 Reaction SMARTS 不太熟悉,尽管手动修复此问题的一种简单方法是在清理之前将原子 0 上显式氢的数量设置为 0:

product.GetAtomWithIdx(0).SetNumExplicitHs(0)
Chem.SanitizeMol(product)

编辑 1: 从头开始,我做了一些实验,试试这个反应:

rxn = AllChem.ReactionFromSmarts('[#6@@H:1]-[#6+:2] >> [#6H0:1]=[#6+0:2]')

通过这种方式,在反应定义中我们明确指出氢气丢失并且生成的分子将被消毒。这对你有用吗?

编辑 2: 当我运行这个反应时产物似乎不含有阳离子:

mol = Chem.MolFromSmiles('C/C1=C\C[C@@H]([C+](C)C)CC/C(C)=C/CC1')
rxn  = AllChem.ReactionFromSmarts('[#6@@H:1]-[#6+:2] >> [#6H0:1]=[#6+0:2]')
products = list()
for product in rxn.RunReactant(mol, 0):
    Chem.SanitizeMol(product[0])
    products.append(product[0])
print(Chem.MolToSmiles(products[0]))

Output:
'CC(C)=C1C/C=C(\C)CC/C=C(\C)CC1'

编辑 3: 我想我现在明白你在找什么了:

mol = Chem.MolFromSmiles('C/C1=C\C[C@@H]([C+](C)C)CC/C(C)=C/CC1')

# Reactant SMARTS
reactant_smarts = '[CH3:1][C+:2][C@@H:3]'

# Product SMARTS
product_smarts = [
'[CH2:1]=[CH0+0:2][CH:3]',
'[CH2:1]=[CH0+0:2][C@H:3]',
'[CH2:1]=[CH0+0:2][C@@H:3]',
]

# Reaction SMARTS
reaction_smarts = str(reactant_smarts + '>>' + '.'.join(product_smarts))

# RDKit Reaction
rxn = AllChem.ReactionFromSmarts(reaction_smarts)

# Get Products
results = list()
for products in rxn.RunReactant(mol, 0):
    for product in products:
        Chem.SanitizeMol(product)
        results.append(product)
        print(Chem.MolToSmiles(product))

Output:
'C=C(C)C1C/C=C(\C)CC/C=C(\C)CC1'
'C=C(C)[C@H]1C/C=C(\C)CC/C=C(\C)CC1'
'C=C(C)[C@@H]1C/C=C(\C)CC/C=C(\C)CC1'
'C=C(C)C1C/C=C(\C)CC/C=C(\C)CC1'
'C=C(C)[C@H]1C/C=C(\C)CC/C=C(\C)CC1'
'C=C(C)[C@@H]1C/C=C(\C)CC/C=C(\C)CC1'

请注意,我们两次得到相同的产物,我认为这是因为反应物 SMARTS 匹配两个 CH3 基团,因此反应适用于两者。我希望这就是您要找的。