即使 pdb 退出,Biopython 也无法下载文件
Biopython can't download file even if pdb exits
我正在尝试将 biopython 与 python3 一起使用以自动下载 pdb。但是,对于一些 pdb,我遇到了 404 错误的问题。
urllib.error.HTTPError: HTTP Error 404: Not Found
一个它不起作用但应该起作用的例子是:4YUU
pdb 文件存在于数据库中,我看不出与下载的 pdbs biopython 有任何区别。任何帮助将不胜感激。
使用代码:
import Bio
from Bio.PDB import PDBList
pdbl=PDBList()
pdbl.retrieve_pdb_file('4YUU')
4YUU 的 PDF 格式文件确实不存在,转到 http://www.rcsb.org/pdb/explore/explore.do?structureId=4YUU 4YUU(Crystal 来自红藻的产氧光系统 II 的结构),并在 "Display Files" 和 "Download Files" 菜单 PDB 格式条目显示为灰色。
如果不进一步研究,我猜这是一个非常大的蛋白质,或者有其他东西无法在基于旧文本的 PDB 文件格式中表示。
尝试通过网站下载 PDBx/mmCIF 文件,Biopython 应该能够解析该文件。
请注意,Biopython 的下一个版本(将是 Biopython 1.69)更改了 PDBList 下载代码以支持此功能。
我正在尝试将 biopython 与 python3 一起使用以自动下载 pdb。但是,对于一些 pdb,我遇到了 404 错误的问题。
urllib.error.HTTPError: HTTP Error 404: Not Found
一个它不起作用但应该起作用的例子是:4YUU pdb 文件存在于数据库中,我看不出与下载的 pdbs biopython 有任何区别。任何帮助将不胜感激。
使用代码:
import Bio
from Bio.PDB import PDBList
pdbl=PDBList()
pdbl.retrieve_pdb_file('4YUU')
4YUU 的 PDF 格式文件确实不存在,转到 http://www.rcsb.org/pdb/explore/explore.do?structureId=4YUU 4YUU(Crystal 来自红藻的产氧光系统 II 的结构),并在 "Display Files" 和 "Download Files" 菜单 PDB 格式条目显示为灰色。
如果不进一步研究,我猜这是一个非常大的蛋白质,或者有其他东西无法在基于旧文本的 PDB 文件格式中表示。
尝试通过网站下载 PDBx/mmCIF 文件,Biopython 应该能够解析该文件。
请注意,Biopython 的下一个版本(将是 Biopython 1.69)更改了 PDBList 下载代码以支持此功能。