如何在 python 中将文本文件打开为字符矩阵?

How to open a text file as a character matrix in python?

我有一个 .fa 文件,其中包含核苷酸序列列表。是这样的

AGCTAGAGAGACTAGACTAGA

GATCAGTACATGATCTAGGAT

GATAGTACATGGGGGATAGAC

我需要以某种方式打开 python 中的文件并制作一个 2-dim 数组,其中包含 .fa 文件的行和每列中的文件字母。感谢您的帮助!!!!

如果您有兴趣让矩阵成为列表的列表,您可以通过列表理解轻松地做到这一点。

with open("myfile.fa","rt") as infile:
    matrix = [list(line.strip()) for line in infile.readlines()]
    print matrix

另一方面,如果您希望有一个 numpy 矩阵(请注意,这需要您安装 numpy):

import numpy

with open("myfile.fa","rt") as infile:
    matrix =  numpy.matrix([list(line.strip()) for line in infile.readlines()])
    print matrix