python- 有效地将纬度从 ddmm.ssss 转换为度数

python- Efficiently converting latitude from ddmm.ssss to degrees

我正在将文本文件转换为 netCDF 格式。我正在将文本文件中的数据读入一个数据框中,其中两列是 latitude_GPS 和 longitude_GPS。输入看起来像:

latitude_GPS, longitude_GPS
7537.4536, 3558.4985
7672.1534, 3214.9532

它们以 ddmm.ssss 单位测量,这意味着如果我们有像 7537.4536 这样的值,这里“75”是度数,“37”是分钟,“4536”是秒。我想将它们转换为小数度数,但缺失值的值为 999.0
我当前的代码如下所示:

header_rows = 1

df = pd.read_csv(args.input_file, delim_whitespace=True, skiprows=header_rows, skip_blank_lines=True, names = column_names)

num_rows = sum(1 for line in open(args.input_file) if len(line.strip()) != 0) - header_rows

def lat_lon_gps(col_index):
    return ((int(col_index)/100) + round((int(col_index%100))/60, 4) + round(round(col_index%1, 4)/3600, 4))

check_na = 999.0

i = 0
while i < num_rows:
    if df['latitude_GPS'][i] != check_na:
        df['latitude_GPS'][i] = lat_lon_gps(df['latitude_GPS'][i])

    if df['longitude_GPS'][i] != check_na:
        df['longitude_GPS'][i] = lat_lon_gps(df['longitude_GPS'][i])

return 部分计算 (75 + 37/60 + 4536/3600)。上面的代码 return 是我想要的,但是对于一个有 10000 行的文件,运行 这部分代码需要大约 50 分钟。有没有更快的方法来做到这一点。如有任何想法,我们将不胜感激。

问题是您要遍历每一行。您应该利用 pandas 和 numpy.

提供的矢量化

例如:

import numpy as np
import pandas as pd

df = pd.read_csv(args.input_file,
                 names=['latitude_GPS','longitude_GPS'],
                 skiprows=1)
check_na = 999.0

def lat_lon_gps(coords):
    deg = np.floor(coords / 100)
    minutes = np.floor(((coords / 100) - deg) * 100)
    seconds = (((coords / 100) - deg) * 100 - minutes) * 100
    return deg + minutes / 60 + seconds / 3600

# Exclude NAs
logic = df.latitude_GPS != check_na
df = df[logic]

df.latitude_GPS = lat_lon_gps(df.latitude_GPS)
df.longitude_GPS = lat_lon_gps(df.longitude_GPS)