从 .txt 文件中提取日期
Extracting the date from a .txt file
我有一个 .txt 文件。它包含一些日期。我要找的那个前面有文字:"Date: dd.MM.yy Hour: HH:mm"。我试图通过
来匹配它
matches=re.findall(r'Date:\s\d\d.\d\d.\d{4}\sHour:\s\d\d:\d\d', text)
但我只需要提取特定格式的数字 - "dd.MM.yy HH:mm"。该文件还包含一些其他日期 - 我没有看到另一种匹配它的方法。现在我显然得到 "Date: 28.10.2018 Hour: 11:00".
1) 有没有更好的方法在.txt 文件中搜索?
2) 如何从字符串中提取日期和小时,省略单词?
您应该使用 capture groups 获取您感兴趣的信息:
import re
s = "Date: 11.19.2018 Hour: 15:23"
matches = re.findall(r'Date: (\d{2}\.\d{2}\.\d{4}) Hour: (\d{2}:\d{2})', s)
变量 matches
将包含:
[('11.19.2018', '15:23')]
我有一个 .txt 文件。它包含一些日期。我要找的那个前面有文字:"Date: dd.MM.yy Hour: HH:mm"。我试图通过
来匹配它 matches=re.findall(r'Date:\s\d\d.\d\d.\d{4}\sHour:\s\d\d:\d\d', text)
但我只需要提取特定格式的数字 - "dd.MM.yy HH:mm"。该文件还包含一些其他日期 - 我没有看到另一种匹配它的方法。现在我显然得到 "Date: 28.10.2018 Hour: 11:00".
1) 有没有更好的方法在.txt 文件中搜索?
2) 如何从字符串中提取日期和小时,省略单词?
您应该使用 capture groups 获取您感兴趣的信息:
import re
s = "Date: 11.19.2018 Hour: 15:23"
matches = re.findall(r'Date: (\d{2}\.\d{2}\.\d{4}) Hour: (\d{2}:\d{2})', s)
变量 matches
将包含:
[('11.19.2018', '15:23')]