如何将日期列添加到平面文件

how to add a date column to a flatfile

我正在访问一个 public 数据集,其格式如下:

projectcode, pagename, pageviews, bytes

文件名如下所示:

pagecounts-20090430-230000.gz

我想处理这个文件,以便文件名中的日期信息在数据文件中...所以我会寻找这样的东西:

date, projectcode, pagename, pageviews, bytes

我想我必须使用 SED 功能?我用它来处理字符串而不是数据文件本身......那该怎么做呢?

提取日期-第一个returns第一个“.”之前的部分,第二个returns第一个“-”之后的部分:

DATEPART=$(echo $FILENAME| cut -d"." -f1| cut -d"-" -f2-)

然后使用 sed 可以替换所有行的开头:

sed -i 's/^/'$DATEPART' /g' $FILENAME