如何将日期列添加到平面文件
how to add a date column to a flatfile
我正在访问一个 public 数据集,其格式如下:
projectcode, pagename, pageviews, bytes
文件名如下所示:
pagecounts-20090430-230000.gz
我想处理这个文件,以便文件名中的日期信息在数据文件中...所以我会寻找这样的东西:
date, projectcode, pagename, pageviews, bytes
我想我必须使用 SED 功能?我用它来处理字符串而不是数据文件本身......那该怎么做呢?
提取日期-第一个returns第一个“.”之前的部分,第二个returns第一个“-”之后的部分:
DATEPART=$(echo $FILENAME| cut -d"." -f1| cut -d"-" -f2-)
然后使用 sed 可以替换所有行的开头:
sed -i 's/^/'$DATEPART' /g' $FILENAME
我正在访问一个 public 数据集,其格式如下:
projectcode, pagename, pageviews, bytes
文件名如下所示:
pagecounts-20090430-230000.gz
我想处理这个文件,以便文件名中的日期信息在数据文件中...所以我会寻找这样的东西:
date, projectcode, pagename, pageviews, bytes
我想我必须使用 SED 功能?我用它来处理字符串而不是数据文件本身......那该怎么做呢?
提取日期-第一个returns第一个“.”之前的部分,第二个returns第一个“-”之后的部分:
DATEPART=$(echo $FILENAME| cut -d"." -f1| cut -d"-" -f2-)
然后使用 sed 可以替换所有行的开头:
sed -i 's/^/'$DATEPART' /g' $FILENAME