在线求教awk的一个问题,关于FS和RS!
有一段文本的格式是:
19980101-01-001-001/m 文本
19980101-01-001-002/m 文本
19980101-01-001-003/m 文本
19980101-01-001-004/m 文本
19980101-01-002-001/m 文本
19980101-01-002-002/m 文本
19980101-02-001-001/m 文本
19980101-02-001-002/m 文本
19980101-02-001-003/m 文本
……
我希望将每段文本单独提取出来存放在一个文件内,段与段之间是用空行分隔的。
最开始我设置的FS=“\N”,RS=“”,按照书上所述RS=“”是以空行来分隔一个记录的,也就是能将上面的文本一段一段的分离出来。但是结果并不是这样的,我的脚本是这样写的:
FILENAME=".txt"
BEGIN
{
FS = "\n";
RS = "";
}
{
FILENAME = NR FILENAME
for(i = 1; i <= NF; i++)
{
print $i >> FILENAME;
}
}
执行命令:awk -f test.awk ../test > /dev/null
其中../test是输入文件,命令执行的结果是只生成了一个和输入文件内容相同的文件1.txt。
似乎用空行来分隔记录没有效果,我将RS或FS换成"[0-9]{8}-[0-9]{2}-[0-9]{3}-001"也没有用,但是结果是为文件中的每一行生成了一个文件。
用了几个小时都没解决这个问题,希望高手赐教!
19980101-01-001-001/m 文本
19980101-01-001-002/m 文本
19980101-01-001-003/m 文本
19980101-01-001-004/m 文本
19980101-01-002-001/m 文本
19980101-01-002-002/m 文本
19980101-02-001-001/m 文本
19980101-02-001-002/m 文本
19980101-02-001-003/m 文本
……
我希望将每段文本单独提取出来存放在一个文件内,段与段之间是用空行分隔的。
最开始我设置的FS=“\N”,RS=“”,按照书上所述RS=“”是以空行来分隔一个记录的,也就是能将上面的文本一段一段的分离出来。但是结果并不是这样的,我的脚本是这样写的:
FILENAME=".txt"
BEGIN
{
FS = "\n";
RS = "";
}
{
FILENAME = NR FILENAME
for(i = 1; i <= NF; i++)
{
print $i >> FILENAME;
}
}
执行命令:awk -f test.awk ../test > /dev/null
其中../test是输入文件,命令执行的结果是只生成了一个和输入文件内容相同的文件1.txt。
似乎用空行来分隔记录没有效果,我将RS或FS换成"[0-9]{8}-[0-9]{2}-[0-9]{3}-001"也没有用,但是结果是为文件中的每一行生成了一个文件。
用了几个小时都没解决这个问题,希望高手赐教!
作者: luowen3405 发布时间: 2011-04-04
你是想解决掉这个问题,还是想弄清楚awk的一些东东。
如果是前者,那么你可以使用简单的shell写个小循环来解决,如果是后者,在下就爱莫能助了。我基本上使用perl处理文本,不用awk。
如果是前者,那么你可以使用简单的shell写个小循环来解决,如果是后者,在下就爱莫能助了。我基本上使用perl处理文本,不用awk。
作者: wlh_flame 发布时间: 2011-04-05