如何用sed获取网页的链接地址

如何用sed获取网页的链接地址

如题,比如一段网页的代码:
复制内容到剪贴板
代码:
<html>
<body>
<IMG border="0" src="/icons/compressed.png" ALT="[   ]"> download<A HREF="http://www.org/file1.zip">file1.zip</A> here
</body>
</html>
把http://www.org/file1.zip提取出来      
一个比较拙劣的方法
复制内容到剪贴板
代码:
awk -F 'A HREF="' '/A HREF/ { print $2 }' html | sed 's/".*//'
      
My way:
引用:
-(dearvoid@LinuxEden:Forum)-(~/tmp)-
[$$=17375 $?=0] ; cat html.txt
<html>
<body>
<IMG border="0" src="/icons/compressed.png" ALT="[   ]"> download<A HREF="http://www.org/file1.zip">file1.zip</A> here
</body>
</html>
-(dearvoid@LinuxEden:Forum)-(~/tmp)-
[$$=17375 $?=0] ; sed -n '/HREF/s/.*HREF="\([^"]\+\)".*/\1/p' html.txt
http://www.org/file1.zip
-(dearvoid@LinuxEden:Forum)-(~/tmp)-
[$$=17375 $?=0] ; bye