关于sqlserver中去掉各种标点符号的问题
正在整理一个关键词库。
抽取出来几百万的词库,但是数据质量很差,里边包含了各种的标点符号。
<>?":';{}][)(*&^%$#@!~.........
反正没有想不到的。
如果用replace嵌套替换太麻烦了。
请教有没有什么好办法去掉这些标点,包含char(9) char(10) char(13) 这样的字符
最后只保留中英文
抽取出来几百万的词库,但是数据质量很差,里边包含了各种的标点符号。
<>?":';{}][)(*&^%$#@!~.........
反正没有想不到的。
如果用replace嵌套替换太麻烦了。
请教有没有什么好办法去掉这些标点,包含char(9) char(10) char(13) 这样的字符
最后只保留中英文
作者: pumaadamsjack 发布时间: 2011-06-10
replace嵌套已经是最方便的办法了
作者: cd731107 发布时间: 2011-06-10
可以考虑用正则表达式
作者: fredrickhu 发布时间: 2011-06-10
引用 2 楼 fredrickhu 的回复:
可以考虑用正则表达式
可以考虑用正则表达式
是,我也正在考虑,sqlserver 内置函数不行 就直接上CLR了
作者: pumaadamsjack 发布时间: 2011-06-10
引用 3 楼 pumaadamsjack 的回复:
引用 2 楼 fredrickhu 的回复:
可以考虑用正则表达式
是,我也正在考虑,sqlserver 内置函数不行 就直接上CLR了
引用 2 楼 fredrickhu 的回复:
可以考虑用正则表达式
是,我也正在考虑,sqlserver 内置函数不行 就直接上CLR了
还是正则
作者: ldslove 发布时间: 2011-06-10