正则表达式菜鸡试水记录一下。正则真的好用,就是记不太住总是记混。
如下是蛋白比对序列文件,linux下面不借助其他工具使用正则表达式直接简化id。
目的:删除“_”以及后面的的内容
代码如下
sed -i 's/_.*//g' *.fa
.代表占位匹配任意字符,*代表前一个字符为0或者多个。简化id都可以用这个思路。
正则表达式菜鸡试水记录一下。正则真的好用,就是记不太住总是记混。
如下是蛋白比对序列文件,linux下面不借助其他工具使用正则表达式直接简化id。
目的:删除“_”以及后面的的内容
代码如下
sed -i 's/_.*//g' *.fa
.代表占位匹配任意字符,*代表前一个字符为0或者多个。简化id都可以用这个思路。