linux文本處理命令是一類對文件進行操作的命令,通過使用文本處理命令,可以輕松的對文件進行排序,拆分,合并等操作,熟練掌握文本處理命令,在生物信息文本處理中,有十分重要的意義。
一、cat?查看文件內(nèi)容命令
以下為最常用的幾個命令實例:

注意事項:
遇到大文件的時候,不要直接cat,因為cat會一直把所有內(nèi)容打印到屏幕上,造成長時間處于打印狀態(tài),如遇到這種情況,連續(xù)不間斷的敲擊ctrl+c組合鍵退出打印狀態(tài)
相關(guān)衍生命令:
cat還有兩個常用的相關(guān)命令:
1.zcat ?查看壓縮文件
2.tac ?從結(jié)尾往上看內(nèi)容
二、sort?排序命令
對數(shù)據(jù)的某一列按照文本,數(shù)字等排序方法進行排序,也可以進行字符內(nèi)排序,以下為最常用的幾個命令實例

三.uniq?去除重復命令
對相同的行去重復,統(tǒng)計重復,保留重復等,還可指定某一列做為去重復關(guān)鍵字去重復,以下為最常用的幾個命令實例
注意事項:
uniq需要配合sort進行使用,把重復的內(nèi)容排序到一起,以下為最常用的幾個命令實例
四.wc?統(tǒng)計命令
統(tǒng)計指定文件中的字節(jié)數(shù)、字數(shù)、行數(shù),并將統(tǒng)計結(jié)果顯示輸出,以下為最常用的幾個命令實例
五.grep/egrep命令
grep為過濾命令,一般情況下支持基本正則表達式,可以通過參數(shù)-E支持擴展正則表達式,常用命令如下:
grep一般情況下支持基本正則表達式,可以通過參數(shù)-E支持擴展正則表達式,另外grep單獨提供了一個擴展命令叫做egrep用來支持擴展正則表達式,這條命令和grep -E等價。雖然一般情況下,基本正則表達式就夠用了,以下為最常用的幾個命令
六.sed命令
sed是一個強大的按行處理的命令,常用的命令如下:
七.awk命令
是一個最強大的文本分析工具,以下列常用文本處理的寫法:
八.cut命令
cut命令命令從文件的列剪切字節(jié)、字符、域,并將這些字節(jié)、字符,域,輸出出來,下面為幾個常見的用法:
九.split命令
split命令可以按照行或者按照字節(jié)分割文件,以下列常用文本處理的寫法:
十.paste命令
Paste命令可按列合并命令,可以很輕松的將兩個文件按列合并,下面是常見的舉例:?
十一.xargs
xargs用作替換工具,讀取輸入數(shù)據(jù)重新格式化后輸出。Xargs命令常跟管道連用,處理管道中的數(shù)據(jù)流:
?
十二.comm
comm命令比較兩個文件的相同和不同,下面為常用的命令舉例:
好了linux常用命令就介紹到這里,按照這些實例好好練習,加上自己的融會貫通,相信你很快就會成為快速文本處理的高手