1. 軟件依賴及安裝
依賴:
- python: 版本9,安裝cv2模塊(4.0以上版本),Cython,numpy,seaborn模塊
- Minimap2
- Samtools:版本2及以上
依賴的軟件需要使用export添加到環(huán)境變量中,以實(shí)現(xiàn)流程的調(diào)用。
安裝:在流程目錄下運(yùn)行以下命令
pip install ./bmk-ocean-stars
2. 輸入數(shù)據(jù)準(zhǔn)備
- 測(cè)序數(shù)據(jù):ONT測(cè)序fastq數(shù)據(jù)(支持.gz格式)
- 參考基因組數(shù)據(jù):基因組fa序列文件,gtf文件(包含gene、exon)
- 熒光解碼文件及HE圖片文件
3. 配置文件編寫
配置文件:
## 測(cè)序數(shù)據(jù)
FQ /path/to/ont-reads.fastq
## 熒光解碼文件
FLU /path/to/flu_info.txt
## 參考基因組序列、gtf文件
Genome /path/to/ref/genome/fasta
GTF /path/to/ref/gene/gtf
## HE圖片文件
HE /path/to/HE.tif
## 輸出目錄及輸出前綴
OUTDIR /path/to/result/dir/
PREFIX outfile-prefix
### 程序運(yùn)行線程數(shù)
Threads 8
Link1 TACGT
4. 流程運(yùn)行
流程說明:
流程分為4個(gè)步驟,如下所示:
步驟1:運(yùn)行GenomeMap,將ONT reads與參考基因組比對(duì)。
步驟2:運(yùn)行MatrixMake,識(shí)別barcode、UMI并生成表達(dá)矩陣文件。
步驟3:運(yùn)行AllheStat,處理HE圖片。
步驟4:運(yùn)行WebReport,得到網(wǎng)頁版報(bào)告。
流程參數(shù):
-c config.txt 數(shù)據(jù)配置文件
-s 步驟選擇,0為運(yùn)行1-4所有步驟,也可選擇個(gè)別步驟單獨(dú)運(yùn)行,多個(gè)步驟中間使用“,”分割。
參考命令:
./BSTMatrixONT -c config.txt -s 0
./BSTMatrixONT -c config.txt -s 1,2,3,4
./BSTMatrixONT -c config.txt -s 1,2
5. 結(jié)果文件說明
目錄結(jié)構(gòu)及結(jié)果說明:
outdir/
├── 01.GenomeMap 步驟1運(yùn)行結(jié)果目錄
│ ├── HXFA2-3.sort.bam 基因組比對(duì)bam文件
│ ├── HXFA2-3.sort.bam.bai
│ └── mapping.sh
├── 02.MatrixMake 步驟2運(yùn)行結(jié)果目錄
│ ├── bam
│ ├── bc_umi_read.tsv barcode-umi-reads數(shù)文件
│ ├── bc_umi_read.tsv.stat
│ ├── cache_raw_expression.pkl
│ ├── filtered_feature_bc_matrix
│ ├── final_matrix 過濾后的matrix文件
│ ├── flu_recognition barcode芯片位置識(shí)別目錄
│ ├── HXFA2-3.bc_gene_umi.bc_stat barcode檢測(cè)結(jié)果統(tǒng)計(jì)文件
│ ├── HXFA2-3.bc_gene_umi.map_stat 比對(duì)類型結(jié)果統(tǒng)計(jì)文件
│ ├── HXFA2-3.bc_gene_umi.stat barcode-gene-umi對(duì)應(yīng)文件
│ ├── raw_feature_bc_matrix
│ ├── reads_cumi.tsv barcode-gene-umi數(shù)文件
│ ├── reads_info.tsv reads相關(guān)信息文件
│ └── web_summary.html 網(wǎng)頁版統(tǒng)計(jì)結(jié)果文件
├── 03.AllheStat 步驟3運(yùn)行結(jié)果目錄
│ ├── allhe
│ ├── all_level_stat.txt 不同水平的spots統(tǒng)計(jì)
│ ├── BSTViewer_project BSTViewer軟件輸入數(shù)據(jù)
│ ├── heAuto_level_matrix
│ ├── level_matrix
│ ├── stat.txt
│ └── umi_plot umi count圖片統(tǒng)計(jì)圖目錄
├── 04.WebReport 步驟4運(yùn)行結(jié)果目錄
│ ├── prefix.filelist
│ ├── index.html 網(wǎng)頁版報(bào)告html文件
│ └── src 網(wǎng)頁版報(bào)告src目錄
└── prefix 收集的基因表達(dá)矩陣等文件目錄
├── barcode_pos.tsv barcode類型對(duì)應(yīng)的芯片位置文件
├── barcode.tsv 芯片對(duì)應(yīng)的barcode類型文件
├── bc_gene_umi.stat.gz barcode-gene-umi對(duì)應(yīng)文件
├── bc_umi_read.tsv.gz barcode-umi-reads數(shù)文件
├── features.tsv features.tsv文件
└── matrix.tsv 基因表達(dá)矩陣文件