1. 軟件依賴及安裝
依賴:
- python: 版本9,安裝cv2模塊(4.0以上版本),Cython,numpy,seaborn模塊
- Minimap2
- Samtools:版本2及以上
依賴的軟件需要使用export添加到環(huán)境變量中,以實現(xiàn)流程的調用。
安裝:在流程目錄下運行以下命令
pip install ./bmk-ocean-stars
2. 輸入數(shù)據(jù)準備
- 測序數(shù)據(jù):ONT測序fastq數(shù)據(jù)(支持.gz格式)
- 參考基因組數(shù)據(jù):基因組fa序列文件,gtf文件(包含gene、exon)
- 熒光解碼文件及HE圖片文件
3. 配置文件編寫
配置文件:
## 測序數(shù)據(jù)
FQ /path/to/ont-reads.fastq
## 熒光解碼文件
FLU /path/to/flu_info.txt
## 參考基因組序列、gtf文件
Genome /path/to/ref/genome/fasta
GTF /path/to/ref/gene/gtf
## HE圖片文件
HE /path/to/HE.tif
## 輸出目錄及輸出前綴
OUTDIR /path/to/result/dir/
PREFIX outfile-prefix
### 程序運行線程數(shù)
Threads 8
Link1 TACGT
4. 流程運行
流程說明:
流程分為4個步驟,如下所示:
步驟1:運行GenomeMap,將ONT reads與參考基因組比對。
步驟2:運行MatrixMake,識別barcode、UMI并生成表達矩陣文件。
步驟3:運行AllheStat,處理HE圖片。
步驟4:運行WebReport,得到網(wǎng)頁版報告。
流程參數(shù):
-c config.txt 數(shù)據(jù)配置文件
-s 步驟選擇,0為運行1-4所有步驟,也可選擇個別步驟單獨運行,多個步驟中間使用“,”分割。
參考命令:
./BSTMatrixONT -c config.txt -s 0
./BSTMatrixONT -c config.txt -s 1,2,3,4
./BSTMatrixONT -c config.txt -s 1,2
5. 結果文件說明
目錄結構及結果說明:
outdir/
├── 01.GenomeMap 步驟1運行結果目錄
│ ├── HXFA2-3.sort.bam 基因組比對bam文件
│ ├── HXFA2-3.sort.bam.bai
│ └── mapping.sh
├── 02.MatrixMake 步驟2運行結果目錄
│ ├── bam
│ ├── bc_umi_read.tsv barcode-umi-reads數(shù)文件
│ ├── bc_umi_read.tsv.stat
│ ├── cache_raw_expression.pkl
│ ├── filtered_feature_bc_matrix
│ ├── final_matrix 過濾后的matrix文件
│ ├── flu_recognition barcode芯片位置識別目錄
│ ├── HXFA2-3.bc_gene_umi.bc_stat barcode檢測結果統(tǒng)計文件
│ ├── HXFA2-3.bc_gene_umi.map_stat 比對類型結果統(tǒng)計文件
│ ├── HXFA2-3.bc_gene_umi.stat barcode-gene-umi對應文件
│ ├── raw_feature_bc_matrix
│ ├── reads_cumi.tsv barcode-gene-umi數(shù)文件
│ ├── reads_info.tsv reads相關信息文件
│ └── web_summary.html 網(wǎng)頁版統(tǒng)計結果文件
├── 03.AllheStat 步驟3運行結果目錄
│ ├── allhe
│ ├── all_level_stat.txt 不同水平的spots統(tǒng)計
│ ├── BSTViewer_project BSTViewer軟件輸入數(shù)據(jù)
│ ├── heAuto_level_matrix
│ ├── level_matrix
│ ├── stat.txt
│ └── umi_plot umi count圖片統(tǒng)計圖目錄
├── 04.WebReport 步驟4運行結果目錄
│ ├── prefix.filelist
│ ├── index.html 網(wǎng)頁版報告html文件
│ └── src 網(wǎng)頁版報告src目錄
└── prefix 收集的基因表達矩陣等文件目錄
├── barcode_pos.tsv barcode類型對應的芯片位置文件
├── barcode.tsv 芯片對應的barcode類型文件
├── bc_gene_umi.stat.gz barcode-gene-umi對應文件
├── bc_umi_read.tsv.gz barcode-umi-reads數(shù)文件
├── features.tsv features.tsv文件
└── matrix.tsv 基因表達矩陣文件