高效快速基因定位策略
BSA分析是將分離群體中表現(xiàn)出極端性狀的個(gè)體混合起來(lái)構(gòu)建兩個(gè)混池,通過(guò)分析兩個(gè)混池間差異序列,快速定位與目的基因緊密連鎖分子標(biāo)記的分析方法,該方法廣泛應(yīng)用于動(dòng)植物基因定位中。
個(gè)性化分析方案
BSA分析以其快速、準(zhǔn)確、性價(jià)比高的分析特點(diǎn)在許多物種的幾十個(gè)性狀上得到廣泛應(yīng)用
針對(duì)特定的群體和性狀,我們將會(huì)推薦合理的分析方案
分析內(nèi)容
根據(jù)物種基因組大小、復(fù)雜度和研究目的,可以選擇不同的分析策略,包括重測(cè)序-BSA及其突變體分析形式Mutmap。
測(cè)序數(shù)據(jù)質(zhì)控;與參考基因組比對(duì);SNP、InDel檢測(cè)和注釋;關(guān)聯(lián)分析;關(guān)聯(lián)區(qū)域注釋
技術(shù)優(yōu)勢(shì)
百邁客成功完成了近1000個(gè)物種的10000多個(gè)性狀的定位工作
項(xiàng)目經(jīng)驗(yàn)及其豐富,目前已發(fā)表文章80+,累計(jì)影響影子300+
可根據(jù)項(xiàng)目需要選擇最佳分析方案,保障結(jié)果精準(zhǔn)
選材要求及測(cè)序方案
取樣要求 | 測(cè)序方案 | 項(xiàng)目周期 |
重測(cè)序-BSA需要有參考基因組的物種 | Illumina測(cè)序平臺(tái),PE150測(cè)序策略,保證Q30達(dá)到80% | 45天 |
具有重要農(nóng)藝性狀個(gè)體構(gòu)建的遺傳群體(F2、RIL、DH、BC等)) | 推薦混池中每個(gè)子代測(cè)序深度≥1×,每個(gè)親本≥20× | |
子代混池規(guī)模:質(zhì)量性狀不低于30+30,數(shù)量性狀推薦選取群體規(guī)模的5%-10%,同時(shí)不低于30+30的個(gè)體數(shù) |
高質(zhì)量的測(cè)序數(shù)據(jù)是進(jìn)行后續(xù)分析的重要基礎(chǔ),在獲得測(cè)序的Raw data后,我們將會(huì)進(jìn)行測(cè)序數(shù)據(jù)產(chǎn)出統(tǒng)計(jì)、堿基測(cè)序質(zhì)量分布、堿基類型分布等多種測(cè)序評(píng)估方式,保證測(cè)序數(shù)據(jù)的準(zhǔn)確性。
SNP(Single Nucleotide Polymorphism)及InDel(Insertion-Deletion)是基因組上最為常見(jiàn)的遺傳標(biāo)記,具有數(shù)量多、多態(tài)性豐富的特點(diǎn),SNP和InDel的檢測(cè)主要通過(guò)GATK和samtools軟件工具包實(shí)現(xiàn),變異位點(diǎn)注釋使用SnpEff軟件。
根據(jù)親本和混池的SNP及Indel標(biāo)記,利用SNP-Index和ED分析方法同時(shí)進(jìn)行標(biāo)記與性狀的關(guān)聯(lián)分析,獲得與目標(biāo)性狀相關(guān)的基因。
應(yīng)用BLAST軟件對(duì)候選區(qū)間內(nèi)的編碼基因進(jìn)行多個(gè)數(shù)據(jù)庫(kù)(NR、Swiss-Prot、GO、KEGG、COG)的深度注釋,通過(guò)詳細(xì)的注釋,進(jìn)一步縮小關(guān)聯(lián)區(qū)域,快速篩選候選基因。
成功案例
對(duì)于數(shù)量性狀定位的混池,通常建議混池規(guī)模為群體大小的5%-10%。不同的測(cè)序策略,混池規(guī)模會(huì)有略微的差別,重測(cè)序BSA及轉(zhuǎn)錄組BSA最低要求30個(gè)以上,SLAF-BSA最低要求50個(gè)以上。文獻(xiàn)報(bào)道(300樣/池&160樣/池相比)混池規(guī)模越大,定位的效果會(huì)越好。
常測(cè)序數(shù)據(jù)量越大,標(biāo)記的準(zhǔn)確性會(huì)越高,但成本也會(huì)越高,綜合考慮,在這里我們給大家提供BSA項(xiàng)目的最低數(shù)據(jù)量。對(duì)于SLAF-BSA,通常我們建議子代混池至少達(dá)到每個(gè)個(gè)體1×的數(shù)據(jù)量,比如混池規(guī)模為30+30,那么每個(gè)混池測(cè)至少30×;對(duì)于重測(cè)序BSA,混池規(guī)模在50以下,子代1×的數(shù)據(jù)是可以的,但是像基因組比較大的物種(如玉米),若混池規(guī)模為100+100這樣的情況,每個(gè)混池測(cè)50×也是沒(méi)有問(wèn)題的。
能做。現(xiàn)在我們的BSA關(guān)聯(lián)分析是基于SNP,因?yàn)镾NP在基因組上的密度要遠(yuǎn)遠(yuǎn)高于Indel以及結(jié)構(gòu)變異,這會(huì)使我們定位更加精細(xì)。如果某一個(gè)性狀是由Indel、結(jié)構(gòu)變異、導(dǎo)入系所引起的,那么它通常是與某些SNP連鎖發(fā)生的,通過(guò)SNP我們會(huì)找到候選區(qū)域,再在候選區(qū)域內(nèi)尋找這些Indel或結(jié)構(gòu)變異或?qū)胂?,?lái)尋求決定該性狀的Indel或結(jié)構(gòu)變異或?qū)胂怠?/p>
可以,對(duì)于沒(méi)有親本的混池,我們會(huì)采取ED的方法進(jìn)行關(guān)聯(lián)分析。
有影響。從關(guān)聯(lián)分析的方法上,有親本的BSA我們會(huì)有兩種關(guān)聯(lián)分析方法,SNP-Index和ED,最后的定位結(jié)果是兩種方法的交集,無(wú)親本的只能用ED的方法進(jìn)行關(guān)聯(lián)分析。有親本的作用是排除親本非多態(tài)性標(biāo)記對(duì)定位的影響,舉例說(shuō)明一下,有一個(gè)標(biāo)記在混池間是有多態(tài)性的,但在親本上是沒(méi)有多態(tài)性,如果有親本,我們的定位結(jié)果是不會(huì)有這樣的標(biāo)記,但是沒(méi)有親本,定位結(jié)果中就會(huì)有這樣的標(biāo)記,定位的區(qū)域會(huì)變大,假陽(yáng)性較多。
不可以,兩個(gè)不同群體所采用的閾值沒(méi)法計(jì)算。
推薦至少做兩個(gè)親本的重測(cè)序,這樣我們會(huì)提供定位區(qū)域內(nèi)非同義突變基因的信息,進(jìn)一步縮小候選區(qū)域的范圍,相當(dāng)于在SLAF-BSA的基礎(chǔ)上精細(xì)點(diǎn),如果老師經(jīng)費(fèi)允許的話,群體也做重測(cè)序效果肯定是更好的,群體的SNP信息要遠(yuǎn)高于SLAF的,定位也會(huì)相應(yīng)變精細(xì)點(diǎn)。
沒(méi)有參考基因組的話,通過(guò)SLAF我們只能關(guān)聯(lián)到一些標(biāo)簽,對(duì)于老師后期的數(shù)據(jù)利用并不是特比好,而通過(guò)轉(zhuǎn)錄組可以進(jìn)行Uningene的組裝,進(jìn)而通過(guò)關(guān)聯(lián)分析獲得候選區(qū)域內(nèi)的Uningene信息并進(jìn)行功能注釋,對(duì)于老師后期數(shù)據(jù)利用還是比較好的。
化學(xué)誘變或者是物理誘變引起的點(diǎn)突變;野生型親本重測(cè)序+突變型子代混池測(cè)序;有參考基因組;任何發(fā)生性狀分離的家系群體。