RNA病毒二代測序進(jìn)化分析

來源: 發(fā)布時間:2023-10-21

目前對我國首例輸入性裂谷熱病例病毒進(jìn)行全基因組測定,分析其進(jìn)化來源及潛在變異.方法提取樣本核酸,非特異性反轉(zhuǎn)錄擴增病毒基因組RNA,使用IonTorrent二代測序儀進(jìn)行病毒全基因組測定.對獲得的基因組數(shù)據(jù)進(jìn)行序列拼接、比對、進(jìn)化樹構(gòu)建和關(guān)鍵位點分析.結(jié)果通過測定獲得了病毒全基因組11979nt,該測定病毒屬E基因分支,序列與先前南非分離株Kakamas相似度較高(>98%).病毒Gn蛋白C端信號肽區(qū)存在1個氨基酸突變.結(jié)論本研究分析測定的裂谷熱病毒全基因組與目前非洲流行株高度相似,病毒基因特征未出現(xiàn)明顯變異。


想要通過高通量測序獲得病毒全序列,需要經(jīng)歷:核酸純化-文庫構(gòu)建-生物信息學(xué)分析這三大基本流程.RNA病毒二代測序進(jìn)化分析

RNA病毒二代測序進(jìn)化分析,病毒全基因組測序

哪些應(yīng)用場景需要對病毒的全基因組進(jìn)行測序?在探普生物長時間運行過程中,我們接觸到的對病毒的全基因組進(jìn)行測序項目有比較豐富的應(yīng)用場景。先,從事基因進(jìn)化/疫苗/藥品/抗體研制方向的研究的研究者一定會用到測序。這種場景一般是用密集的sanger測序監(jiān)測某幾個關(guān)鍵基因,搭載一定頻率的全基因組測序。這樣的組合省時省力省經(jīng)費,同時能達(dá)到研究目的。此外,有的單位需要對傳染病的病原進(jìn)行流行病學(xué)監(jiān)測和研究,如疾控/疫控中心、醫(yī)院的傳染病科室以及一些高校和研究所的相應(yīng)課題組,可能需要對病毒的全基因組進(jìn)行測序以后,結(jié)合其他上下游的研究數(shù)據(jù),達(dá)到研究或者監(jiān)測疫病的目的。


RNA病毒全序列技術(shù)高通量測序技術(shù)正式啟用之后,研究者可以將樣品處理至標(biāo)準(zhǔn)濃度和體積后進(jìn)行測序和分析.

RNA病毒二代測序進(jìn)化分析,病毒全基因組測序

一直以來,病毒基因組測序都是疾病診斷、流行病學(xué)調(diào)查和宿主-病原關(guān)系研究的重要手段。病毒的全基因組測序以及對應(yīng)的生物信息學(xué)分析方法是研究病毒進(jìn)化、毒力因子變異、疫病爆發(fā)之間的關(guān)系、疫病傳播途徑、不同遺傳變異的分布模式、疫病發(fā)生地理區(qū)域的基礎(chǔ)。與傳統(tǒng)Sanger測序相比,NGS技術(shù)的發(fā)展使得一個小的研究小組可以擁有大量病毒株的全基因組序列,測序成本也在逐步降低。由于NGS產(chǎn)生的數(shù)據(jù)量非常龐大,其序列拼接難度也隨之增加。而且對于低濃度高復(fù)雜度的樣本,研究者除了PCR外別無他法。而PCR方法往往具有偏好性,丟失的片段將為序列組裝帶來非常高的失敗率。對于完全未知的樣本,無法通過PCR進(jìn)行富集,要鑒定其種類需要調(diào)用各種方法,逐個嘗試,工作量之大,其效率之低,使得一個新的研究方法的出現(xiàn)及其必要。


目前對我國首例輸入性裂谷熱病例病毒進(jìn)行全基因組測定,分析其進(jìn)化來源及潛在變異.方法提取樣本核酸,非特異性反轉(zhuǎn)錄擴增病毒基因組RNA,使用IonTorrent二代測序儀進(jìn)行病毒全基因組測定.對獲得的基因組數(shù)據(jù)進(jìn)行序列拼接、比對、進(jìn)化樹構(gòu)建和關(guān)鍵位點分析.結(jié)果通過測定獲得了病毒全基因組11979nt,該測定病毒屬E基因分支,序列與先前南非分離株Kakamas相似度較高(>98%)。病毒Gn蛋白C端信號肽區(qū)存在1個氨基酸突變.結(jié)論本研究分析測定的裂谷熱病毒全基因組與目前非洲流行株高度相似,病毒基因特征未出現(xiàn)明顯變異。




二代測序單次運行可以獲得海量的數(shù)據(jù)量,因此也稱為高通量測序。

RNA病毒二代測序進(jìn)化分析,病毒全基因組測序

病毒是由一種核酸分子(DNA或RNA)與蛋白質(zhì)(Protein)構(gòu)成或只由蛋白質(zhì)構(gòu)成(如朊病毒)。根據(jù)遺傳物質(zhì)的組成,可分為單鏈DNA病毒(ssDNA)、雙鏈DNA病毒(dsDNA)、單鏈RNA病毒(ssRNA)、雙鏈RNA病毒(dsRNA)和蛋白質(zhì)病毒(如朊病毒)。根據(jù)宿主類型的不同,可以分為噬菌體(細(xì)菌病毒)、植物病毒(煙花葉病毒)和動物病毒(如禽流感病毒、天花病毒和HIV等)。病毒全基因組測序(VirusWholeGenomeSequencing,VWGS),是指基于第二代高通量測序技術(shù),對病毒全基因組進(jìn)行測序,利用生物信息分析手段,得到病毒的全基因組序列,解析編碼信息,并獲得相應(yīng)的變異信息。探普生物的分析流程,可處理復(fù)雜背景下的目標(biāo)病毒序列。上海病毒基因測序診斷

探普生物專門針對病毒數(shù)據(jù)搭載了生物信息學(xué)分析流程。RNA病毒二代測序進(jìn)化分析

病毒基因組測序的標(biāo)準(zhǔn)有:測序的完成程度,決定著基因組的下游應(yīng)用,包括設(shè)計診斷產(chǎn)品、反向遺傳系統(tǒng)以及開發(fā)調(diào)整對策等。研究團隊希望能夠通過五條標(biāo)準(zhǔn)來填補這樣的空白,這些標(biāo)準(zhǔn)涵蓋了完成病毒基因組的整個階段,使用不依賴測序技術(shù)的簡單條件規(guī)定了五個類別。不同的測序技術(shù)可能會很快淘汰更新,因此我們這些標(biāo)準(zhǔn)沒有關(guān)聯(lián)任何特定的測序平臺,可以長時間的使用下去。一種基于二代測序的pedv病毒基因組分析方法。目前現(xiàn)有的pedv分析方法兩方面的局限,第1,pedv病毒二代測序數(shù)據(jù)中存在部分甚至大量的宿主豬的基因組序列,宿主基因組的污染會影響pedv病毒基因組的拼接。第二,拼接預(yù)測病毒基因結(jié)構(gòu)的方法主要是genemarks等預(yù)測軟件,但由于pdev病毒基因組中基因相互重疊,其中基因內(nèi)部還存在ribosomalframeshift現(xiàn)象,現(xiàn)有的基因預(yù)測軟件并不能準(zhǔn)確識別出正確的基因結(jié)構(gòu)。


RNA病毒二代測序進(jìn)化分析