国产精品奶水无码视频免费|激情五月天深爱网|精品国产女主播一区在线观看|国产黄网一区二区

基因測序性能提升5倍,華為云是怎么做到的?

近期,華為云攜手峰科計(jì)算(以下簡稱“峰科”)發(fā)布基于FPGA的基因加速云解決方案,該方案采用GATK(The Genome Analysis Toolkit)標(biāo)準(zhǔn)分析流程,將全基因組測序(WGS)性能提升5倍,從傳統(tǒng)模式下的30個(gè)小時(shí)降低到5~6個(gè)小時(shí),同時(shí)測序精度可達(dá)99.95%以上,在大幅縮短測序時(shí)間的同時(shí)實(shí)現(xiàn)TCO大幅降低。

 

 

01
 

基因測序數(shù)據(jù)分析加速面臨的挑戰(zhàn)

 
 

· 基因測序分析流程BWT+GATK當(dāng)前被業(yè)界廣泛采納,但采用此流程的傳統(tǒng)測序方法需要消耗高額算力及存儲(chǔ)資源,且耗時(shí)較長。

 

· 針對(duì)基因測序中高算力需求的smith-waterman,pair-hmm等算法處理,其具有計(jì)算并行性,不連續(xù),非規(guī)則的存儲(chǔ)訪問,低bit操作等特性,計(jì)算依賴不規(guī)則區(qū)域的操作會(huì)對(duì)CPU消耗很大,性能難以提升。

 

02

華為云FPGA基因加速解決方案的優(yōu)勢

 
 

為了更好的解決基因測序行業(yè)面臨的基因組分析標(biāo)準(zhǔn)流程不經(jīng)濟(jì)高效以及跨不同云和硬件(CPUs,F(xiàn)PGAs)加速實(shí)現(xiàn)的雙重挑戰(zhàn),華為云和峰科計(jì)算強(qiáng)強(qiáng)聯(lián)合,合作推出符合行業(yè)標(biāo)準(zhǔn)的GATK加速流程,通過對(duì)基因測序數(shù)據(jù)分析流程進(jìn)行軟、硬件聯(lián)合優(yōu)化實(shí)現(xiàn)端到端加速。

 

· 華為云提供業(yè)界領(lǐng)先的FPGA加速云服務(wù)平臺(tái),采用業(yè)界領(lǐng)先的Xilinx 16nm Virtex UltraScale+ VU9P FPGA,并針對(duì)基因場景推出32核CPU 224GB內(nèi)存1*VU9P FPGA和64核CPU 448GB內(nèi)存2*VU9P FPGA規(guī)格的實(shí)例,實(shí)現(xiàn)了GATK 軟件處理流程和FPGA加速流程的完美結(jié)合,從而將加速效率提升3~5倍;

 

· 峰科采用GATK標(biāo)準(zhǔn)分析流程,精準(zhǔn)性與GATK標(biāo)準(zhǔn)流程完全吻合,精度可達(dá)99.95%以上;

 

· 不修改GATK標(biāo)準(zhǔn)流程,可訪問讀取從原始測序數(shù)據(jù)到生成vcf文件整個(gè)過程中的中間數(shù)據(jù),便于科研用戶使用比對(duì)。

 

 

03

 華為云FPGA基因加速解決方案解析

 
 

華為云FPGA基因加速解決方案集成峰科的加速IP,為用戶提供一種易于使用,經(jīng)濟(jì)實(shí)惠的基于FPGA的基因組分析流程加速服務(wù),在該方案中,華為云配備了32核CPU,單個(gè)VU9P FPGA的實(shí)例。

 

華為云FPGA基因加速解決方案使用GATK最佳方案對(duì)種系突變和體細(xì)胞突變進(jìn)行變異檢測,將計(jì)算密集型算法如Smith-Waterman、PairHMM等確定為加速對(duì)象。每種算法都經(jīng)過FPGA內(nèi)核優(yōu)化,并且實(shí)現(xiàn)CPU-FPGA協(xié)同執(zhí)行和資源分配。

 

如圖1所示,用戶通過分析應(yīng)用程序,把每個(gè)流程的數(shù)據(jù)傳給華為云峰科加速平臺(tái),平臺(tái)里的Kestrel運(yùn)行時(shí)管理工具來管理CPU-FPGA協(xié)同執(zhí)行和資源分配。利用多線程,I / O優(yōu)化和擴(kuò)展使用FPGA加速器,華為云FPGA基因加速服務(wù)的基因組學(xué)分析流程在保證精準(zhǔn)度的情況下提供顯著的加速。

 

 

與GATK 最佳使用流程相對(duì)稱,典型的基因測序數(shù)據(jù)分析流程始于原始FASTQ序列兩端讀長(paired-end reads),進(jìn)一步獲取一組經(jīng)過濾的變體,對(duì)其進(jìn)行標(biāo)記以供進(jìn)一步分析。圖2描述了華為云基因加速服務(wù)種系變異調(diào)用流水線的具體流程,中間面板指示開始的通常工作流程,上下分別顯示華為云FPGA基因加速方案中的峰科加速流程和GATK最佳使用流程命令實(shí)現(xiàn)方式的工作流程。

 

基因測序性能提升5倍,華為云是怎么做到的?-DVBCN

 

圖2 華為云峰科基因加速流程和GATK最佳使用流程對(duì)比

 

基于華為云FPGA加速服務(wù),使用FPGA優(yōu)化加速GATK流程,基因組分析流程可以實(shí)現(xiàn)3~5倍速度提升和99.95%以上的準(zhǔn)確度。華為云FPGA基因加速解決方案最快基因組序列分析標(biāo)準(zhǔn)流程可在一天內(nèi)完成5個(gè)全基因組或24個(gè)整體外顯子組分析。

 

Performance comparison for GATK 3.8 WGS from Alignment to Variant Calling using Hoplotypecaller

基因測序性能提升5倍,華為云是怎么做到的?-DVBCN

:測試數(shù)據(jù)使用的是30X的WGS樣本,堿基數(shù)量103G

相關(guān)文章
華為存儲(chǔ)破解廣電4K超高清制播瓶頸,全面支撐AI時(shí)代廣電行業(yè)智能化升級(jí)
華為存儲(chǔ)破解廣電4K超高清制播瓶頸,全…
從數(shù)字人到語料治理,華為AI全棧能力賦能傳媒行業(yè)
從數(shù)字人到語料治理,華為AI全棧能力賦…
超高清加速到來:華為助力塑造傳媒行業(yè)新質(zhì)生產(chǎn)力,賦能廣電視聽數(shù)字化轉(zhuǎn)型
超高清加速到來:華為助力塑造傳媒行業(yè)…
以變應(yīng)變:華為智簡全光網(wǎng)+IP化改造,助力廣電視聽數(shù)智化升級(jí)
以變應(yīng)變:華為智簡全光網(wǎng)+IP化改造,助…
華為前三季度凈利為628.68億元,研發(fā)費(fèi)用達(dá)1274.12億元
華為前三季度凈利為628.68億元,研發(fā)費(fèi)…
華為徐直軍:智能化必將是一個(gè)長期過程,而算力是智能化的關(guān)鍵基礎(chǔ)
華為徐直軍:智能化必將是一個(gè)長期過程…
我還沒有學(xué)會(huì)寫個(gè)人說明!