國內(nèi)二代基因測序FPGA極光技術(shù)加速方案落地
發(fā)布時間:2024-07-05
伴隨著基因測序技術(shù)的快速發(fā)展,基因數(shù)據(jù)的生成呈現(xiàn)指數(shù)級增長,對分析能力提出更高要求。近日,騰訊云正式推出國內(nèi)基于自研fpga極光技術(shù)的ngs加速方案,*提升人類全基因組分析效率,有效改善基因領(lǐng)域數(shù)據(jù)分析速度慢、效率低等問題。騰訊云全面賦能改善基因領(lǐng)域難題基因測序作為一種新型的基因檢測技術(shù),在生命科學(xué)研究中扮演著十分重要的角色,行業(yè)的蓬勃發(fā)展催生了生物基因數(shù)據(jù)爆炸式的增長,使得基因企業(yè)、科學(xué)工作者等面臨新的挑戰(zhàn)。日前,騰訊云表示將全面開放各項it能力,在傳輸、存儲、計算、管理和洞察等方面,助力生物基因領(lǐng)域全面快速發(fā)展。首先,面對基因數(shù)據(jù)量的傳輸難題,騰訊云建成國內(nèi)全的28線bgp網(wǎng)絡(luò)環(huán)境,使基因客戶快速穩(wěn)定地上傳和下載數(shù)據(jù),同時還能幫助基因企業(yè)客戶做數(shù)據(jù)上云,通過一鍵分發(fā)的功能讓基因企業(yè)將數(shù)據(jù)傳遞給科研用戶。其次,騰訊云通過提供文件存儲、對象存儲和歸檔存儲等存儲服務(wù),滿足基因領(lǐng)域客戶面對不同的數(shù)據(jù)使用場景和需求,而針對核心的計算環(huán)節(jié),騰訊云提供超算云服務(wù),使科研工作者和基因企業(yè)能夠選擇多種高性能的虛擬機和物理機來加速基因計算。除此之外,騰訊云介紹,該平臺為基因行業(yè)專門開發(fā)了一體化的數(shù)據(jù)管理平臺“騰訊云雙螺旋paas平臺”,滿足基因用戶傳、存、算、管等需求。據(jù)了解,騰訊云雙螺旋平臺具有三大特點。首先是快速分析,通過在雙螺旋上使用fpga來加速基因分析過程,對二代測序,已經(jīng)可以節(jié)省90%的時間,后續(xù)會繼續(xù)推出三代加速的服務(wù)。其次是節(jié)省費用,依托雙螺旋的調(diào)度能力,雙螺旋會在計算過程中按需調(diào)度匹配的算力執(zhí)行任務(wù),避免出現(xiàn)cpu或內(nèi)存大量空跑情況。第三是人工智能技術(shù)的賦能,已在醫(yī)療領(lǐng)域落地。例如,在廣東,ai騰訊覓影在幫助醫(yī)生做早期食道癌的篩查,對一張內(nèi)鏡檢查影響,覓影ai可以在4秒內(nèi)做出診斷,準(zhǔn)確率達(dá)到90%。ngs加速方案,提升人類全基因組分析效率與分析準(zhǔn)確率據(jù)介紹, fpga極光異構(gòu)系統(tǒng)的ngs加速方案可將人類全基因組分析從30小時優(yōu)化到2.8小時。在實驗過程中,研究人員采用一份30倍測序深度的人類全基因組fastq文件(na12878),分別在業(yè)界常用的通用高性能服務(wù)器與搭載fpga極光異構(gòu)系統(tǒng)的服務(wù)器上進行了對比測試,實驗數(shù)據(jù)表明,騰訊ngs加速方案加速比超過10倍。據(jù)了解,傳統(tǒng)的計算系統(tǒng)通過采用多個cpu搭建hpc系統(tǒng)實現(xiàn)了縮短時間的目的,但這樣也使得成本增加,基因企業(yè)規(guī)模受限。而騰訊極光異構(gòu)系統(tǒng)在提供性能的同時,還能進一步降低基因客戶的成本。它采用自研核心技術(shù)極光(aurora technology),通過以下三個方面整體優(yōu)化傳統(tǒng)的分析和計算流程。,搭載bwa_mem和variant calling*硬件算法核。采用業(yè)界的大規(guī)模集成電路設(shè)計技術(shù),把算法性能提升了一個臺階;第二,算法級優(yōu)化內(nèi)存訪問的方式;第三,io瓶頸導(dǎo)致系統(tǒng)性能無法提升一直是基因二代分析流程的一大痛點,通過系統(tǒng)和算法級別優(yōu)化以及異構(gòu)加速大幅降低io帶寬需求。滿足不同場景應(yīng)用需求,助力基因客戶商業(yè)成功騰訊云表示,依托公司在云計算、大數(shù)據(jù)、人工智能等領(lǐng)域的豐富經(jīng)驗和積累,該平臺能夠滿足不同類型基因用戶的不同場景和模式需求的能力,使其生物基因生態(tài)解決方案已成為眾多生命科學(xué)領(lǐng)域用戶的優(yōu)先選擇。這其中就包括諾禾致源、碳云智能、格致基因等,騰訊云正在以智能解決方案推動著生命科學(xué)行業(yè)的發(fā)展。致力于生命科學(xué)研究與人類健康領(lǐng)域的諾禾致源,利用騰訊超算云匹配所需資源,滿足其在基礎(chǔ)科研、基因數(shù)據(jù)處理及臨床應(yīng)用等不同應(yīng)用場景和模式下對數(shù)據(jù)處理、存儲和傳輸?shù)膰?yán)苛要求,幫助科研和醫(yī)療人員更專注解決科學(xué)和臨床問題。碳云智能作為生命科學(xué)領(lǐng)域的創(chuàng)新公司,依托騰訊云在互聯(lián)網(wǎng)和人工智能等方面的優(yōu)勢,以及彈性、、低延遲的在線計算和大數(shù)據(jù)處理能力,建立了一個包括生物樣本管理系統(tǒng)、分析計算系統(tǒng)、用戶數(shù)據(jù)管理系統(tǒng)等在內(nèi)的數(shù)字生命的大數(shù)據(jù)平臺。運用人工智能技術(shù)分析、處理數(shù)據(jù)、尋找碳基生命的硅基未來,幫助每一個人管理數(shù)字生命健康。針對基因科學(xué)領(lǐng)域企業(yè)伙伴的不同量級,騰訊云不斷推出高性價比產(chǎn)品滿足需求。格致基因合伙人黃柯表示,騰訊云提供的黑石實體結(jié)合虛擬機彈性計算的方案,很好地滿足了低成本高性能計算需求,在生命科學(xué)新領(lǐng)域提供高質(zhì)量服務(wù),為初創(chuàng)公司提供了良好的解決方案。編輯點評基因科學(xué)領(lǐng)域fpga加速方案的落地,可將人類全基因組分析從30小時優(yōu)化到2.8小時,加快了研究人員工作效率,降低了基因客戶的成本,提升了基因測序整體性能。使科研工作者和基因企業(yè)能夠選擇多種高性能的虛擬機和物理機來加速基因計算,為生命科學(xué)新領(lǐng)域發(fā)展提供更高質(zhì)量的服務(wù)。(原標(biāo)題:國內(nèi)二代基因測序fpga加速方案落地騰訊云 人類全基因組分析從30小時到2.8小時)