根據(jù)中國(guó)科學(xué)院“十一五”信息化規(guī)劃部署,圍繞國(guó)家大科學(xué)裝置科研院所和國(guó)家重點(diǎn)實(shí)驗(yàn)室所要開(kāi)展科學(xué)研究的核心工作,結(jié)合沈陽(yáng)地區(qū)材料計(jì)算模擬及振興老工業(yè)基地等其他應(yīng)用需求,中科院計(jì)劃依托中國(guó)科學(xué)院金屬研究所建設(shè)超級(jí)計(jì)算沈陽(yáng)分中心,計(jì)劃建設(shè)安裝峰值性能為10萬(wàn)億次的高性能計(jì)算機(jī)系統(tǒng)及配套應(yīng)用軟件。
隨著信息化進(jìn)程的推進(jìn)與社會(huì)經(jīng)濟(jì)的發(fā)展,高性能計(jì)算應(yīng)用成為社會(huì)各行業(yè)與各領(lǐng)域提升工作效率與強(qiáng)化競(jìng)爭(zhēng)力的重要技術(shù)手段。中科院金屬所作為我國(guó)高性能材料研究與發(fā)展的重要基地,長(zhǎng)期以來(lái)以高性能金屬材料、新型無(wú)機(jī)非金屬材料和先進(jìn)復(fù)合材料等為主要研究對(duì)象,面向國(guó)家戰(zhàn)略需求和國(guó)家經(jīng)濟(jì)建設(shè)、面向世界科學(xué)發(fā)展前沿需要,有針對(duì)性地開(kāi)展基礎(chǔ)研究和應(yīng)用研究,并注重科技成果的轉(zhuǎn)化和產(chǎn)業(yè)化。
目前,中科院金屬所的基礎(chǔ)研究方面擁有沈陽(yáng)材料科學(xué)國(guó)家(聯(lián)合)實(shí)驗(yàn)室和金屬腐蝕與防護(hù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,其中沈陽(yáng)材料科學(xué)國(guó)家(聯(lián)合)實(shí)驗(yàn)室是我國(guó)第一個(gè)研究類國(guó)家實(shí)驗(yàn)室,應(yīng)用研究方面擁有沈陽(yáng)先進(jìn)材料研究發(fā)展中心、材料環(huán)境腐蝕研究中心,工程化研究方面擁有高性能均質(zhì)合金國(guó)家工程中心和國(guó)家金屬腐蝕控制工程技術(shù)研究中心。因此所承載的研究任務(wù)以及計(jì)算需求十分龐大。
為了更好的響應(yīng)中國(guó)科學(xué)院“十一五”的信息化規(guī)劃部署以及滿足金屬所日后的發(fā)展需求,中科院金屬所在曙光的助力下構(gòu)建了一套能夠具備高性能、高可用、高可靠、易管理特點(diǎn)的高性能計(jì)算解決方案。
在此之前,中科院金屬所曾于去年購(gòu)置過(guò)一套基于GPU的60個(gè)計(jì)算節(jié)點(diǎn)的HPC集群,部署在六個(gè)水冷機(jī)柜中。由于金屬所機(jī)房的空間較為狹小,想在狹小空間內(nèi)擴(kuò)展上述規(guī)模的集群系統(tǒng)給方案設(shè)計(jì)以及后續(xù)的實(shí)施、部署都造成了較大難度。金屬所廣泛采用VASP、Gaussian等理化軟件,該類軟件屬于計(jì)算、網(wǎng)絡(luò)均密集型應(yīng)用。經(jīng)過(guò)多次交流,構(gòu)建了一套基于40G的QDR網(wǎng)絡(luò)、刀片式服務(wù)器以及機(jī)架式胖節(jié)點(diǎn)的集群環(huán)境,該集群達(dá)到了10萬(wàn)億次浮點(diǎn)運(yùn)算能力。
此次曙光為中科院金屬所提供的解決方案具備高性能、高可用、高可靠、易管理特點(diǎn),可支持今后不斷更新和升級(jí)的需要。主要以曙光A840r-G服務(wù)器為計(jì)算節(jié)點(diǎn),而計(jì)算系統(tǒng)則采用曙光TC3600刀片系統(tǒng),能夠滿足金屬所各方面的計(jì)算需求。在此方案中,曙光有效地與原有機(jī)房?jī)?nèi)設(shè)備融合,并全面提升機(jī)房利用率。該方案中同時(shí)配置了AMD和Intel平臺(tái)的處理器。除此之外,還配置了胖節(jié)點(diǎn)服務(wù)器,多樣的計(jì)算平臺(tái)配置,滿足了金屬所多種應(yīng)用需求,極大提升了該系統(tǒng)的可用性。
同時(shí),本方案為了保障良好的可靠性,還配置了高速IB網(wǎng)絡(luò)以及千兆以太網(wǎng)絡(luò)。一旦IB網(wǎng)絡(luò)出現(xiàn)故障,以太網(wǎng)絡(luò)便可以升級(jí)為計(jì)算網(wǎng)絡(luò),繼續(xù)提供計(jì)算服務(wù),不僅降低了單一故障點(diǎn),而且提升了系統(tǒng)可靠性。為了方便管理,曙光配置了強(qiáng)大的gridview的監(jiān)管平臺(tái),管理人員可通過(guò)遠(yuǎn)程操作有效地對(duì)資源進(jìn)行統(tǒng)一管理。
如今的高性能計(jì)算平臺(tái)已經(jīng)投入到日常運(yùn)營(yíng)當(dāng)中,運(yùn)營(yíng)效果讓用戶十分滿意。作為堅(jiān)持“自主創(chuàng)新 服務(wù)中國(guó)”的民族廠商,曙光公司專業(yè)的技術(shù)能力與人性化服務(wù)獲得市場(chǎng)用戶的廣泛認(rèn)可。在2010年度中國(guó)高性能計(jì)算百?gòu)?qiáng)的排行榜中,曙光公司以34套高性能計(jì)算機(jī)再次獨(dú)攬中國(guó)市場(chǎng)數(shù)量份額第一的冠軍寶座。在不斷發(fā)展與壯大的進(jìn)程中,曙光公司長(zhǎng)期堅(jiān)持更新與研發(fā)更多符合市場(chǎng)需求與中國(guó)用戶需求的服務(wù)器產(chǎn)品,力爭(zhēng)將本土化的優(yōu)勢(shì)做到價(jià)值最大化,并助力推進(jìn)中國(guó)信息化的發(fā)展進(jìn)程。