秒建工作環(huán)境
Matrix Fusion在云端預(yù)安裝主流深度學(xué)習(xí)框架、數(shù)據(jù)科學(xué)資料庫和GPU驅(qū)動(dòng),用戶無需耗費(fèi)時(shí)間搭建開發(fā)環(huán)境,可在一分鐘內(nèi)通過簡單的鼠標(biāo)點(diǎn)擊完成開發(fā)環(huán)境設(shè)置,可以迅速靈活調(diào)用CPU和GPU資源。
智能化資源調(diào)度
Matrix Fusion 支持各類硬件及操作系統(tǒng),提供端到端的基礎(chǔ)設(shè)施軟件解決方案,管理基礎(chǔ)CPU和GPU計(jì)算資源,能夠自動(dòng)進(jìn)行工作負(fù)載資源調(diào)配。深度學(xué)習(xí)是同時(shí)利用CPU和GPU處理工作負(fù)載的典型應(yīng)用,Matrix Fusion通過整合用戶所有的硬件資源(集群亦或是單機(jī))成為CPU+GPU資源池,再將資源根據(jù)開發(fā)者需要重新分配CPU和GPU到開發(fā)者的虛擬環(huán)境下,管理員也可以將多余的計(jì)算資源靈活分配給其他用戶或更為嚴(yán)苛的工作負(fù)載。
用戶在不同的虛擬環(huán)境中可以選擇在CPU資源上開發(fā),然后在GPU資源中測(cè)試,需要擴(kuò)展訓(xùn)練到更多GPU上時(shí),可立即調(diào)用虛擬環(huán)境中任意數(shù)量的GPU資源。
容器管理
Matrix Fusion 構(gòu)建于強(qiáng)大的計(jì)算硬件和GPU虛擬化的基礎(chǔ)上,搭載了全方位的容器管理方案。核心負(fù)載引擎容器化,是作為極大簡化深度學(xué)習(xí)和AI工作流程的最新技術(shù),在金錢、人力、時(shí)間上投資不菲。而Matrix Fusion無需進(jìn)行個(gè)性化調(diào)整,用戶只需登錄操作界面,就可以直接調(diào)用專業(yè)化容器解決方案。 Matrix Fusion容器管理層包括1個(gè)內(nèi)置資源庫,可以管理預(yù)配置容器(包括了每一種部署場(chǎng)景或個(gè)性化生成容器): 預(yù)配置環(huán)境:Matrix Fusion預(yù)配置最新的深度學(xué)習(xí)框架和數(shù)據(jù)科學(xué)數(shù)據(jù)庫,用戶可以直接使用TensorFlow、Caffe、Torch以及其他社區(qū)的最新技術(shù)版本。 DIY開發(fā)環(huán)境:用戶可以利用“工作區(qū)快照”或“調(diào)入容器”來修改并保存容器環(huán)境,DIY一個(gè)更貼合自己使用習(xí)慣的開發(fā)環(huán)境。Matrix Fusion “調(diào)入容器”可以為用戶提供一個(gè)簡約的容器(僅含操作系統(tǒng)、最低配置的數(shù)據(jù)庫和驅(qū)動(dòng)要求),用戶自行修改環(huán)境,然后上載作為標(biāo)準(zhǔn)環(huán)境進(jìn)行后續(xù)開發(fā)。 用戶可以通過“工作區(qū)快照”利用“Docker保存”工作流程來復(fù)制環(huán)境,修改后保存到資源庫中,以便于下一次的開發(fā)工作。 容器導(dǎo)出:容器可導(dǎo)出,作為推理或其他生產(chǎn)部署要求用。
Fusion Core
Matrix Fusion強(qiáng)大的靈活性來源于Fusion Core計(jì)算虛擬化引擎。Fusion Core控制應(yīng)用和基礎(chǔ)GPU計(jì)算之間的API調(diào)用指示,允許GPU負(fù)載靈活分布于本地GPU內(nèi)存、網(wǎng)絡(luò)附加GPU、擴(kuò)展至高達(dá)64個(gè)GPU,提供強(qiáng)大的整體性能。
因?yàn)镕usion Core采用的是“透明”模式而非虛擬層或其他虛擬化方式,所以不需要對(duì)基礎(chǔ)硬件或虛擬機(jī)環(huán)境做任何改變,也不需要改變應(yīng)用編程本身。這意味著AI開發(fā)者和數(shù)據(jù)科學(xué)家可以無縫利用GPU虛擬化的優(yōu)勢(shì),且將成本和集成需求降至最低。
數(shù)據(jù)卷
深度學(xué)習(xí)和AI工作負(fù)載所需數(shù)據(jù)通常來源廣泛,既有線上也有線下,既有外部也有內(nèi)部,既有批量文件也有文件系統(tǒng)等等。Matrix Fusion能夠簡化處理工作數(shù)據(jù),讓管理員明確網(wǎng)絡(luò)附加存儲(chǔ)位置并映射到容器中。只要主機(jī)能夠訪問數(shù)據(jù)地址,容器就可以訪問數(shù)據(jù),這讓AI開發(fā)者和數(shù)據(jù)科學(xué)家的工作大幅簡化. 此外,系統(tǒng)還支持靈活、無限制的數(shù)據(jù)映射,Matrix Fusion支持每個(gè)節(jié)點(diǎn)的本地NFS文件系統(tǒng)。這一默認(rèn)選項(xiàng)提供了工作負(fù)載的標(biāo)準(zhǔn)地址,無論運(yùn)行多大的深度學(xué)習(xí)工作負(fù)載(包括運(yùn)行在多服務(wù)器之間的),都可以快速獲取運(yùn)行任務(wù)所需的數(shù)據(jù)