當(dāng)前位置:首頁(yè) >  科技 >  IT業(yè)界 >  正文

英特爾oneAPI 2023工具包正式上線,幫助開發(fā)者利用英特爾硬件的先進(jìn)功能

 2022-12-20 17:28  來(lái)源: 互聯(lián)網(wǎng)   我來(lái)投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)

為進(jìn)一步幫助開發(fā)者利用英特爾硬件的先進(jìn)功能,近日,英特爾宣布英特爾® oneAPI工具包的2023年版本已在英特爾®開發(fā)者云平臺(tái)(Intel® Developer Cloud)上線,并正在通過(guò)現(xiàn)有的渠道推送。

新的oneAPI 2023工具包支持即將推出的第四代英特爾®至強(qiáng)®可擴(kuò)展處理器、英特爾®至強(qiáng)® CPU Max 系列和英特爾®數(shù)據(jù)中心GPU,包括Flex系列和新的Max系列。這些工具可提升性能和生產(chǎn)力,并增加了對(duì)新的Codeplay1插件的支持,使開發(fā)者能更容易地為那些非英特爾的GPU架構(gòu)編寫SYCL代碼。這些基于標(biāo)準(zhǔn)的工具提供了硬件方面的選擇,也讓在跨架構(gòu)系統(tǒng)上運(yùn)行的高性能應(yīng)用的開發(fā)變得更加輕松。

英特爾oneAPI 2023工具包包括一套完整的最新編譯器、庫(kù)、分析和移植工具,以及優(yōu)化后的AI和機(jī)器學(xué)習(xí)框架,讓開發(fā)者能為oneAPI支持的CPU、GPU和FPGA構(gòu)建高性能、跨架構(gòu)的應(yīng)用。開發(fā)者可使用這些工具快速實(shí)現(xiàn)性能目標(biāo),并通過(guò)單個(gè)代碼庫(kù)節(jié)省時(shí)間,從而將更多時(shí)間用于創(chuàng)新。

新版本的oneAPI工具包可幫助開發(fā)者利用英特爾硬件的先進(jìn)功能:

· 第4代英特爾至強(qiáng)可擴(kuò)展處理器和至強(qiáng)CPU Max系列,內(nèi)置英特爾®高級(jí)矩陣擴(kuò)展(英特爾® AMX)、Quick Assist 技術(shù)(QAT)、英特爾®AVX-512、bfloat16 及更多。

· 英特爾®數(shù)據(jù)中心GPU,包括內(nèi)置基于硬件的AV1編碼器的Flex系列,以及Max系列。Max系列提供靈活數(shù)據(jù)類型的支持,內(nèi)置英特爾® Xe矩陣擴(kuò)展(英特爾®XMX)、矢量化引擎(vector engine)、英特爾®Xe-Link互聯(lián)擴(kuò)展和其它功能。

oneAPI 2023工具包具有先進(jìn)的軟件性能:

· 英特爾® Fortran編譯器(Intel® Fortran Compiler)提供了完整的 Fortran 語(yǔ)言直至 Fortran 2018標(biāo)準(zhǔn)的支持,并擴(kuò)展了對(duì) OpenMP GPU 分流的支持,加快了符合標(biāo)準(zhǔn)的應(yīng)用程序的開發(fā)。

· 英特爾® oneAPI數(shù)學(xué)內(nèi)核庫(kù)(oneMKL)包含OpenMP 分流能力的擴(kuò)展,提高了可移植性。

· 英特爾® oneAPI 深度神經(jīng)網(wǎng)絡(luò)庫(kù)(oneDNN) 支持第四代英特爾至強(qiáng)處理器和Max系列CPU處理器的高級(jí)深度學(xué)習(xí)功能,包括英特爾®AMX、英特爾®AVX-512、VNNI 和 bfloat16。

通過(guò)豐富的SYCL支持,以及代碼遷移和分析工具的強(qiáng)化,讓面向多架構(gòu)系統(tǒng)的代碼開發(fā)變得更輕松,進(jìn)而提高開發(fā)者的生產(chǎn)力。

· 英特爾®oneAPI DPC++C++編譯器增加了Codeplay為英偉達(dá)和AMD GPU開發(fā)的新插件的支持,以簡(jiǎn)化SYCL代碼的編寫,并提高代碼面向這些處理器架構(gòu)的可移植性。這提供了一個(gè)統(tǒng)一的構(gòu)建環(huán)境,并整合了工具,以提高跨平臺(tái)生產(chǎn)力。作為該解決方案的一部分,英特爾和Codeplay將為英偉達(dá)GPU的oneAPI插件開始提供商業(yè)化的優(yōu)先支持(priority support)。

· 基于開源 SYCLomatic的英特爾® DPC++ 兼容性工具增加了100多個(gè)新的CUDA APIs支持,讓從CUDA到SYCL的代碼遷移變得更容易。

· 用戶可以使用英特爾®VTune™ Profiler識(shí)別大規(guī)模MPI應(yīng)用中的不均衡問(wèn)題。

· 英特爾® Advisor為英特爾數(shù)據(jù)中心GPU Max系列添加了自動(dòng)化roofline分析,以識(shí)別內(nèi)存、緩存或計(jì)算瓶頸,確認(rèn)其原因并進(jìn)行優(yōu)先處理,同時(shí)提供可操作的建議,以優(yōu)化從CPU到GPU 的工作負(fù)載分流中的重復(fù)數(shù)據(jù)傳輸成本。

48%4的開發(fā)者面向使用多種處理器的異構(gòu)系統(tǒng)進(jìn)行開發(fā),因此需要更高效的跨架構(gòu)編程來(lái)應(yīng)對(duì)現(xiàn)實(shí)工作負(fù)載日益擴(kuò)大的范圍和規(guī)模。結(jié)合使用oneAPI 的開放、統(tǒng)一的編程模型與英特爾基于標(biāo)準(zhǔn)的多架構(gòu)工具,開發(fā)者能夠在CPU和加速器的硬件、性能、生產(chǎn)力和代碼可移植性方面自由地進(jìn)行選擇。相反,為專有編程模型(如 CUDA)編寫的代碼,缺乏面向其它硬件的可移植性,讓開發(fā)實(shí)踐變得孤立,將企業(yè)困于一個(gè)封閉的生態(tài)系統(tǒng)中。

此外, 開放生態(tài)系統(tǒng)也在繼續(xù)擴(kuò)大對(duì)oneAPI的使用,新的oneAPI卓越中心正在陸續(xù)成立。劍橋大學(xué)Open Zettascale 實(shí)驗(yàn)室正致力于將重要的百萬(wàn)兆級(jí)的備選代碼(candidate codes)移植到oneAPI上,包括CASTEP、FEniCS和AREPO。該中心還提供課程和研討會(huì),由專家講授oneAPI使用方法和工具,用于編譯和移植代碼以及優(yōu)化性能。目前,在全球總共已經(jīng)建立了30個(gè)oneAPI卓越中心。

*可前往英特爾新聞發(fā)布室了解更多產(chǎn)品性能具體細(xì)節(jié)

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
英特爾

相關(guān)文章

  • 首次部署英特爾Max系列GPU,極光超算將推動(dòng)人工智能實(shí)現(xiàn)突破性進(jìn)展

    阿貢國(guó)家實(shí)驗(yàn)室和英特爾于近日宣布,Aurora超級(jí)計(jì)算機(jī)的10,624個(gè)刀片的安裝已經(jīng)完成,該系統(tǒng)將于2023年晚些時(shí)候上線。該機(jī)器使用數(shù)萬(wàn)個(gè)XeonMax“SapphireRapids”處理器,配備HBM2E內(nèi)存以及數(shù)以萬(wàn)計(jì)的數(shù)據(jù)中心GPUMax“PonteVecchio”計(jì)算GPU可實(shí)現(xiàn)超過(guò)2F

    標(biāo)簽:
    英特爾
  • 英特爾研究院發(fā)布全新AI擴(kuò)散模型,可根據(jù)文本提示生成360度全景圖

    英特爾研究院宣布與BlockadeLabs合作發(fā)布LDM3D(LatentDiffusionModelfor3D)模型,這一全新的擴(kuò)散模型使用生成式AI創(chuàng)建3D視覺(jué)內(nèi)容。LDM3D是業(yè)界領(lǐng)先的利用擴(kuò)散過(guò)程(diffusionprocess)生成深度圖(depthmap)的模型,進(jìn)而生成逼真的、沉浸式

    標(biāo)簽:
    英特爾
  • 英特爾銳炫:驅(qū)動(dòng)持續(xù)進(jìn)步,盡展硬件潛力

    發(fā)布之初,英特爾銳炫A770和A750顯卡就已展現(xiàn)出不錯(cuò)的實(shí)力。幾個(gè)月過(guò)去,它們已然成長(zhǎng)為同價(jià)位最好的顯卡之一。AMD和英偉達(dá)微弱的代際改進(jìn),再加上較高的價(jià)格,讓用戶很難在1500至2500元左右價(jià)位找到一款滿意的顯卡,不過(guò)英特爾銳炫顯卡悄悄地填補(bǔ)了這一空白。雖然銳炫A770和A750沒(méi)有主打旗艦級(jí)

    標(biāo)簽:
    英特爾
  • 英特爾銳炫Pro圖形顯卡發(fā)布新品,集豐富的內(nèi)容創(chuàng)作功能于一身

    英特爾推出兩款全新英特爾銳炫Pro圖形顯卡;搭載英特爾銳炫ProA40圖形顯卡的系統(tǒng)現(xiàn)已出貨。全新發(fā)布:英特爾今日宣布英特爾銳炫?ProA系列專業(yè)級(jí)圖形顯卡新增兩款產(chǎn)品——英特爾銳炫?ProA60和ProA60M。上述兩款產(chǎn)品的性能在現(xiàn)有英特爾銳炫Pro系列的基礎(chǔ)上更進(jìn)一步,為專業(yè)級(jí)工作站用戶精心設(shè)

    標(biāo)簽:
    英特爾
  • 英特爾發(fā)布全新量子芯片Tunnel Falls,硅自選量子比特有望更快實(shí)現(xiàn)量產(chǎn)

    今天,英特爾發(fā)布包含12個(gè)硅自旋量子比特(siliconspinqubit)的全新量子芯片TunnelFalls,繼續(xù)探索量子實(shí)用性,以解決重大難題。TunnelFalls是英特爾迄今為止研發(fā)的最先進(jìn)的硅自旋量子比特芯片,利用了英特爾數(shù)十年來(lái)積累的晶體管設(shè)計(jì)和制造能力。在英特爾的晶圓廠里,Tunne

    標(biāo)簽:
    英特爾

熱門排行

信息推薦