在日本的GPU技術大會(GTC)上,Nvidia推出了一款用于推理工作負載的新計算卡--Tesla T4。
該卡擁有320個Tensor核心和2560各CUDA核心,功耗低至75W,而FP16半精度峰值性能為65 TFLOPS,INT8為130 TFLOPS,INT4為260 TFLOPS。除了該Tesla計算卡外,英偉達還宣布推出面向數(shù)據(jù)中心的Nvidia TensorRT超大規(guī)模推理計算平臺,該平臺使用T4 GPU進行實時推理。
英偉達加速業(yè)務副總裁兼通用汽車(GM)伊恩?巴克(Ian Buck)表示:“我們的客戶正朝著人工智能能夠觸及和改善每一種產品和服務的未來飛奔?!庇ミ_TensorRT Hyperscale平臺的建立是為了實現(xiàn)這一目標,比以前的產品更快速、更高效。
微軟Bing和AI產品副總裁Jordi Ribas補充道:“在實時推理工作負載中使用Nvidia gpu改進了Bing的高級搜索功能,使我們能夠減少圖像的對象檢測延遲。我們期待與英偉達的下一代推理硬件和軟件合作,擴大人們從人工智能產品和服務中獲益的方式。
谷歌云的產品經理Chris Kleban也表示,公司“很高興能很快在谷歌云平臺上支持英偉達的Turing Tesla T4計算卡”。服務器制造商包括思科,戴爾EMC,富士通,HPE,IBM,甲骨文和Supermicro也計劃發(fā)布帶有T4的GPU服務器。
關于GTC的其他消息
本次東京GTC,Nvidia也參與了一些與自動駕駛汽車相關的計劃。有消息稱,日本電報電話集團計劃將基于Tensor Core GPU的Nvidia AI平臺作為其全公司“corevo”AI計劃的通用平臺,F(xiàn)ujifilm將使用DGX-2系統(tǒng)進行AI研究。