成人动漫一区二区三区_国产主播一区二区_亚洲欧美亚洲_欧洲一区二区三区免费视频

創(chuàng)業(yè)詞典網(wǎng) 創(chuàng)業(yè)知識學習分享

加入收藏

您所在的位置:首頁 > 創(chuàng)業(yè)資訊 > 科技創(chuàng)業(yè)

科技創(chuàng)業(yè)

AI時代來襲,你的存儲做好準備了嗎?

分類: 科技創(chuàng)業(yè) 創(chuàng)業(yè)詞典 編輯 : 創(chuàng)業(yè)知識 發(fā)布 : 10-04

閱讀 :563

企業(yè)內(nèi)部存儲架構的發(fā)展和演進,是個長期延續(xù)的過程, IT規(guī)劃人員有可能將人工智能(AI)視為未來幾年才需要投入的改造工程。

然而,AI大浪到來比想象中更快,越來越多行業(yè)將使用AI推動業(yè)務的變革。

另一方面,AI工作的負載不同于以往任何處理過的IT負載。

AI工作負載具有全新的特點,它面對的是海量的非結(jié)構化數(shù)據(jù)集,需要極高的隨機訪問性能,極低延時以及大規(guī)模存儲容量。

AI不僅會創(chuàng)造全新的行業(yè),而且還將從根本上改變現(xiàn)有組織業(yè)務開展的方式。

IT規(guī)劃人員需要立即開始著眼關注其存儲基礎架構是否已經(jīng)為即將到來的AI浪潮做好了準備。

AI對存儲提出了怎樣的要求?在回答現(xiàn)在有什么面向AI的存儲解決方案時,我們需要先了解一下,人工智能下的數(shù)據(jù)到底有哪些特征,基于這些數(shù)據(jù),到底需要一個什么樣的存儲?我們通過逐層分析,將最終過濾出AI業(yè)務對存儲的綜合訴求。

海量非結(jié)構化數(shù)據(jù)存儲AI業(yè)務中除了個別業(yè)務場景主要針對結(jié)構化數(shù)據(jù)進行分析外(例如消費記錄、交易記錄等風險控制、趨勢預測場景),大多數(shù)場景需要處理的是非結(jié)構化數(shù)據(jù),例如圖像識別、語音識別、自動駕駛等,這些場景通常使用的是深度學習的算法,必須依賴海量圖片、語音、視頻的輸入。

數(shù)據(jù)共享訪問多個AI計算節(jié)點需要共享訪問數(shù)據(jù)。

由于AI架構需要使用到大規(guī)模的計算集群(GPU服務器),集群中的服務器訪問的數(shù)據(jù)來自一個統(tǒng)一的數(shù)據(jù)源,即一個共享的存儲空間。

這種共享訪問的數(shù)據(jù)有諸多好處,它可以保證不同服務器上訪問數(shù)據(jù)的一致性,減少不同服務器上分別保留數(shù)據(jù)帶來的數(shù)據(jù)冗余等。

那么哪種接口能提供共享訪問?塊存儲,需要依賴上層的應用(例如Oracle RAC)實現(xiàn)協(xié)同、鎖、會話的切換等機制,才能實現(xiàn)在多節(jié)點間共享塊存儲設備,因此不適合直接用于AI應用。

能實現(xiàn)共享訪問的通常有對象存儲和文件存儲,從數(shù)據(jù)訪問的接口層面看,好像都能實現(xiàn)數(shù)據(jù)共享。

但哪個接口更方便,我們需要深入地看一下AI的上層應用框架如何使用存儲。

我們以AI生態(tài)中非常流行的PyTorch為例,PyTorch在加載圖片數(shù)據(jù)時,通常會調(diào)用以下程序:from torchvision import datasets, transformsdataset = datasets.ImageFolder('path/to/data', transform=transforms)那么torchvision的datasets.ImageFolder如何加載圖片呢?我們來看看ImageFolder的構造函數(shù),這里面會有一個默認的default_loader:默認的default_loader會是什么行為呢?我們再來看,通常情況下,default_loader會調(diào)用pil_loader方法:那pil_loader怎么讀數(shù)據(jù)的呢?謎底即將揭曉:這就是最典型的Python直接訪問文件系統(tǒng)文件的open方法,所以很明顯,PyTorch會默認通過文件接口訪問數(shù)據(jù)。

如果需要通過其它存儲接口調(diào)用ImageFolder,還需要為其編寫特定的loader,這就增加了額外不必要的開發(fā)工作量。

因此,從AI應用框架的角度看,文件接口是最友好的存儲訪問方式。

讀多寫少,高吞吐,低延時AI數(shù)據(jù)特點是讀多寫少,要求高吞吐、低延時。

深度學習過程訓練中,需要對數(shù)據(jù)進行訓練,以視覺識別為例,它需要加載數(shù)千萬張,甚至上億張圖片,針對圖片使用卷積神經(jīng)網(wǎng)絡、ResNet等算法,生成識別的模型。

完成一輪訓練后,為了減少圖片輸入順序的相關性對訓練結(jié)果帶來的影響,會將文件次序打亂之后,重新加載,訓練多個輪次(每個輪次稱之為epoch)。

這就意味著每個epoch都需要根據(jù)新的順序加載數(shù)千萬、上億張圖片。

圖片的讀取速度,即延時,對完成訓練過程的時間長短會造成很大影響。

前面提到,對象存儲和文件存儲都可以為GPU集群提供共享的數(shù)據(jù)訪問,那么哪個存儲接口能提供更低的延時呢?業(yè)界領先的國際水準的高性能對象存儲,讀延時約為9ms,而高性能文件系統(tǒng)延時通常為2-3ms,考慮到數(shù)億張圖片的n次加載,這個差距會被放大到嚴重影響AI訓練效率。

從文件加載的角度看,高性能文件系統(tǒng)在延時特性上,也成為AI的首選。

IO Pattern復雜大文件、小文件,順序讀、隨機讀混合場景。

不同的業(yè)務類型所對應的數(shù)據(jù)具有不同特點,例如視覺識別,通常處理的是100KB以下的小文件;語音識別,大多數(shù)1MB以上的大文件,對這些獨立的文件,采用的是順序讀。

而有的算法工程師,會將幾十萬、甚至千萬個小文件聚合成一個數(shù)百GB,甚至TB級別的大文件,在每個epoch中,根據(jù)框架隨機生成的序列,對這些大文件進行隨機讀。

在無法預測文件大孝IO類型的背景下,對復雜IO特征的高性能支持,也是AI業(yè)務對存儲的需求。

AI業(yè)務容器化AI應用業(yè)務逐步向Kubernetes容器平臺遷移,數(shù)據(jù)訪問自然要讓AI業(yè)務在容器平臺中最方便地使用。

理解這一點非常容易,在業(yè)務單機運行的時代,數(shù)據(jù)放在直通到服務器的磁盤上,稱之為DAS模式。

到了業(yè)務運行在多物理機組成的集群時代,為了統(tǒng)一管理和方便使用數(shù)據(jù),數(shù)據(jù)存放在SAN陣列上。

到云時代,數(shù)據(jù)跟著放到了云上,放到了適合云訪問的分布式存儲、對象存儲里。

由此可見,數(shù)據(jù)總是需要通過業(yè)務訪問最方便的方式進行存放和管理。

那么到了容器時代、云原生時代,數(shù)據(jù)自然應該放到云原生應用訪問和管理最方便的存儲上。

運行平臺向公有云發(fā)展公有云成為AI業(yè)務更青睞或首選的運行平臺,而公有云原生的存儲方案更面向通用型應用,針對AI業(yè)務的高吞吐、低延時、大容量需求,存在一定欠缺。

AI業(yè)務大多具有一定的潮汐性,公有云彈性和按需付費的特性,再加上公有云高性能GPU服務器產(chǎn)品的成熟及使用,使公有云的計算資源成為了AI業(yè)務降本增效的首眩而與AI業(yè)務相配套,具有前面所述特點的公有云存儲方案,卻仍然缺失。

近年來,我們看到一些國外的存儲廠商(例如NetApp、Qumulo、ElastiFile等),將其產(chǎn)品發(fā)布并運行在了公有云上,是公有云的原生存儲產(chǎn)品和方案距離用戶特定業(yè)務應用訴求存在缺失的的印證和解讀。

同樣,適合AI應用的存儲方案在公有云上的落地,是解決AI在公有云進一步落地的最后一公里問題。

現(xiàn)有哪些AI存儲方案,能滿足以上AI大規(guī)模應用的需求嗎?數(shù)據(jù)直接存入GPU服務器的SSD,即DAS方式。

這種方式能保證數(shù)據(jù)讀取的高帶寬、低延時,然而相較而言,缺點更為明顯,即數(shù)據(jù)容量非常有限,與此同時,SSD或NVMe磁盤的性能無法被充分發(fā)揮(通常情況下,高性能NVMe的性能利用率不足50%),不同服務器間的SSD形成孤島,數(shù)據(jù)冗余現(xiàn)象非常嚴重。

因此,這種方式在真正的AI業(yè)務實踐中,極少被使用。

共享的向上擴展(Scale-Up)的存儲陣列是可用的共享解決方案中最常見的,也可能是最熟悉的方案。

與DAS一樣,共享的存儲陣列也存在類似的缺點,相對于傳統(tǒng)的工作負載,AI的工作負載實際上會將這些缺點暴露得更快。

最明顯的是系統(tǒng)可以存儲多少總數(shù)據(jù)? 大多數(shù)傳統(tǒng)陣列系統(tǒng)每個系統(tǒng)幾乎只能增長到1 PB的存儲,并且由于大多數(shù)AI大規(guī)模工作負載將需要數(shù)十PB的存儲量,因此企業(yè)只能不斷采購新的存儲陣列,導致數(shù)據(jù)孤島的產(chǎn)生。

即使克服了容量挑戰(zhàn),傳統(tǒng)陣列存儲也會造成性能問題。

這些系統(tǒng)通常只能支持有限數(shù)量的存儲控制器,最常見的是兩個控制器,而典型的AI工作負載是高度并行的,它很容易使小型控制器不堪重負。

用戶通常使用的是GlusterFS、CephFS、Lustre,開源分布式文件系統(tǒng)的首要問題是管理和運維的復雜度。

其次,GlusterFS、CephFS對海量小文件,及大規(guī)模、大容量背景下的性能難以保證。

考慮到高昂的GPU價格,如果在數(shù)據(jù)訪問上不能給予足夠的支撐,GPU的投入產(chǎn)出比將大幅降低,這是AI應用的管理者們最不希望看到的。

在對象存儲上搭建文件訪問接口網(wǎng)關。

首先對象存儲對隨機寫或追加寫存在天然劣勢,會導致AI業(yè)務中出現(xiàn)寫操作時,不能很好支持。

其次,對象存儲在讀延時上的劣勢,經(jīng)過文件訪問接口網(wǎng)關后,再一次被放大。

雖然通過預讀或緩存的方式,可以將一部分數(shù)據(jù)加載到前端的SSD設備上,但這會帶來以下幾個問題:1)導致上層AI框架需要針對底層的特殊架構進行適配,對框架具有入侵性,例如執(zhí)行預讀程序;2)會帶來數(shù)據(jù)加載速度不均,在數(shù)據(jù)加載過程中,或前端SSD緩存不命中時,GPU利用率下降50%-70%。

以上這些方案,僅從數(shù)據(jù)規(guī)模的可擴展性、訪問性能、AI平臺的通用性上分析來看,都不是理想的面向AI的存儲方案。

YRCloudFile面向AI場景的存儲產(chǎn)品YRCloudFile具備的幾大特性非常契合AI應用的綜合需求。

總結(jié)通過分析,我們希望能夠給AI業(yè)務的規(guī)劃人員提供關于AI業(yè)務對存儲實際需求的觀察和洞見,幫助客戶在AI業(yè)務落地,提供AI存儲產(chǎn)品的優(yōu)化方案。

AI將成為信息化工業(yè)革命后,再次改變世界的技術和方向,AI浪潮已經(jīng)在不經(jīng)意間來到我們的身邊,是時候考慮面向AI的新型存儲了。

10-04

下一篇:家用機器人風口來臨,科技巨頭的布局有哪些差異? 下一篇 【方向鍵 ( → )下一篇】

上一篇:馬云的“無人超市”闖進火神山,無人零售將“復活”? 上一篇 【方向鍵 ( ← )上一篇】

成人动漫一区二区三区_国产主播一区二区_亚洲欧美亚洲_欧洲一区二区三区免费视频
欧美日韩你懂得| thepron国产精品| 艳妇臀荡乳欲伦亚洲一区| 国产三级一区二区三区| 欧美精品一区二区高清在线观看| 欧美日韩免费观看一区三区| 欧美日韩夫妻久久| 欧美日本在线看| 日韩欧美一区中文| 日韩欧美高清dvd碟片| 日韩精品一区二区三区四区| 91精品国产综合久久久久久漫画 | 综合久久久久综合| 综合久久久久综合| 一区二区免费视频| 亚洲一区在线观看免费| 亚洲第一成人在线| 精品一区二区免费在线观看| 亚洲观看高清完整版在线观看| 婷婷亚洲久悠悠色悠在线播放| 亚洲成在人线免费| 久久99这里只有精品| 国产成人一区在线| 欧美在线小视频| 制服丝袜av成人在线看| 日韩午夜精品电影| 亚洲国产激情av| 亚洲福利视频导航| 精品一区二区三区免费观看| 成人久久视频在线观看| 在线视频观看一区| 欧美不卡一区二区| 国产日韩欧美一区二区三区乱码| 亚洲欧美日韩系列| 视频一区在线视频| 成人动漫中文字幕| 日韩一区二区三| 亚洲摸摸操操av| 国产综合久久久久久鬼色| 色婷婷综合久久| 欧美一级二级在线观看| 国产精品色在线| 美女一区二区视频| 91视频在线观看| 精品国产伦一区二区三区观看体验 | 亚洲va欧美va人人爽午夜| 国产一区二区中文字幕| 欧美私模裸体表演在线观看| 国产亚洲欧美一区在线观看| 偷拍日韩校园综合在线| aaa欧美色吧激情视频| 精品国产乱码91久久久久久网站| 亚洲免费高清视频在线| 国产精华液一区二区三区| 欧美精品一级二级| 亚洲色图欧美在线| 国产成人精品影视| 26uuu久久天堂性欧美| 日韩专区一卡二卡| 欧美婷婷六月丁香综合色| 中文字幕高清一区| 国产成人免费高清| 久久婷婷成人综合色| 天天亚洲美女在线视频| 欧美性xxxxxxxx| 一区二区在线电影| 91在线观看成人| 国产精品沙发午睡系列990531| 国产米奇在线777精品观看| 678五月天丁香亚洲综合网| 一区二区三区资源| 欧美性xxxxxx少妇| 午夜精品在线视频一区| 色噜噜狠狠色综合中国| 亚洲色图制服诱惑| 91福利国产成人精品照片| 亚洲三级在线看| 色综合久久天天| 亚洲精品videosex极品| 色呦呦一区二区三区| 亚洲欧美自拍偷拍色图| 91麻豆精品视频| 亚洲一区在线观看免费| 欧美美女网站色| 日韩av一区二区在线影视| 欧美一级精品大片| 狠狠色丁香婷综合久久| 国产欧美日韩视频一区二区| 成人av午夜电影| 亚洲精选一二三| 欧美日韩国产高清一区二区 | 欧美日韩mp4| 午夜伦理一区二区| 精品人伦一区二区色婷婷| 国产综合一区二区| 亚洲视频在线一区| 欧美视频一区在线| 狠狠色狠狠色综合日日91app| 久久久久97国产精华液好用吗| 成人禁用看黄a在线| 一区二区三区高清在线| 日韩免费电影一区| 国产成人午夜视频| 亚洲高清免费观看高清完整版在线观看| 欧美日韩国产片| 国产精品自拍毛片| 一区二区三区在线视频免费| 91精品国产高清一区二区三区| 国产自产高清不卡| 一级精品视频在线观看宜春院 | 亚洲福利一区二区三区| 精品免费国产二区三区| 不卡电影免费在线播放一区| 爽好多水快深点欧美视频| 国产视频视频一区| 5858s免费视频成人| 国产高清成人在线| 日韩电影免费在线观看网站| 中文字幕不卡在线播放| 日韩一区二区三区视频在线| fc2成人免费人成在线观看播放| 午夜精品免费在线| 亚洲国产精品国自产拍av| 欧美一区二区在线看| 成人av电影在线| 精品一区二区三区在线观看| 亚洲在线一区二区三区| 国产精品网站一区| 欧美变态凌虐bdsm| 欧美夫妻性生活| 91女人视频在线观看| 福利一区在线观看| 黄网站免费久久| 日韩av一区二| 天堂蜜桃91精品| 亚洲国产一区二区在线播放| 国产精品美女久久久久久久 | 欧美少妇性性性| 99精品1区2区| 国产精品一区免费视频| 久久国产精品99久久久久久老狼| 亚洲精品国产a久久久久久| 欧美激情一区二区三区四区| 日韩午夜三级在线| 日韩免费视频一区二区| 91精品国产综合久久久久久漫画| 色婷婷久久综合| 色女孩综合影院| 91一区二区在线观看| 色婷婷综合久久久中文一区二区 | 国产婷婷色一区二区三区在线| 欧美一区二区福利在线| 日韩一级二级三级精品视频| 欧美一区二区三区日韩视频| 91精品国产色综合久久| 日韩精品一区二区在线| 26uuu久久综合| 国产精品水嫩水嫩| 中文字幕在线一区免费| 亚洲视频一区二区免费在线观看| 中文字幕在线观看不卡视频| 国产精品初高中害羞小美女文| 国产精品理伦片| 一区二区三区高清在线| 午夜欧美一区二区三区在线播放| 日韩高清不卡一区二区| 国内精品写真在线观看| 成人高清av在线| 欧美自拍丝袜亚洲| 欧美一级日韩一级| 2024国产精品| 国产精品久久久久久久久久久免费看 | 国产宾馆实践打屁股91| 成人免费电影视频| 欧美在线观看禁18| 欧美一二区视频| 国产精品欧美久久久久一区二区| 国产精品传媒入口麻豆| 午夜精品福利视频网站| 国产在线视视频有精品| 99久久久国产精品免费蜜臀| 欧美性xxxxx极品少妇| 欧美精品一区二区三| 亚洲激情自拍偷拍| 伦理电影国产精品| 一本大道av一区二区在线播放| 欧美一级久久久| 中文字幕一区二区三区视频| 日韩高清不卡在线| 99久久精品国产网站| 欧美一区二区视频观看视频| 久久综合狠狠综合久久综合88| 亚洲色图在线播放| 国产一区二区三区四区在线观看| 成人av综合在线| 精品盗摄一区二区三区| 亚洲狠狠爱一区二区三区| 国产精品一二三在| 在线综合视频播放| 亚洲天堂av老司机|