認識和了解EMC數據湖(Data Lake 2.0)
在上一篇文章中已經詳細介紹了什麼是數據湖,已經EMC的數據湖1.0產品,本節主要介紹一下EMC最近發布的數據湖產品2.0。“數據湖“可以存儲所有需要使用的數據,這些數據包括傳統的數據庫結構化數據,以及文本之類的非結構化數據。同時,”數據湖“還是一個共享的大數據分析平台,在”數據湖“中可以通過分析數據找到數據之間的關聯性。
EMC做為存儲業界的技術先驅和領導者,為了進一步擴展”數據湖“概念的內涵,為迎接數據湖2.0時代,EMC發布了下麵的三款產品:
l Isilon SD Edge,擴大數據湖邊際;
l 第8代Isilon操作係統
l Isilon CloudPools,通過擁抱混合雲,實現降低使用成本
EMC IsilonSD Edge
根據ESG的研究報告,現今53%的大型企業擁有100個以上的遠程分支機構,在2011年這個比例為30%。而連接數據中心的遠程分支部門往往麵臨著磁盤可用空間少、管理複雜、分支技術人員水平參差不齊以及使用不同的文件係統格式等問題,IsilonSD Edge可以解決所有這些問題。
IsilonSD Edge是一款100%軟件定義的,支持X86平台的數據管理軟件。它可以運行在VMware上,並且與VMware vCenter完全集成,管理簡便。此外,IsilonSD Edge不同於Isilon模擬器,它最多可以支持安裝6個節點,最大支持36TB的容量。安裝了IsilonSD Edge軟件的主機具有OneFS操作係統的全部功能,可以使用OneFS操cao作zuo係xi統tong支zhi持chi的de數shu據ju服fu務wu和he網wang絡luo協xie議yi,核he心xin和he邊bian緣yuan之zhi間jian可ke以yi使shi用yong複fu製zhi功gong能neng來lai拷kao貝bei數shu據ju。通tong過guo該gai軟ruan件jian可ke以yi極ji大da的de縮suo短duan遠yuan程cheng分fen支zhi部bu門men訪fang問wen文wen件jian係xi統tong的de速su度du,提ti高gao數shu據ju服fu務wu的de連lian續xu性xing和he經jing濟ji性xing。

第8代Isilon操作係統
除了EMC IsilonSD Edge功能,明年初EMC還會推出Isilon第8代操作係統,在最新版本中將會有以下幾點改進:
l 全新OneFS內核可以提供更強勁的性能和更全麵的功能,進一步提高數據湖的能力。
l 新版本將支持SMB 3.0協議,實現客戶端非破壞性重新連接。
l 改進Insight IQ和文件分析數據能力,簡化管理。
l 支持完整的無中斷升級功能,以及操作係統版本回滾功能。
新版本中的增強功能可以簡化Isilon的管理,提高效率,增加靈活性,並為數據湖2.0提供更強的運算能力。


EMC CloudPool
近(jin)年(nian)來(lai)隨(sui)著(zhe)用(yong)戶(hu)信(xin)息(xi)量(liang)的(de)快(kuai)速(su)增(zeng)長(chang),如(ru)何(he)借(jie)助(zhu)分(fen)層(ceng)技(ji)術(shu)實(shi)現(xian)在(zai)不(bu)犧(xi)牲(sheng)係(xi)統(tong)性(xing)能(neng)和(he)數(shu)據(ju)保(bao)護(hu)的(de)情(qing)況(kuang)下(xia)降(jiang)低(di)基(ji)礎(chu)架(jia)構(gou)成(cheng)本(ben)的(de)技(ji)術(shu)一(yi)直(zhi)備(bei)受(shou)關(guan)注(zhu)。EMC Isilon支持不同存儲層之間的數據遷移,這些存儲層包括Isilon S係列(一級)、X(一級或者二級)和NL係列(二級或者三級)歸檔平台。但是,為了進一步降低“數據湖”數據歸檔的成本,EMC推出了CloudPool功能。CloudPool可以讓Isilon輕鬆的擴展到公有雲、私有雲和混合雲。企業中許多常年不使用的數據就可以被轉移到雲平台,這些平台包括AWS S3、Azure Blobs、EMC ECS和Virtustream。
在Isilon可擴展其核心命名空間到雲以後,可以在確保安全訪問的前提下,讓數據湖的規模擴展到雲規模,並極大的降低數據湖的使用成本。

用一個成本比較就可以看出Isilon如何有效降低數據湖的使用成本。VNX存儲每GB使用3年的成本為1美元,Isilon存儲每GB使用3年的成本為0.5美元,ECS該成本則為0.2美元。






閩公網安備 35020302001891號