新聞中心
隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,人們處理和分析數(shù)據(jù)的需求也越來越大。在這樣的背景下,大數(shù)據(jù)應(yīng)運而生,成為了信息時代海量數(shù)據(jù)處理和分析的重要手段。但是,大數(shù)據(jù)的存儲和處理需要巨大的存儲空間和強大的計算能力,這也促進(jìn)了大數(shù)據(jù)存儲技術(shù)的不斷發(fā)展。本文將重點介紹大數(shù)據(jù)存儲技術(shù)中的陣列方式以及其優(yōu)勢。

公司主營業(yè)務(wù):網(wǎng)站建設(shè)、網(wǎng)站設(shè)計、移動網(wǎng)站開發(fā)等業(yè)務(wù)。幫助企業(yè)客戶真正實現(xiàn)互聯(lián)網(wǎng)宣傳,提高企業(yè)的競爭能力。成都創(chuàng)新互聯(lián)公司是一支青春激揚、勤奮敬業(yè)、活力青春激揚、勤奮敬業(yè)、活力澎湃、和諧高效的團(tuán)隊。公司秉承以“開放、自由、嚴(yán)謹(jǐn)、自律”為核心的企業(yè)文化,感謝他們對我們的高要求,感謝他們從不同領(lǐng)域給我們帶來的挑戰(zhàn),讓我們激情的團(tuán)隊有機(jī)會用頭腦與智慧不斷的給客戶帶來驚喜。成都創(chuàng)新互聯(lián)公司推出友誼免費做網(wǎng)站回饋大家。
一、陣列方式的概念
陣列方式是一種大規(guī)模的數(shù)據(jù)存儲技術(shù),它結(jié)合了多個物理硬盤(或閃存存儲)來形成一個虛擬磁盤,可以提供更大的存儲容量和更高的數(shù)據(jù)可靠性。陣列方式可以通過多種形式實現(xiàn),例如鏡像陣列、條帶化陣列、混合陣列等。
二、陣列方式的優(yōu)勢
1. 提高數(shù)據(jù)容量
陣列方式集成了多塊物理硬盤,在不同的硬盤上實現(xiàn)的數(shù)據(jù)存儲經(jīng)過計算機(jī)指定的算法處理后,視為一個獨立的、巨大的存儲設(shè)備。因此,使用陣列方式可以將多個硬盤的存儲容量累加到一起,大大提高了數(shù)據(jù)容量。
2. 提升數(shù)據(jù)傳輸速率
陣列方式還可以提升數(shù)據(jù)的傳輸速率。在陣列設(shè)備中,數(shù)據(jù)可以同時存儲在多個硬盤上,當(dāng)數(shù)據(jù)傳輸時,可以通過多塊硬盤同時進(jìn)行,從而大大提高數(shù)據(jù)傳輸速率。
3. 提高數(shù)據(jù)可靠性
當(dāng)使用陣列方式存儲大規(guī)模的數(shù)據(jù)時,如果某個硬盤出現(xiàn)了問題,其它硬盤仍可以正常工作,因此數(shù)據(jù)的可靠性也得到了提高。陣列方式中還可以使用冗余技術(shù),將數(shù)據(jù)存儲在多個物理硬盤上,當(dāng)某個硬盤發(fā)生故障時,其他硬盤上的數(shù)據(jù)可以起到備份的作用,保障數(shù)據(jù)的安全性。
4. 提升系統(tǒng)性能
使用陣列方式不僅可以提高存儲容量和數(shù)據(jù)傳輸速率,還可以提升系統(tǒng)性能。由于陣列設(shè)備可以實現(xiàn)多個硬盤同時讀寫數(shù)據(jù),因此對于需要高強度讀寫數(shù)據(jù)的場景,使用陣列方式可以大大提高系統(tǒng)性能。
三、使用陣列方式存儲大數(shù)據(jù)的注意事項
1. 為了獲得更好的系統(tǒng)性能,建議使用相同容量、相同規(guī)格和相同型號的物理硬盤。
2. 在配置陣列時,應(yīng)選擇一種合適的算法,因為不同的算法在容錯性、性能、可擴(kuò)展性等方面有所不同。
3. 設(shè)備出現(xiàn)故障時,盡快進(jìn)行檢查和修復(fù),以保障數(shù)據(jù)的安全性。
4. 進(jìn)行備份,以防止設(shè)備故障造成重要數(shù)據(jù)丟失。
四、結(jié)論
陣列方式是大數(shù)據(jù)存儲技術(shù)中應(yīng)用最為廣泛的一種方式,它可以大大提高存儲容量、數(shù)據(jù)傳輸速率、數(shù)據(jù)可靠性和系統(tǒng)性能。在使用陣列方式存儲大數(shù)據(jù)時,需要了解一些注意事項,以保障數(shù)據(jù)的安全和系統(tǒng)的穩(wěn)定性。
相關(guān)問題拓展閱讀:
- 什么是磁盤陣列?
什么是磁盤陣列?
磁盤陣列(Redundant Arrays of Independent Drives,RAID),有“旦敬獨立磁盤構(gòu)成的具有冗余能力的陣列”之意。磁盤陣列是由很多塊獨立的磁盤,組合成一個容量巨大的磁盤組,利用個別磁盤提供數(shù)據(jù)所產(chǎn)生加成效果提升整橋鋒個磁盤系統(tǒng)效能。敏遲晌
磁盤陣列簡述:
磁盤陣列是一種把若干硬磁盤驅(qū)動器按照一定要求組成一個整體,整個磁盤陣列由陣列控制器管理的系統(tǒng)。冗余磁盤陣列RAID(Redundant Array of Independent Disks)技術(shù)1987年由加州大學(xué)伯克利分校提出,最初的研制目的是為了組合小的廉價磁盤來代替大的昂貴磁盤,以降低大批量數(shù)據(jù)存儲的費用(當(dāng)時RAID稱為Redundant Array of Inexpensive Disks 廉價的磁盤陣列),同時也希望采用冗余信息的方式,使得磁盤失效時不會使對數(shù)據(jù)的訪問受損失,從而開發(fā)出一定水平的數(shù)據(jù)保護(hù)技術(shù)。
磁盤陣列的工作原理與特征:
RAID的基本結(jié)昌巖構(gòu)特征就是組合(Striping),捆綁2個或多個物理磁盤成組,形成一個單獨的邏輯盤。組合套(Striping Set)是指將物理磁盤組捆綁在一塊兒。在利用多個磁盤驅(qū)動器時,組合能夠提供比單個物理磁盤驅(qū)動器更好的性能提升。 數(shù)據(jù)是以塊(Chunks)的形式寫入組合套中的,塊的尺寸是一個固定的值,在捆綁過程實施前就已選定。塊尺寸和平均I/O需求的尺寸之間的關(guān)系決定了組合套的特性??偟膩碚f,選擇塊尺寸的目的是為了更大程度地提高性能,以適應(yīng)不同特點的計算環(huán)境應(yīng)用。
磁盤陣列優(yōu)點:
磁盤陣列有許多優(yōu)點:首先,提高了存儲容量;其次,多臺磁盤驅(qū)動器可并行工作,提高了數(shù)據(jù)傳輸率;…RAID技術(shù)確實提供了比通常的磁盤存儲更高的性能指標(biāo)、數(shù)據(jù)完整性和數(shù)據(jù)可用性,尤其是在當(dāng)今面臨的I/O總是滯后于CPU性能的瓶頸問題越來越突出的情況下,RAID解決方案能夠有效地彌補這個缺口。
陣列技術(shù)的介紹:
RAID技術(shù)是一種工業(yè)標(biāo)準(zhǔn),各廠商對RAID級別的定義也不盡相同。目前對RAID級別的定義可以獲得業(yè)界廣泛認(rèn)同的有4種,RAID 0、RAID 1、RAID 0+1和RAID 5,我們常見的主板自帶的陣列芯片或陣列卡能支持的模式有:RAID 0、RAID 1、RAID 0+1。
1) RAID 0是無數(shù)據(jù)冗余的存儲空間條帶化,它將所有硬盤構(gòu)成一個磁盤陣列,可以同時對多個硬盤做讀寫動作,但是不具備備份及容錯能力,具有成本低、讀寫性能極高、存儲空間利用率高等特點,在理論上可以提高磁盤子系統(tǒng)的性能。
2) RAID 1是兩塊硬盤數(shù)據(jù)完全鏡像,可以提高磁盤子系統(tǒng)的安全性,技術(shù)簡單,管理方便,讀寫性能均好。但它無法擴(kuò)展(單塊硬盤容量),數(shù)據(jù)空間浪費大,嚴(yán)格意義上說,不應(yīng)稱之為“陣列”。
3) RAID 0+1綜合了RAID 0和RAID 1的特點,獨立磁盤配置成RAID 0,兩套完整的RAID 0互相鏡像。它的讀寫性能出色,安全性高,但構(gòu)弊迅猛建陣列的成本投入大,數(shù)據(jù)空間利用率低,不能稱之為經(jīng)濟(jì)高效的方案。
常見的陣列卡芯片有三種:Promise(喬鼎信息)、highpoint、ami(美商安邁)。這三種芯租橋片都有主板集成或獨立的陣列卡這二種形式的產(chǎn)品。我們主要用到的是Promise陣列卡,經(jīng)過測試在無盤中穩(wěn)定,并且不容易壞Promise常見的陣列芯片有:Promise Fasttrak 66、Fasttrak 100、Fasttrak 133、20232、20235、20237、20230、Fasttrak TX2、Fasttrak TX4、Fasttrak TX2023,TX4000.Highpoint常見的陣列芯片有:highpoint 370、370a、372、372a。AMI / LSI Logic MegaRAID 這種芯片的產(chǎn)品我們用得很少,現(xiàn)在知道的有艾崴 WO2-R主板上集成了American Megatrends MG80649 控制器,其陣列卡的產(chǎn)品也沒有使用過。
注意事項:
1) 用來創(chuàng)建磁盤陣列的硬盤一般需成對使用。
2) 強烈建議使用型號、容量、品牌均一致的四個硬盤來做陣列。
3) 陣列卡和一部分集成的陣列芯片支持雙陣列,當(dāng)您使用四個硬盤來做陣列時,建議設(shè)置為雙陣列。但如果主板集成的是Promise類芯片,幾乎都不支持創(chuàng)建雙陣列。(4)、沒有安裝對應(yīng)的陣列驅(qū)動程序或驅(qū)動程序不對,而又設(shè)置為由陣列啟動時,NT服務(wù)器啟動時將會藍(lán)屏。任何創(chuàng)建陣列或者重建陣列的操作都將清除硬盤或者陣列上的所有現(xiàn)有數(shù)據(jù)!
陣列卡的作用,簡單的一句話就是加快網(wǎng)吧的速度,本為一個IDE的硬盤在帶30以上就會造成瓶頸,速度就會慢下來,想提高速度一定得做陣列,這樣不但速度快,以后加機(jī)器也不會有太大的影響。
做陣列注意的是:
陣列的一個誤區(qū)就是大家還是把磁盤分開來看,作為陣列,你只能把做陣列的硬盤當(dāng)成一個大的硬盤!在拷盤前我們用SFDISK(或者用其它分區(qū)軟件,不用FDISK.EXE,因為FDISK.EXE只認(rèn)80G,而一般做陣列后,硬盤都大于80G)對其進(jìn)行分區(qū),然后用GHOST將盤刻到陣列硬盤上面!
只要硬盤的位置與數(shù)據(jù)線不脫離,陣列卡如果換同名的陣列卡,其內(nèi)容是不會改變的,因為陣列卡中相關(guān)參數(shù)設(shè)置保存在了硬盤當(dāng)中。
磁盤陣列
1. 什么是磁盤陣列(Disk Array)?
磁盤陣列(Disk Array)是由一個硬盤控制器來控制多個硬盤的相互連接,使多個硬盤的讀寫同步,減少錯誤,增加效率和可靠度的技術(shù)。
2.什么是RAID?
RAID是Redundant Array of Inexpensive Disk的縮寫,意為廉價冗余磁盤陣列,是磁盤陣列在技術(shù)上實現(xiàn)的理論標(biāo)準(zhǔn),其目的在于減少錯誤、提高存儲系統(tǒng)的性能與可靠度。常用的等級有1、3、5級等。
3.什么是RAID Level 0?
RAID Level 0是Data Striping(數(shù)據(jù)分割)技術(shù)的實現(xiàn),它將所有硬盤構(gòu)成一個磁盤陣列,可以同時對多個硬盤做讀寫動作,但是不具備備份及容錯能力,它價格便宜,硬盤使用效率更佳,但是可靠度是最差的。
以一個由兩個硬盤組成的RAID Level 0磁盤陣列為例,它把數(shù)據(jù)的第1和2位寫入之一個硬盤,第三和第四位寫入第二個硬盤……以此類推,所以叫“數(shù)據(jù)分割”,因為各盤數(shù)據(jù)的寫入動作是同時做的,所以它的存儲速度可以比單個硬盤快幾倍。
但是,這樣一來,萬一磁盤陣列上有一個硬盤壞了,由于它把數(shù)據(jù)拆開分別存到了不同的硬盤上,壞了一顆等于中斷了數(shù)據(jù)的完整性,如果沒有整個磁盤陣列的備份磁帶的話,所有的數(shù)據(jù)是無法挽回的。因此,盡管它的效率很高,但是很少有人冒著數(shù)據(jù)丟失的危險采用這項技術(shù)。
4.什么是RAID Level 1?
RAID Level 1使用的是Disk Mirror(磁盤映射)技術(shù),就是把一個硬盤的內(nèi)容同步備份復(fù)制到另一個硬盤里,所以具備了備份和容錯能力,這樣做的使用效率不高,但是可靠性高。
5.什么是RAID Level 3?
RAID Level 3采用Byte-interleaving(數(shù)據(jù)交錯存儲)技術(shù),硬盤在SCSI控制卡下同時動作,并將用于奇偶校驗的數(shù)據(jù)儲存到特定硬盤機(jī)中,它具備了容錯能力,硬盤的使用效率是安裝幾個就減掉一個,它的可靠度較佳。
6.什么是RAID Level 5?
RAID Level 5使用的是Disk Striping(硬盤分割)技術(shù),與Level 3的不同之處在于它把奇偶校驗數(shù)據(jù)存放到各個硬盤里,各個硬盤在SCSI控制卡的控制下平行動作,有容錯能力,跟Level 3一樣,它的使用效率也是安裝幾個再減掉一個。
7.什么是熱插拔硬盤?
熱插拔硬盤英文名為Hot-Swappable Disk,在磁盤陣列中,如果使用支持熱插拔技術(shù)的硬盤,在有一個硬盤壞掉的情況下,服務(wù)器可以不用關(guān)機(jī),直接抽出壞掉的硬盤,換上新的硬盤。一般的商用磁盤陣列在硬盤壞掉的時候,會自動鳴叫提示管理員更換硬盤。
磁盤陣列(Disk array)原理
為什么需要磁盤陣列? 如何增加磁盤的存取(acces)速度,如何防止數(shù)據(jù)因磁盤的故障而失落及如 何有效的利用磁盤空間,一直是電腦專業(yè)人員和用戶的困憂;而大容量磁盤的價 格非常昂貴,對用戶形成很大的負(fù)擔(dān)。磁盤陣列技術(shù)的產(chǎn)生一舉解決了這些問題。
過去十年來,CPU的處理速度幾乎是幾何級數(shù)的躍升,內(nèi)存(memory)的 存取速度亦大幅增加,而數(shù)據(jù)儲存裝置——它要是磁盤(hard disk)——的存取 速度相較之下。較為緩慢。整個I/0吞吐量不能和系統(tǒng)匹配,形成電腦系統(tǒng)的瓶 頸,降低了電腦系統(tǒng)的整體性能(throughout)若不能有效的提升磁盤的存取速 度,CPU、內(nèi)存及磁盤間的不平衡將使CPU及內(nèi)存的改進(jìn)形成浪費。
目前改進(jìn)磁盤存取速度的方式主要有兩種。一是磁盤快取控制(disk cache controller),它將從磁盤讀取的數(shù)據(jù)存在快取內(nèi)存(cache memory)中以減少磁 盤存取的次數(shù)。數(shù)據(jù)的讀寫都在cache內(nèi)存中進(jìn)行,大幅增加存取的速度,如要讀 取的數(shù)據(jù)不在cache內(nèi)存中,或要寫數(shù)據(jù)到磁盤時,才做磁盤的存取動作。這種方 式在單工期環(huán)境(Single—tasking envioronment)如DOS之下。對大量數(shù)據(jù)的 存取有很好的性能(量小且頻繁的存取則不然)。但在多工(multi—tasking)環(huán) 境之下(因為要不停的作數(shù)據(jù)交換(swapping)的動作)或數(shù)據(jù)庫(database) 的存取(因每一記錄都很小)就不能顯示其性能。這種方式?jīng)]有任何安全保障。
其一是使用磁盤陣列的技術(shù)。磁盤陣列是把多個磁盤組成一個陣列,當(dāng)作單 一磁盤使用,它將數(shù)據(jù)以分段(striping)的方式儲存在不同的磁盤中,存取數(shù)據(jù) 時,陣列中的相關(guān)磁盤一起動作:大幅減低數(shù)據(jù)的存取時間,同時有更佳的空間 利用率。磁盤陣列所利用的不同的技術(shù),稱為RAID level,不同的level針對不 同的系統(tǒng)及應(yīng)用,以解決數(shù)據(jù)安全的問題。
一般高性能的磁盤陣列都足以硬件的形式來達(dá)成、進(jìn)—步的把磁盤cache控制 及磁盤陣列結(jié)合在—個控制器(RAID controler)或控制卡個,針對個同的用戶 解決人們對磁盤輸出/入系統(tǒng)的四大要求:
(1)增加存取速度。
(2)容錯(fault tolerance),即安全性。
(3)有效的利用磁盤空間。
(4)盡量的平衡CPU,內(nèi)存及磁盤的性能并異,提高電腦的整體工作性能。
磁盤陣列原理
1987年,加州伯克利大學(xué)的一位人員發(fā)表了名為“磁盤陣列研究”的論文, 正式提到了RAID也就是滋盤陣列,論文提出廉價的5.25”及3.5”的硬盤也能如 大機(jī)器上的8”盤能提供人容量、高性能和數(shù)據(jù)的一致性,并詳述了RAIDl至5 的技術(shù)。 磁盤陣列針對不同的應(yīng)用使用的不同技術(shù),稱為RAID level,RAID是Redundant Array of Inexpenslve Disks的縮寫,而每一level代表一種技術(shù),目前 業(yè)界公認(rèn)的標(biāo)準(zhǔn)是RAID0—RAID5。這個level并個代表技術(shù)的高低,level5并不高于level3,level1也個低于level4。字于要選樣哪一種RAID level的產(chǎn)品,純視用戶的操作環(huán)境(Operating envir0nment)及應(yīng)用(application)而定,與level 的高低沒有必然的關(guān)系。RAID0沒有安全的保障,僅其快速,所以適合高速I/0 的系統(tǒng);RAIDl適用于需安全性又要兼顧速度的系統(tǒng),RAID2及RAID3適用于 大型電腦及影像、CAD/CAM等處理;RAID5多用于0LTP,因有余融機(jī)構(gòu)及 大型數(shù)據(jù)處理中心的迫切需要,故使用較多而較有名氣,但也因此形成很多人對 磁盤陣列的誤解,以為磁盤陣列非要RAID5不可;RAID4較少使用、和RAID5 有其共同之處,但RAID4適合大量數(shù)據(jù)的存取。其他如RAID6,RAID7。乃至 RAIDl0、50、100等,都是廠商各做各的,并無一致的標(biāo)準(zhǔn),在此不作說明。
RAID1
RAID1是使用磁盤鏡像(disk muroring)的技術(shù),磁盤鏡像應(yīng)用在RAIDl 之前就在很多系統(tǒng)中使用,它的方式是在工作磁盤(working disk)之外再加一 額外的備份磁盤(backup disk)兩個磁盤所儲存的數(shù)據(jù)安全一致。數(shù)據(jù)在寫入工 作磁盤同時也寫入備份磁盤。
RAID2
RAID2是把數(shù)據(jù)分散為位元/位元組(bit/byte)或塊(b1ock),加入海明碼Hamming Code、在磁盤陣列中作間隔寫入(Interleaving)到每個磁盤小。而 且地址(address)都一樣,也就是在各個磁盤中,其數(shù)據(jù)都在相同的磁道(cylinder or track)及扇區(qū)中。RAID2又稱為并行陣列(parallel array)其設(shè)計足使 用共軸同步(spindle synchronize)的技術(shù),存取數(shù)據(jù)時、控個磁盤陣列—起動 作,在各個磁盤的相同位置作平行存取,所以有更好的存取時間(auesstime),共 總線(bus)是特別的設(shè)計以大帶寬并行傳輸所存取的數(shù)據(jù),所以有更好的傳輸時 間(transfer time)。在人型檔案的存取應(yīng)用,RAID2有更好的件能,僅如果檔 案太小,會將其性能批下來。因為磁盤的存取足以期區(qū)為單位。而RAID2的存取是所有磁盤平行動作,而且是作單位元或位元組的存取。故小于—個扇區(qū)的數(shù)據(jù) 最會使其件能大打折扣。RAID2是設(shè)計給需要連續(xù)且大量數(shù)據(jù)的電腦使用的、如 大型電腦(mainframe to supercomputer)、作影像處理或CAD/CAM的工作站 (workstation)等,并個適用于—般的多用戶環(huán)境網(wǎng)絡(luò)服務(wù)器(network server)。 小型機(jī)或PC。
RAID3
RAID3的數(shù)據(jù)儲存及存取方式都和RAID2一樣,僅在安今方面以奇偶較驗 (parity check)取代海明碼做錯誤校正及檢測,所以只需要—個額外的校檢磁盤 (parity disk)。奇偶校驗值的計算足以各個磁盤的相對應(yīng)位作XOR的邏輯運算, 然后將結(jié)果寫入奇偶校驗磁盤,仟何數(shù)據(jù)的修改都要做奇偶校驗計算。
RAID4
RAID4也使用一個校驗磁盤,但和RAID3不一樣,RAID4的方式是RAID0 加上一個校驗磁盤。
RAID5
RAID5和RAID4相似但避免了RAID4的瓶頸,方法是不用校驗磁盤而將校 驗數(shù)據(jù)以循環(huán)的方式放在每一個磁盤中,RAID5的控制比較復(fù)雜,尤其是利用硬件對磁盤陣列的控制,因為這種方式的應(yīng)用比其他的RAID level要掌握更多的事情,更多的輸出/入需求,既要速度快,又要處理數(shù)據(jù),計算校驗值,做錯誤 校正等,所以價格較高,其應(yīng)用更好是0LTP,至于用于大型文件,不見得有最 佳的性能。
RAID的對比: 下面幾個表列是RAID的一些性質(zhì):
操作 工作模式 最少硬盤量 可用容量 適用范圍
RAID0 磁盤延伸和數(shù)據(jù)分布 2 T PC服務(wù)器和圖形工作站
RAIDl 數(shù)據(jù)分布和鏡像 2 T/2
RAID2 共軸同步,并行傳輸,ECC 3 視結(jié)構(gòu)而定 大檔案且輸入輸出不頻繁的應(yīng)用 如:影像處理和CAD/CAM等
RAID3 共軸同步,并行傳輸,Parity 3 Tx(n—1)/n
RAID4 數(shù)據(jù)分布,固定Parity 3 Tx(n—1)/n
RAID5 數(shù)據(jù)分布,分布Parity 3 Tx(n—1)/n 銀行、金融、股市、數(shù)據(jù)庫等大 型數(shù)據(jù)處理中心OLTP應(yīng)用
RAID的性能與可用性
RAID Level 用戶數(shù)據(jù)利用率 BandWidth Performance Transaction Performance 數(shù)據(jù)可用性
RAID0 1 0.25 1 0.0005
RAID1 0.5 0.25 0.85 1
RAID2 0.67 1 0.25 0.9999
RAID3 0.75 1 0.25 0.9999
RAID4 0.75 0.25 0.61 0.9999
RAID5 0.75 0.25 0.61 0.9999
以上數(shù)據(jù)基于4個磁盤,傳輸塊大小lK,75%的讀概率,數(shù)據(jù)可用性的計算 基于同樣的損壞概率。
RAID的概述
RAID0
沒有任何額外的磁盤或空間作安全準(zhǔn)備,所以一般人不重視它,這是誤解。 其實它有更好的效率及空間利用率,對于追求效率的應(yīng)用,非常理想,可同時用 其他的RAID level或其他的備份方式以補其不足,保護(hù)重要的數(shù)據(jù)。
RAID1
更佳的安全性,100%不停機(jī),即使有一個磁盤損壞也能照常作業(yè)而不影響 其效能(對能并行存取的系統(tǒng)稍有影響),因為數(shù)據(jù)是作重復(fù)儲存。RAIDl的并行 讀取幾乎有RAID0的性能、因為可同時讀取相互鏡像的磁盤;寫入也只比RAID0略遜,因為同時寫入兩個磁盤并沒有增加多少工作。雖比RAID0要增加—倍的 磁盤做鏡像,但作為采用磁盤陣列的進(jìn)入點,它是更便宜的一個方案,是新設(shè)磁 盤陳列的用戶之更佳選擇。
RAlD5
RAID5在不停機(jī)及容錯的表現(xiàn)都很好,但如有磁盤故障。對性能的影向較大, 大容量的快取內(nèi)存有助于維持性能,但在0LTP的應(yīng)用中,因為每—筆數(shù)據(jù)或記 錄(record)都很小,對磁盤的存取頻繁。故有—定程度的影響。某磁盤故障 時,讀取該磁盤的數(shù)據(jù)需把共用同一校驗值分段的所有數(shù)據(jù)及校驗值讀出來、再把故障磁盤的數(shù)據(jù)計算出來;寫入時,除了要重覆讀取的程序外,還要再做校驗值的計算,然后寫入更新的數(shù)據(jù)及校驗值;等換上新的磁盤,系統(tǒng)要計算整個磁 盤陣列的數(shù)據(jù)以回復(fù)故障磁盤的數(shù)據(jù),時間要很長,如系統(tǒng)的工作負(fù)載很重的話, 有很多輸出/入的請求征排隊等候時,會把系統(tǒng)的性能拉下來。僅如使用硬件磁 盤陣列的話,其件能就可以得到大幅度的改進(jìn),因為硬件磁盤陣列如Arena系列 本身有內(nèi)置的CPU與個機(jī)系統(tǒng)并行運作。所有存取磁盤的輸出入工作都在磁盤陳列本身完成,不花費主機(jī)的時間,配合磁盤陳列的cache內(nèi)存的使用,可以提高 系統(tǒng)的整體性能,而優(yōu)越的SCSI控制更能增加數(shù)據(jù)的傳輸速率,即使枉磁盤故障 的情況下,主機(jī)系統(tǒng)的件能也不會有明顯的降低。RAID5要做的事情太多,所以 價格較貴。不適于小系統(tǒng),但如果是大系統(tǒng)使用大的磁盤陣列的話,RAID5卻是 更便宜的方案。
總而言之,RAID0及RAIDl最適合PC服務(wù)器及圖形工作站的用戶,提供 更佳的性能及更便宜的價格。以低成本符合市場的需求。RAID2及RAID3適用 于大檔案輸入輸出需求個頻繁的應(yīng)用如影像處理及CAD/CAM等;而RAID5 則適用于銀行、金融、股市、數(shù)據(jù)庫等大列數(shù)據(jù)處理中心的0LTP應(yīng)用;RAID4 與RAID5有相同的特件及用方式,但其較適用于大型文件的讀取。
磁盤陣列的額外容錯功能
事實上容錯功能已成為磁盤陣列最受清睞的特性,為了加強容錯的功能以及使系統(tǒng)在磁盤故障的情況下能迅速的重建數(shù)據(jù),以維持系統(tǒng)的性能,一般的磁盤 陣列系統(tǒng)都可使用熱備份(hot spare or hot standby drive)的功能,所謂熱備份是在建立(configure)磁盤陣列系統(tǒng)的時候,將其中一磁盤指定為后備磁盤, 此一磁盤在平常并不操作,僅若陣列中某一磁盤發(fā)生故障時,磁盤陣列即以后備 磁盤取代故障磁盤,并自動將故障磁盤的數(shù)據(jù)重建(rebuild)在后備磁盤之上, 因為反應(yīng)快速,加上cache內(nèi)存減少了磁盤的存取,所以數(shù)據(jù)重建很快即可完成,對 系統(tǒng)的性能影響不大。對丁要求不停機(jī)的大型數(shù)據(jù)處理中心或控制小心而言,熱 備份更是一項重要的功能,因為可避免晚間或無人守護(hù)時發(fā)生磁盤故障所引起的 種種不便。
備份盤又有熱備份與溫備份之分,熱備份稅和溫備份的不同在于熱備份盤 和陣列—起運轉(zhuǎn),一有故障時馬上備援,而溫備份盤雖然帶電但并個運轉(zhuǎn),需要 備援時才啟動。兩者分別在是否運轉(zhuǎn)及啟動的時間,僅溫備份并不運轉(zhuǎn),理論上有較長的壽命。另一個額外的容錯功能是壞期區(qū)轉(zhuǎn)移(bad sector reassignment)。壞扇區(qū)是磁盤故障的主要原因,通常磁盤在讀寫時發(fā)牛壞扇區(qū)的 情況即表示此磁盤故障。不能冉作讀寫,甚至有很多系統(tǒng)會因為不能完成讀寫的 動作而死機(jī),僅若因為某一扇區(qū)的損壞而使工作不能完成或要更換磁盤,則使得 系統(tǒng)性能大打折扣,而系統(tǒng)的維護(hù)成本也未免太高了,壞扇區(qū)轉(zhuǎn)移是當(dāng)磁盤陣列 系統(tǒng)發(fā)現(xiàn)磁盤有壞扇區(qū)時,以另一空白的且無故障的扇區(qū)取代該扇區(qū),以延長磁盤 的使用壽命,減少壞磁盤的發(fā)生率以及系統(tǒng)的維護(hù)成本。所以壞扇區(qū)轉(zhuǎn)移功能使 磁盤陣列具有更好的容錯性,同時使整個系統(tǒng)村更好的成本效益比。其他如可外 接電池備援磁盤陣列的快取內(nèi)存,以避免突然斷電時數(shù)據(jù)尚未寫回磁盤而丟失; 或在RAIDl時作寫入一致性的檢查等,雖是小技術(shù),但亦不可忽視。
深入了解RAID
·元凱寧·PCHDD
RAID是由美國加州大學(xué)伯克利分校的D.A. Patterson教授在1988年提出的。RAID是Redundent Array of Inexpensive Disks的縮寫,直譯為“廉價冗余磁盤陣列”,也簡稱為“磁盤陣列”。后來RAID中的字母I被改作了Independent,RAID就成了“獨立冗余磁盤陣列”,但這只是名稱的變化,實質(zhì)性的內(nèi)容并沒有改變??梢园裄AID理解成一種使用磁盤驅(qū)動器的方法,它將一組磁盤驅(qū)動器用某種邏輯方式聯(lián)系起來,作為邏輯上的一個磁盤驅(qū)動器來使用。一般情況下,組成的邏輯磁盤驅(qū)動器的容量要小于各個磁盤驅(qū)動器容量的總和。RAID的具體實現(xiàn)可以靠硬件也可以靠軟件,Windows NT操作系統(tǒng)就提供軟件RAID功能。RAID一般是在SCSI磁盤驅(qū)動器上實現(xiàn)的,因為IDE磁盤驅(qū)動器的性能發(fā)揮受限于IDE接口(IDE只能接兩個磁盤驅(qū)動器,傳輸速率更高1.5MBps)。IDE通道最多只能接4個磁盤驅(qū)動器,在同一時刻只能有一個磁盤驅(qū)動器能夠傳輸數(shù)據(jù),而且IDE通道上一般還接有光驅(qū),光驅(qū)引起的延遲會嚴(yán)重影響系統(tǒng)速度。SCSI適配器保證每個SCSI通道隨時都是暢通的,在同一時刻每個SCSI磁盤驅(qū)動器都能自由地向主機(jī)傳送數(shù)據(jù),不會出現(xiàn)像IDE磁盤驅(qū)動器爭用設(shè)備通道的現(xiàn)象。
RAID的優(yōu)點
1.成本低,功耗小,傳輸速率高。在RAID中,可以讓很多磁盤驅(qū)動器同時傳輸數(shù)據(jù),而這些磁盤驅(qū)動器在邏輯上又是一個磁盤驅(qū)動器,所以使用RAID可以達(dá)到單個的磁盤驅(qū)動器幾倍、幾十倍甚至上百倍的速率。這也是RAID最初想要解決的問題。因為當(dāng)時CPU的速度增長很快,而磁盤驅(qū)動器的數(shù)據(jù)傳輸速率無法大幅提高,所以需要有一種方案解決二者之間的矛盾。RAID最后成功了。
2.可以提供容錯功能。這是使用RAID的第二個原因,因為普通磁盤驅(qū)動器無法提供容錯功能,如果不包括寫在磁盤上的CRC(循環(huán)冗余校驗)碼的話。RAID和容錯是建立在每個磁盤驅(qū)動器的硬件容錯功能之上的,所以它提供更高的安全性。
3.RAID比起傳統(tǒng)的大直徑磁盤驅(qū)動器來,在同樣的容量下,價格要低許多。
RAID的分級
1.RAID0級,無冗余無校驗的磁盤陣列。數(shù)據(jù)同時分布在各個磁盤驅(qū)動器上,沒有容錯能力,讀寫速度在RAID中最快,但因為任何一個磁盤驅(qū)動器損壞都會使整個RAID系統(tǒng)失效,所以安全系數(shù)反倒比單個的磁盤驅(qū)動器還要低。一般用在對數(shù)據(jù)安全要求不高,但對速度要求很高的場合。
2.RAID1級,鏡象磁盤陣列。每一個磁盤驅(qū)動器都有一個鏡像磁盤驅(qū)動器,鏡像磁盤驅(qū)動器隨時保持與原磁盤驅(qū)動器的內(nèi)容一致。RAID1具有更高的安全性,但只有一半的磁盤空間被用來存儲數(shù)據(jù)。主要用在對數(shù)據(jù)安全性要求很高,而且要求能夠快速恢復(fù)被損壞的數(shù)據(jù)的場合。
3.RAID2級,糾錯海明碼磁盤陣列。磁盤驅(qū)動器組中的之一個、第二個、第四個……第2n個磁盤驅(qū)動器是專門的校驗盤,用于校驗和糾錯,例如七個磁盤驅(qū)動器的RAID2,之一、二、四個磁盤驅(qū)動器是糾錯盤,其余的用于存放數(shù)據(jù)。使用的磁盤驅(qū)動器越多,校驗盤在其中占的百分比越少。RAID2對大數(shù)據(jù)量的輸入輸出有很高的性能,但少量數(shù)據(jù)的輸入輸出時性能不好。RAID2很少實際使用。
4.RAID3和RAID4,奇校驗或偶校驗的磁盤陣列。不論有多少數(shù)據(jù)盤,均使用一個校驗盤,采用奇偶校驗的方法檢查錯誤。任何一個單獨的磁盤驅(qū)動器損壞都可以恢復(fù)。RAID3和RAID4的數(shù)據(jù)讀取速度很快,但寫數(shù)據(jù)時要計算校驗位的值以寫入校驗盤,速度有所下降。RAID3和RAID4的使用也不多。
5.RAID5級,無獨立校驗盤的奇偶校驗磁盤陣列。同樣采用奇偶校驗來檢查錯誤,但沒有獨立的校驗盤,校驗信息分布在各個磁盤驅(qū)動器上。RAID5對大小數(shù)據(jù)量的讀寫都有很好的性能,被廣泛地應(yīng)用。
從RAID1到RAID5的幾種方案中,不論何時有磁盤損壞,都可以隨時拔出損壞的磁盤再插入好的磁盤(需要硬件上的熱插拔支持),數(shù)據(jù)不會受損,失效盤的內(nèi)容可以很快地重建,重建的工作也由RAID硬件或RAID軟件來完成。但RAID0不提供錯誤校驗功能,所以有人說它不能算作是RAID,其實這也是RAID0為什么被稱為0級RAID的原因——0本身就代表“沒有”。
RAID的應(yīng)用
當(dāng)前的PC機(jī),整個系統(tǒng)的速度瓶頸主要是硬盤。雖然不斷有Ultra DMA33、DMA66、DMA100等快速的標(biāo)準(zhǔn)推出,但收效不大。在PC中,磁盤速度慢一些并不是太嚴(yán)重的事情。但在服務(wù)器中,這是不允許的,服務(wù)器必須能響應(yīng)來自四面八方的服務(wù)請求,這些請求大多與磁盤上的數(shù)據(jù)有關(guān),所以服務(wù)器的磁盤子系統(tǒng)必須要有很高的輸入輸出速率。為了數(shù)據(jù)的安全,還要有一定的容錯功能。RAID提供了這些功能,所以RAID被廣泛地應(yīng)用在服務(wù)器體系中。
RAID提供的容錯功能是自動實現(xiàn)的(由RAID硬件或是RAID軟件來做)。它對應(yīng)用程序是透明的,即無需應(yīng)用程序為容錯做半點工作。要得到更高的安全性和最快的恢復(fù)速度,可以使用RAID1(鏡像);要在容量、容錯和性能上取折衷可以使用RAID5。在大多數(shù)數(shù)據(jù)庫服務(wù)器中,操作系統(tǒng)和數(shù)據(jù)庫管理系統(tǒng)所在的磁盤驅(qū)動器是RAID1,數(shù)據(jù)庫的數(shù)據(jù)文件則是存放于RAID5的磁盤驅(qū)動器上。
有時我們看某些名牌服務(wù)器的配置單,發(fā)現(xiàn)其CPU并不是很快,內(nèi)存也算不上是很大,顯卡更不是更好,但價格絕對不菲。是不是服務(wù)器系統(tǒng)都是暴利產(chǎn)品呢?當(dāng)然不是。服務(wù)器的配置與一般的家用PC的著重點不在一處。除去更高的穩(wěn)定性外,冗余與容錯是一大特點,如雙電源、帶電池備份的磁盤高速緩沖器、熱插拔硬盤、熱插拔PCI插槽等。另一個特點就是巨大的磁盤吞吐量。這主要歸功于RAID。舉一個例子來說,一臺使用了SCSI RAID的奔騰166與一臺IDE硬盤的PⅢCopermine 800都用做文件服務(wù)器,奔騰166會比PⅢ的事務(wù)處理能力高上幾十倍甚至上百倍,因為PⅢ處理器的運算能力根本用不上,反倒是奔騰166的RAID起了作用。
RAID現(xiàn)在主要應(yīng)用在服務(wù)器,但就像任何高端技術(shù)一樣,RAID也在向PC機(jī)上轉(zhuǎn)移。也許所有的PC機(jī)都用上了SCSI磁盤驅(qū)動器的RAID的那一天,才是PC機(jī)真正的“出頭之日”。
磁盤陣列簡稱RAID(RedundantpArrayspofpInexpensivepDisks),有”價格便則升宜且多余的磁盤陣列”之意。其原理是利用數(shù)組方式來作磁盤組,配合數(shù)據(jù)分散排列的設(shè)計,提升數(shù)據(jù)的安全性。磁盤陣列主要針對硬盤,在容量及速度上,無法跟上CPU及內(nèi)存的發(fā)展,提出改善方法。磁盤陣列是由很多便宜孫裂老、容量較小、穩(wěn)定性較高、速度較慢磁盤,組合成一個大型的磁盤組,利用個別磁盤提供數(shù)據(jù)所產(chǎn)生的加成效果來提升整個磁盤系統(tǒng)的效能。同時,在儲存數(shù)據(jù)時,利用這項技術(shù),將數(shù)據(jù)切割成許多區(qū)段,分別存放在各個硬盤上。
磁盤陣列還能利用同位檢查(ParitypCheck)的觀念,在數(shù)組中任一顆硬盤故障時,仍可讀出數(shù)據(jù),在數(shù)據(jù)重構(gòu)時,將故障硬盤內(nèi)的數(shù)據(jù),經(jīng)計算源跡后重新置入新硬盤中。
磁盤陣列是一種把若干硬磁盤驅(qū)動器按照一定要求組成一個整體,整個磁盤陣列由陣列控制器管理的系統(tǒng)。冗余磁盤陣列RAID(Redundant Array of Independent Disks)技術(shù)1987年由加州大學(xué)伯克利分校提出,最初的研制目的是為了組合小的廉價磁盤來段前代替大的昂貴磁盤,以降低大批量數(shù)據(jù)存儲的費用(當(dāng)時RAID稱為Redundant Array of Inexpensive Disks 廉價握橘清的磁盤陣列),同時也希望采用冗余信息的方式,使得磁盤失效時不會使對數(shù)據(jù)的訪問受損失,從而開發(fā)出一定水平的數(shù)據(jù)保護(hù)技術(shù)。
這個鏈接有詳細(xì)更的說明伍含,你可以打開看看:
多塊硬盤用RAID卡合成一塊就是陳列
大數(shù)據(jù)庫陣列方式的介紹就聊到這里吧,感謝你花時間閱讀本站內(nèi)容,更多關(guān)于大數(shù)據(jù)庫陣列方式,大數(shù)據(jù)存儲技術(shù):陣列方式的優(yōu)勢,什么是磁盤陣列?的信息別忘了在本站進(jìn)行查找喔。
成都創(chuàng)新互聯(lián)科技有限公司,是一家專注于互聯(lián)網(wǎng)、IDC服務(wù)、應(yīng)用軟件開發(fā)、網(wǎng)站建設(shè)推廣的公司,為客戶提供互聯(lián)網(wǎng)基礎(chǔ)服務(wù)!
創(chuàng)新互聯(lián)(www.cdcxhl.com)提供簡單好用,價格厚道的香港/美國云服務(wù)器和獨立服務(wù)器。創(chuàng)新互聯(lián)——四川成都IDC機(jī)房服務(wù)器托管/機(jī)柜租用。為您精選優(yōu)質(zhì)idc數(shù)據(jù)中心機(jī)房租用、服務(wù)器托管、機(jī)柜租賃、大帶寬租用,高電服務(wù)器托管,算力服務(wù)器租用,可選線路電信、移動、聯(lián)通機(jī)房等。
名稱欄目:大數(shù)據(jù)存儲技術(shù):陣列方式的優(yōu)勢(大數(shù)據(jù)庫陣列方式)
轉(zhuǎn)載來于:http://www.dlmjj.cn/article/dpspdjp.html


咨詢
建站咨詢
