RAID là gì ? Các loại RAID
RAID là gì ? Các loại RAID
RAID là gì ?
RAID (Redundant Arrays of Independent Disks) là hình thức ghép nhiều ổ đĩa cứng vật lý thành một hệ thống ổ đĩa cứng có chức năng gia tăng tốc độ đọc/ghi dữ liệu hoặc nhằm tăng thêm sự an toàn của dữ liệu chứa trên hệ thống đĩa hoặc kết hợp cả hai yếu tố trên.
Trong vài năm trở lại đây, Từ các hệ thống máy tính lớn, máy trạm, máy chủ, RAID đã được đưa vào các máy tính để bàn, hệ thống NAS dưới dạng tích hợp đơn giản. Về sau, RAID đã có nhiều biến thể cho phép không chỉ đảm bảo an toàn dữ liệu mà còn giúp gia tăng đáng kể tốc độ truy xuất dữ liệu từ đĩa cứng.
Các loại RAID
RAID là gì ? RAID được chia làm nhiều cấp độ (level) khác nhau, mỗi một cấp độ sẽ có những tính năng riêng.
RAID 0
RAID là gì ? RAID 0 là gì ? RAID 0 cần ít nhất 2 ổ đĩa (có thể sử dụng 1 ổ đĩa). Tổng quát ta có n đĩa (n >= 2) và các đĩa là cùng loại.
Ưu điểm: Tăng tốc độ đọc / ghi đĩa: mỗi đĩa chỉ cần phải đọc / ghi 1/n lượng dữ liệu được yêu cầu. Lý thuyết thì tốc độ sẽ tăng n lần.
Nhược điểm: Tính an toàn thấp. Nếu một đĩa bị hư thì dữ liệu trên tất cả các đĩa còn lại sẽ không còn sử dụng được. Xác suất để mất dữ liệu sẽ tăng n lần so với dùng ổ đĩa đơn.
Dữ liệu sẽ được chia ra nhiều phần bằng nhau. Ví dụ ta dùng 02 ổ cứng 4 TB thì hệ thống đĩa của chúng ta là 8 TB.
RAID 1
RAID là gì ? RAID 1 là gì ? Đây là dạng RAID cơ bản nhất có khả năng đảm bảo an toàn dữ liệu. Cũng giống như RAID 0, RAID 1 đòi hỏi ít nhất hai đĩa cứng để làm việc. Dữ liệu được ghi vào 2 ổ giống hệt nhau (Mirroring). Trong trường hợp một ổ bị trục trặc, ổ còn lại sẽ tiếp tục hoạt động bình thường.
Người dùng có thể thay thế ổ đĩa bị hỏng mà không phải lo lắng đến vấn đề thông tin thất lạc. Đối với RAID 1, hiệu năng không phải là yếu tố hàng đầu nên chẳng có gì ngạc nhiên nếu nó không phải là lựa chọn số một cho những người cần tốc độ. Tuy nhiên đối với những nhà quản trị mạng hoặc những ai phải quản lý nhiều thông tin quan trọng thì hệ thống RAID 1 là thứ không thể thiếu.
Dung lượng cuối cùng của hệ thống RAID 1 bằng dung lượng của ổ đơn (2 ổ 4 TB chạy RAID 1 sẽ cho hệ thống nhìn thấy duy nhất một ổ RAID 4 TB).
RAID 2
Đây là cấp độ RAID duy nhất không sử dụng một hoặc nhiều kỹ thuật “tiêu chuẩn” như mirror, stripe và/hoặc parity (tính chẵn lẻ – là dữ liệu bổ sung được sử dụng cho việc khôi phục).
RAID 2 sử dụng một thứ tương tự như stripe có parity, nhưng không giống như cách được dùng trong các cấp độ RAID khác. Dữ liệu của RAID 2 được stripe ở cấp độ bit, phân bố qua nhiều ổ đĩa dữ liệu và ổ đĩa dự phòng. Các bit dự phòng được tính toán bằng mã Hamming, một dạng Mã Sửa Lỗi (ECC – Error Correcting Code hoặc Error Checking & Correcting).
Khi có hoạt động stripe dữ liệu, những mã này được tính toán và ghi cùng với dữ liệu lưu vào ổ đĩa ECC riêng biệt. Khi có hoạt động đọc dữ liệu, những mã ECC cũng được đọc để xác nhận rằng không có lỗi xảy ra kể từ lúc ghi dữ liệu.
Nếu một lỗi đơn xảy ra, nó sẽ được sửa ngay tức thì. Cấp độ này có khả năng chịu lỗi một ổ đĩa.
RAID 2 đòi hỏi một bộ điều khiển phức tạp, chuyên dụng và đắt tiền. Loại RAID này hiếm khi được sử dụng bởi chi phí triển khai quá lớn (một hệ thống điển hình yêu cầu đến 10 ổ đĩa dữ liệu, 4 ổ đĩa ECC), và có hiệu suất không cao (do stripe ở cấp độ bit).
RAID 5
RAID 5 chính là sự cải tiến hoàn hảo của RAID 0. Nó hiện đang cung cấp cơ chế về khôi phục dữ liệu, những Parity sử dụng để khôi phục những dữ liệu được phân bố 1 cách đồng đều trên toàn bộ những ổ đĩa cứng.
Dữ liệu A giả sử được phân tách thành 3 thành phần là A1, A2 và A3 thì khi đó dữ liệu sẽ được phân chia thành 3 phần có chứa trên những ổ đĩa cứng 0, 1 và 2 (tương tự như RAID 0). Theo đó phần ổ đĩa cứng 3 sẽ chứa Parity của A1 A2 A3 nhằm khôi phục những dữ liệu có thể mất đi ở ổ đĩa cứng 0, 1 và 2.
Dữ liệu B sẽ được chia B1 B2 B3, Parity của nó sẽ là Bp, với thứ tự là B1 B2 B3 lưu trữ ở ổ 0 1 3, còn Bp sẽ lưu trữ ở ổ 2. Những Parity sẽ được tuần tự lưu trữ tại những ổ đĩa cứng. RAID 5 sẽ cho phép có 1 ổ cứng tối đa bị chết ở 1 thời điểm, nếu như có nhiều hơn một ổ cứng ở một thời điểm bị chết thì tất cả dữ liệu sẽ mất hết. Ngoài ra RAID 5 hiện tại cũng yêu cầu những ổ cứng tham gia vào RAID bắt buộc có dung lượng bằng với nhau.
Tính dung lượng chính xác của RAID 5 cuối cùng bằng cách sau:
[(Số lượng những ổ cứng tham gia vào RAID) – 1] x (Dung lượng của một ổ cứng)
Tối thiểu yêu cầu của RAID 5 phải có ít nhất là 3 ổ cứng.
Ví dụ: Bạn dùng 3 ổ cứng 12 TB cài đặt RAID 5 (tổng dung lượng 36 TB) thì dung lượng bạn sử dụng được là 24 TB, 12 TB dữ liệu còn lại sẽ được sử dụng làm dự phòng bảo vệ. RAID 5 sẽ cho phép có 1 ổ cứng tối đa bị chết ở 1 thời điểm, tức là nếu 1 trong 3 ổ cứng bị hư thì dữ liệu của bạn vẫn được bảo vệ an toàn.
RAID 6
RAID 6 là một dạng cải tiến từ RAID 5. RAID 6 được sử dụng lặp lại nhiều hơn số lần sự phân tách dữ liệu để ghi vào các đĩa cứng khác nhau.Ở RAID 5 thì mỗi một dữ liệu được tách thành hai vị trí lưu trữ trên hai đĩa cứng khác nhau, nhưng ở RAID 6 thì mỗi dữ liệu lại được lưu trữ ở ít nhất ba vị trí (trở lên), điều này giúp cho sự an toàn của dữ liệu tăng lên so với RAID 5. RAID 6 yêu cầu tối thiểu 4 ổ cứng, với 4 ổ cứng thì chúng cho phép hư hỏng đồng thời đến 2 ổ cứng mà hệ thống vẫn làm việc bình thường, điều này tạo ra một xác xuất an toàn rất lớn. Chính do đó mà RAID 6 thường chỉ được sử dụng trong các máy chủ chứa dữ liệu cực kỳ quan trọng.
Ví dụ: Bạn có 4 ổ cứng 8 TB với tổng dung lượng 32 TB cài đặt RAID 6 dung lượng bạn có thể sử dụng được là 16 TB còn 16 TB dung lượng còn lại dùng để dự phòng. RAID 6 cho phép có thể hỏng đồng thời 2 ổ cứng một lúc mà dữ liệu của bạn vẫn an toàn.
RAID 10
RAID 10 là sự kết hợp giữa 2 loại RAID phổ biến và RAID 1 và RAID 0. Để setup RAID 10 khách hàng cần sử dụng tối thiểu 4 ổ cứng.
Đối với RAID 10 dữ liệu sẽ được lưu đồng thời vào 4 ổ cứng. 2 ổ dạng Striping (RAID 0) và 2 ổ (Mirroring) RAID 1.
Ưu điểm: Đây là 1 hình thức lưu trữ nhanh nhẹn và an toàn, vừa nâng cao hiệu suất mà lại đảm bảo dữ liệu không bị thất thoát khi 1 trong số 4 ổ cứng bị hỏng.
Nhược điểm: Chi phí cao. Đối với RAID 10 dung lượng sẵn sàng sử dụng chỉ bằng ½ dung lượng của 4 ổ. (giống như RAID 1).
Đối tượng sử dụng: RAID 10 thích hợp với tất cả các đối tượng sử dụng (từ những yêu cầu về hiệu suất đến việc đảm bảo an toàn dữ liệu). Về ổ cứng yêu cầu phải 4 ổ cùng dung lượng, nếu 4 ổ khác dung lượng thì lấy ổ thấp nhất.
Ví dụ: Bạn có 4 ổ 8 TB tổng dung lượng là 32 TB dung lượng bạn sử dụng được là 16 TB và dung lượng được bảo vệ là 16 TB. Nếu bạn có 4 ổ cứng: chọn RAID 10 (hỏng 2 ổ thuộc 2 cặp RAID khác nhau dữ liệu của bạn vẫn an toàn) Tuy nhiên nếu có 2 RAID hỏng cùng lúc trong nhóm RAID 1 hoặc RAID 0 thì sẽ bị mất dữ liệu. Mặc dù vậy, xác suất 2 ổ cứng hỏng cùng một lúc là rất thấp.
RAID F1
RAID F1 là loại RAID mới dành cho ổ cứng SSD. F là viết tắt của Flash và 1 là viết tắt của khả năng phục hồi 1 đĩa và 1 tính chẵn lẻ. Bố cục của RAID F1 dựa trên RAID 5. Sự khác biệt giữa hai loại RAID này là RAID F1 có thêm một khối chẵn lẻ trên mỗi chu kỳ. Trong hình minh họa bên trên, các khối có chữ “P” là viết tắt của khối chẵn lẻ và phần còn lại là khối dữ liệu.
Vì mỗi thao tác ghi liên quan đến việc ghi vào một khối chẵn lẻ, nên khối chẵn lẻ sẽ là khối đầu tiên bị hao mòn. Sự phân bố chẵn lẻ không đồng đều này khiến một ổ SSD đạt tuổi thọ sớm hơn những ổ khác, thay vì kết thúc tuổi thọ của tất cả các ổ SSD cùng một lúc. Khi một ổ SSD bị lỗi, người dùng có thể thay thế nó bằng một ổ SSD mới.
Các đặc điểm của RAID F1 tương tự như RAID 5. Các khối chẵn lẻ được XOR cho tất cả các khối dữ liệu khác. Một khối được sử dụng làm khối chẵn lẻ trong mỗi dải, vì vậy dung lượng có thể sử dụng của mảng RAID F1 là N-1 lần ổ đĩa nhỏ nhất, trong đó N là chiều rộng dải hoặc số lượng đĩa.
Hiện tại hệ thống lưu trữ NAS Synology đang áp dụng cơ chế RAID F1 với những dòng sản phẩm NAS có ổ đĩa SSD.
Hiệu suất RAID F1
Tóm lại, RAID F1 cung cấp sự cân bằng tốt nhất giữa độ tin cậy và hiệu suất. Việc gán chẵn lẻ RAID F1, so với RAID 4, cung cấp nhiều IOPS hơn. Hiệu suất đọc và ghi của RAID F1 gần bằng với hiệu suất của RAID 5 với sự khác biệt về hiệu suất tối thiểu do có thêm các khối chẵn lẻ trên ổ đĩa RAID F1. Không có ảnh hưởng đáng kể nào đến việc sử dụng CPU giữa RAID F1 và RAID 5.
RAID Rebuild
Mục tiêu của RAID F1 là giảm thiểu khả năng mất dữ liệu. Để đạt được mục tiêu này, hệ thống sẽ tìm ra ổ SSD cũ nhất để xây dựng lại và phân bổ lại bố cục chẵn lẻ. Ví dụ: khi đĩa A đã bị xóa, mảng này sẽ được sửa chữa bằng cách cài đặt đĩa F. Sau đó, hệ thống sẽ phát hiện ra rằng đĩa B là đĩa cũ nhất, nó sẽ được đặt làm ổ SSD mới do hệ thống gán vào. khối chẵn lẻ sẽ được viết. Cách tiếp cận này đảm bảo rằng chỉ một “ổ SSD cũ nhất” lưu trữ nhiều khối chẵn lẻ nhất.
Độ ổn định so với RAID 5
RAID 5 sử dụng hết tuổi thọ của tất cả các ổ SSD ở cùng một tốc độ vì số chẵn lẻ được phân bổ đồng đều cho tất cả các ổ đĩa trong mảng. Trong trường hợp này, khả năng mất dữ liệu trên ổ SSD cũ trở nên rất cao cùng với quá trình lão hóa RAID. Ngược lại, RAID F1 luôn giảm thiểu khả năng mất dữ liệu bằng cách làm cho một trong những ổ SSD cũ nhất hết tuổi thọ trước.
RAID F1 chỉ có thể hoạt động tối thiểu 3 ổ đĩa và cho phép hư 1 ổ đĩa bất kỳ
Ví dụ: Bạn có 3 ổ đĩa 8 TB (tổng dung lượng 24 TB) bạn có thể sử dụng 16 TB dữ liệu và 8 TB dữ liệu dùng để dự phòng, trường hợp nếu 1 ổ cứng của bạn bị hư hỏng thì dữ liệu của bạn vẫn được bảo vệ an toàn.
Sản phẩm gợi ý:
Liên hệ Vietcorp để tìm hiểu thêm về thiết bị lưu trữ NAS Synology:
(024)7301 8899 – 08 3310 8899 Mr Toản
(028)7301 8899 – 08 1701 8899 Ms Thảo
(0236)730 8899 – 08 3490 8899 Ms Thúy
www.vietcorp.com 0814 247 247