Chức năng chống trùng lặp dữ liệu cho phép bạn lưu trữ nhiều dữ liệu hơn trong không gian nhỏ hơn và đạt hiệu quả lưu trữ cao hơn trong các môi trường ảo hóa. Hoạt động ở cấp độ khối, nó loại bỏ các khối dữ liệu trùng lặp và chỉ giữ lại các khối dữ liệu duy nhất. Chức năng chống trùng lặp dữ liệu giúp giảm nhu cầu về không gian lưu trữ mà không làm ảnh hưởng đến tính toàn vẹn của dữ liệu.
Trước khi bắt đầu
Yêu cầu
1/ Chức năng chống trùng lặp dữ liệu chỉ có sẵn trên một số mẫu NAS Synology cụ thể. Bạn có thể tham khảo bảng sau:
Bảng liệt kê các model NAS Synology hỗ trợ chống trùng lặp dữ liệu.
Lưu ý: Cần ít nhất 16 GB bộ nhớ để kích hoạt tính năng chống trùng lặp dữ liệu.
|
Series
|
Models
|
|
FS-series
|
FS6400, FS3600, FS3410, FS3400, FS2500
|
|
HD-series
|
HD6500
|
|
SA-series
|
SA6400, SA3610, SA3600, SA3410, SA3400
|
|
21-series
|
RS4021xs+, RS3621xs+ 2, RS3621RPxs 2
|
2/ Chức năng chống trùng lặp dữ liệu chỉ được hỗ trợ trên ổ SSD Synology và các phân vùng Btrfs. Bạn cần tạo một nhóm lưu trữ chỉ gồm các ổ SSD Synology và sau đó tạo ít nhất một phân vùng Btrfs.
3/ Chức năng chống trùng lặp dữ liệu chỉ có thể chạy khi trạng thái của phân vùng là “Healthy”.
4/ Chức năng chống trùng lặp dữ liệu yêu cầu bạn phải Bật phân tích chi tiết sử dụng cho phân vùng Btrfs.
Hạn chế
1/ Chức năng chống trùng lặp dữ liệu không bao gồm các điều sau trong quá trình hoạt động của nó: LUN có phân bổ dày, dữ liệu đã tạo bản snapshot, các thư mục chia sẻ được mã hóa, và các thư mục chia sẻ Hybrid Share.
2/ Hệ thống chỉ có thể thực hiện một hoạt động chống trùng lặp dữ liệu (hoặc là Phân tích chống trùng lặp hoặc là chống trùng lặp thủ công) trên một phân vùng vào cùng một thời điểm. Để chạy chống trùng lặp dữ liệu trên nhiều phân vùng, chúng tôi khuyên bạn nên bật chức năng chống trùng lặp tự động.
3/ Nếu bạn có kế hoạch tạo đĩa ảo có phân bổ dày sử dụng ảo hóa VMware ESXi, chúng tôi không khuyến khích bật hoặc chạy chức năng chống trùng lặp dữ liệu. Chức năng này có thể làm mất đi một số không gian lưu trữ đã được cấp phát trước cho các đĩa ảo. Nếu bạn vẫn muốn sử dụng chức năng chống trùng lặp dữ liệu, hãy dành đủ không gian lưu trữ để đảm bảo tính chức năng.
Ghi chú
- Do chức năng chống trùng lặp dữ liệu loại bỏ các khối dữ liệu trùng lặp, điều này có thể làm cho một số dữ liệu ít liên tục hơn và ảnh hưởng đến hiệu suất đọc-ghi. Nếu môi trường của bạn đòi hỏi hiệu suất cao, hãy cân nhắc kỹ về tác động đến hiệu suất trước khi sử dụng chức năng chống trùng lặp.
- Chúng tôi khuyên bạn nên chạy chức năng chống trùng lặp dữ liệu trước khi tạo các bản snapshot mới để đạt được mức tiết kiệm tối đa. Để biết thêm thông tin về các cấu hình được khuyến nghị, vui lòng tham khảo bài viết này.
Phân tích loại bỏ trùng lặp (Deduplication Analyzer)
Chúng tôi khuyến nghị bạn nên chạy phân tích với Công cụ Phân tích Loại bỏ Trùng lặp (Deduplication Analyzer) trước khi quyết định có cấu hình loại bỏ trùng lặp dữ liệu trên một ổ đĩa hay không. Công cụ Phân tích Loại bỏ Trùng lặp tính toán lượng không gian trên ổ đĩa có thể được tiết kiệm tiềm năng từ việc loại bỏ trùng lặp dữ liệu. Công cụ này chỉ cung cấp phân tích và không thực hiện bất kỳ thay đổi thực tế nào đối với cấu trúc dữ liệu trên ổ đĩa.
- Truy cập trang Storage.
- Chọn ổ đĩa (Volume) bạn muốn cấu hình và nhấp vào biểu tượng ở góc trên bên phải.
- Chọn Configure Data Deduplication từ menu thả xuống.
- Nhấp vào liên kết Deduplication Analyzer để chạy công cụ.Lưu ý: Tính năng này chỉ khả dụng cho các ổ đĩa chưa trải qua quá trình loại bỏ trùng lặp.
- Nhấp vào Start Analysis.
Sau khi phân tích hoàn tất, bạn có thể kiểm tra Estimated space savings và sau đó quyết định có nên cấu hình loại bỏ trùng lặp dữ liệu trên ổ đĩa hay không.
Loại bỏ trùng lặp dữ liệu (Data Deduplication)
Có hai loại data deduplication: Automatic Deduplication và Manual Deduplication.
Để bật Automatic Deduplication:
Chọn Automatic Deduplication nếu bạn muốn quá trình loại bỏ trùng lặp dữ liệu diễn ra tự động và liên tục trên một ổ đĩa.
- Truy cập Storage.
- Chọn volume bạn muốn cấu hình và nhấp vào biểu tượng ở góc trên bên phải.
- Chọn Configure Data Deduplication từ menu thả xuống.
- Đi đến phần Automatic Deduplication (Recommended) và đánh dấu vào ô Enable automatic deduplication.
- Nhấn Save để lưu lại.
Để xem Deduplication savings, quay trở lại trang Storage và nhấp vào ổ đĩa để mở rộng thông tin của nó. Dữ liệu tiết kiệm sẽ được cập nhật thường xuyên. Bạn cũng có thể thiết lập set an automatic deduplication schedule để ngăn việc này tiêu tốn tài nguyên hệ thống trong khi các dịch vụ hoặc nhiệm vụ quan trọng đang chạy.
Để chạy Manual Deduplication:
Chọn Manual Deduplication nếu bạn muốn chạy một lần duy nhất quá trình loại bỏ trùng lặp dữ liệu trên một ổ đĩa.
- Truy cập Storage.
- Chọn volume bạn muốn cấu hình và nhấp vào biểu tượng ở góc trên bên phải.
- Chọn Configure Data Deduplication từ menu thả xuống.
- Đi đến phần Manual Deduplication.
- Nhấp vào nút Run Now.
Sau khi hoàn thành quá trình thủ công, bạn có thể xem kết quả (Last deduplication savings) trong cửa sổ Configure Data Deduplication.
Để thiết lập lịch trình Automatic Deduplication:
Quá trình loại bỏ trùng lặp dữ liệu sử dụng tài nguyên hệ thống trong khi đang chạy. Bạn có thể lên lịch để hoạt động này diễn ra vào những giờ thấp điểm, từ đó ngăn nó ảnh hưởng đến hiệu suất hệ thống trong khi các dịch vụ hoặc nhiệm vụ quan trọng đang diễn ra.
- Đi đến Storage > Global Settings.
- Nhấp vào Set Time Grid trong phần Data Deduplication Schedule.
- Thiết lập lịch trình loại bỏ trùng lặp tự động của bạn
– Nhấp vào Pause data deduplication. Sau đó, sử dụng lưới thời gian để chỉ định khoảng thời gian mà bạn không muốn loại bỏ trùng lặp tự động chạy.- Nhấp vào Run data deduplication. Sau đó, sử dụng lưới thời gian để thiết lập khoảng thời gian được phép – khi bạn muốn loại bỏ trùng lặp tự động chạy.
- Nhấp OK để hoàn tất.