Nghiên cứu về các cơ chế RAID và đề xuất giải pháp lưu trữ dữ liệu an toàn trên dịch vụ đám mây

TÓM TẮT— Công nghệ điện toán đám mây hiện đang phát triển và được ứng dụng rộng rãi trong việc triển khai các dịch vụ mạng và lưu trữ dữ liệu. Người dùng được hưởng lợi từ các dịch vụ lưu trữ dữ liệu trực tuyến khi đăng ký các tài khoản miễn phí, dữ liệu được lưu trên Cloud và có cơ chế đồng bộ rất tiện lợi, trên nhiều nền tảng, thiết bị. Tuy nhiên, việc bảo vệ cho dữ liệu quan trọng này không bị mất mát khi dịch vụ lưu trữ xảy ra lỗi, hay tránh bị xâm phạm một cách bất hợp pháp là điều ngoài tầm kiểm soát của người dùng. Trong bài báo này, nhóm nghiên cứu đề xuất một giải pháp lưu trữ an toàn cho dữ liệu người dùng dựa trên cơ chế RAID, nhằm khắc phục các nguy cơ ở trên, đồng thời vẫn có thể sử dụng các tài khoản lưu trữ từ những dịch vụ miễn phí

Nghiên cứu về các cơ chế RAID và đề xuất giải pháp lưu trữ dữ liệu an toàn trên dịch vụ đám mây trang 1

Trang 1

Nghiên cứu về các cơ chế RAID và đề xuất giải pháp lưu trữ dữ liệu an toàn trên dịch vụ đám mây trang 2

Trang 2

Nghiên cứu về các cơ chế RAID và đề xuất giải pháp lưu trữ dữ liệu an toàn trên dịch vụ đám mây trang 3

Trang 3

Nghiên cứu về các cơ chế RAID và đề xuất giải pháp lưu trữ dữ liệu an toàn trên dịch vụ đám mây trang 4

Trang 4

Nghiên cứu về các cơ chế RAID và đề xuất giải pháp lưu trữ dữ liệu an toàn trên dịch vụ đám mây trang 5

Trang 5

Nghiên cứu về các cơ chế RAID và đề xuất giải pháp lưu trữ dữ liệu an toàn trên dịch vụ đám mây trang 6

Trang 6

pdf 6 trang xuanhieu 3680
Bạn đang xem tài liệu "Nghiên cứu về các cơ chế RAID và đề xuất giải pháp lưu trữ dữ liệu an toàn trên dịch vụ đám mây", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Nghiên cứu về các cơ chế RAID và đề xuất giải pháp lưu trữ dữ liệu an toàn trên dịch vụ đám mây

Nghiên cứu về các cơ chế RAID và đề xuất giải pháp lưu trữ dữ liệu an toàn trên dịch vụ đám mây
ghiên cứu, Cloud Security Alliance (CSA) đã đƣa ra những vấn đề có mức độ nguy hại cao nhất 
trong điện toán đám mây gồm [4]: 
 Sử dụng bất hợp pháp dịch vụ: Kẻ tấn công sẽ khai thác lỗ hổng trên các dịch vụ public cloud để phát tán mã 
độc tới ngƣời dùng và lây lan ra hệ thống máy tính, từ đó khai thác sức mạnh của dịch vụ đám mây để tấn 
công các máy tính khác. 
 API (Application Programming Interfaces) không bảo mật: Đây là giao diện lập trình phần mềm để tƣơng tác 
với các dịch vụ cloud. Khi các hãng thứ 3 sử dụng các API thiếu bảo mật này để tạo các phần mềm, tài khoản 
và dữ liệu của ngƣời dùng có thể bị ảnh hƣởng thông qua các ứng dụng đó. 
 Các lỗ hổng trong chia sẻ dữ liệu: Do sử dụng cùng một nền tảng dịch vụ trên cloud, nên việc rò rỉ thông tin 
có thể phát sinh khi chia sẻ thông tin từ một khách hàng cho những ngƣời khác. 
 Mất dữ liệu: Mất dữ liệu là một vấn đề phổ biến trong điện toán đám mây. Nếu nhà cung cấp dịch vụ điện 
toán đám mây buộc phải đóng dịch vụ của mình do một số vấn đề tài chính hay pháp lý, khi đó tất cả dữ liệu 
của ngƣời dùng sẽ bị mất. 
 Tấn công luồng dữ liệu: Đây là vấn đề mà những ngƣời sử dụng dịch vụ lƣu trữ cloud cần lƣu ý tới, chủ yếu là 
các thao tác mà hacker sử dụng để tấn công nhƣ MITM, spam, tấn công từ chối dịch vụ, virus, malware, 
 Những nguy hại từ bên trong: Các mối đe dọa này bao gồm gian lận, phá hỏng dữ liệu, đánh cắp hoặc mất 
thông tin bí mật do chính ngƣời trong cuộc đƣợc tin tƣởng gây ra. Những ngƣời này có thể có khả năng xâm 
nhập vào bên trong tổ chức và truy cập dữ liệu bất hợp pháp nhằm phá hoại, gây tổn thất tài chính, hiệu suất 
công việc, thiệt hại thƣơng hiệu. 
Từ những vấn đề liên quan tới an toàn và bảo mật cho dữ liệu của ngƣời dùng khi lƣu trữ trên các dịch vụ cloud 
miễn phí hiện nay, kết hợp với ý tƣởng của cơ chế lƣu trữ của RAID trên các thiết bị đĩa cứng. Nhóm nghiên cứu 
chúng tôi đề xuất một phƣơng án lƣu trữ dữ liệu online kiểu RAID, nhằm tăng khả năng bảo mật cho dữ liệu đƣợc lƣu 
trữ của ngƣời dùng trên cloud, đồng thời vẫn sử dụng đƣợc các dịch vụ lƣu trữ miễn phí. 
518 NGHIÊN CỨU VỀ CÁC CƠ CHẾ RAID VÀ ĐỀ XUẤT GIẢI PHÁP LƢU TRỮ DỮ LIỆU AN TOÀN TRÊN DỊCH VỤ ĐÁM MÂY 
III. GIẢI PHÁP LƢU TRỮ DỮ LIỆU AN TOÀN TRÊN CLOUD – RBCS 
A. Đề xuất giải pháp lưu trữ an toàn RBCS 
1. Giải pháp RBCS 
RBCS (RAID Based Cloud Storage) là cơ chế lƣu trữ dữ liệu trên các dịch vụ cloud do nhóm nghiên cứu đề 
xuất, sử dụng các tài khoản miễn phí của các nhà cung cấp dịch vụ nhƣ GDrive, Dropbox, Box, OneDrive, RBCS kết 
hợp giữa cơ chế lƣu trữ an toàn có dự phòng của RAID 0,1 đồng thời tận dụng đƣợc khả năng linh động của dịch vụ 
lƣu trữ cloud. Khi đó, giải pháp này giải quyết đƣợc 2 vấn đề chính đối với dữ liệu đƣợc lƣu trữ trên cloud đó là: 
 Tính toàn vẹn: Dữ liệu đƣợc lƣu trữ phân bố trên nhiều tài khoản khác nhau, không phụ thuộc hoàn toàn vào 
bất cứ nhà cung cấp dịch vụ lƣu trữ cloud nào, do đó khả năng chịu lỗi có thể là toàn bộ các tài khoản của một 
nhà cung cấp dịch vụ bị mất hoặc không truy cập đƣợc. Trong trƣờng hợp đó, dữ liệu sẽ vẫn đƣợc khôi phục 
dựa trên các mảnh đƣợc phân phối trên các tài khoản khác. 
 Tính bảo mật: Các mảnh dữ liệu đƣợc phân chia sẽ là riêng rẽ và độc lập, ngay cả khi tài khoản bị tấn công 
hay bị xâm nhập bất hợp pháp từ chính nhà cung cấp dịch vụ, cũng không thể xem dữ liệu nhạy cảm của 
ngƣời dùng. Chỉ khi đọc dữ liệu, các mảnh ghép đó sẽ đƣợc tải về đồng bộ và khôi phục lại trên máy của 
ngƣời dùng. 
2. Cơ chế lƣu trữ dữ liệu của RBCS 
Giải pháp này sử dụng các tài khoản trên các nhà cung cấp dịch vụ cloud hiện nay nhƣ: Gdrive, OneDrive, 
Dropbox, Box, để lƣu trữ dữ liệu. Những tài khoản miễn phí này có thể đƣợc tạo ra đơn giản với địa chỉ email của 
ngƣời dùng. Để đảm bảo tính toàn vẹn cho dữ liệu khi lƣu trữ, RBCS sẽ sử dụng tối thiểu 3 nhà cung cấp dịch vụ cloud 
và tối thiểu n (n>=2) tài khoản trên mỗi dịch vụ, do đó số tài khoản dùng để lƣu trữ sẽ là 3*n tài khoản. 
Hình 3. Cơ chế lƣu trữ dữ liệu của RBCS 
Quá trình lƣu trữ dữ liệu trên các tài khoản cloud đƣợc thực hiện nhƣ sau: với mỗi tập tin ngƣời dùng cần lƣu 
trữ, RBCS sẽ phân mảnh thành các phần và tiến hành lƣu trữ các phần đó trên các tài khoản giống nhƣ cơ chế RAID 
10. Lấy ví dụ một tập tin đƣợc phân thành 9 mảnh và sử dụng 3 tài khoản cloud trên mỗi dịch vụ (tổng có 9 tài khoản): 
Hình 4. Phân mảnh dữ liệu và lƣu trữ trên các kho dữ liệu cloud 
Trên Hình 4, dữ liệu tập tin đƣợc lƣu vào các tài khoản cloud theo quy tắc: 
 Các tài khoản của cùng 1 nhà cung cấp dịch vụ đƣợc đặt xen kẽ nhau, theo quy tắc n*i+m (trong đó n là số tài 
khoản trên cùng 1 dịch vụ, i là số lƣợt, m là thứ tự tài khoản). 
 Trên mỗi tài khoản sẽ lƣu trữ 2 mảnh dữ liệu kề nhau theo thứ tự đã phân mảnh. 
 Mảnh đầu tiên và cuối cùng sẽ đƣợc lƣu trên cùng 1 tài khoản. 
Với cách phân chia các mảnh vào các tài khoản và thứ tự sắp xếp các tài khoản nhƣ vậy sẽ có các ƣu điểm là: 
 Khi 1 tài khoản bất kì bị mất hoặc không truy cập đƣợc, dữ liệu có thể đƣợc lấy từ 2 tài khoản lân cận. 
Lê Quang Minh, Nguyễn Anh Chuyên, Lê Khánh Dƣơng, Phan Huy Anh, Trịnh Thị Thu 519 
 Khi tất cả các tài khoản của cùng một nhà cung cấp dịch vụ bị mất (trƣờng hợp này hiếm xảy ra hơn), dữ liệu 
của các mảnh vẫn khôi phục đƣợc từ các tài khoản khác trên các dịch vụ khác. 
 Nếu 2 tài khoản liên tiếp trong danh sách bị mất dữ liệu (trƣờng hợp này có thể xảy ra), dữ liệu không khôi 
phục đƣợc. 
 Nếu 2 nhà cung cấp dịch vụ cùng ngừng hoạt động, dữ liệu cũng không khôi phục lại đƣợc. 
Vấn đề tiếp theo là quản lý danh sách thứ tự các tài khoản khi lƣu trữ và thứ tự các mảnh dữ liệu. Do thứ tự các 
tài khoản này có thể không cố định để tăng tính phức tạp và khó đoán khi bị hack. Hiện nay các nhà cung cấp dịch vụ 
thƣờng quy định dung lƣợng tối đa cho mỗi tài khoản và kích thƣớc tối đa cho mỗi tập tin khi đƣợc tải lên. Dung lƣợng 
này có thể khác nhau tuỳ từng nhà cung cấp dịch vụ cloud: Dropbox là 2GB, Box là 5GB, OneDrive là 5GB, Google 
Drive là 15GB (gồm cả email, photos, files), Mega là 50GB, Kích thƣớc tập tin tối đa có thể tải lên cũng khác nhau 
ở mỗi dịch vụ, tuy nhiên do còn các yếu tố nhƣ tốc độ đƣờng truyền internet, hạ tầng công nghệ, độ an toàn cho dữ 
liệu, nên với RBCS, chúng tôi khuyến khích để dung lƣợng tối đa cho tập tin tải lên là 200MB. 
Do kích thƣớc tập tin tải lên là khác nhau, tuy nhiên để đảm bảo vấn đề an toàn cho dữ liệu khi lƣu trữ trên các 
tài khoản cloud, RBCS sẽ tiến hành phân mảnh dữ liệu theo số lƣợng tài khoản hoặc số lƣợng dịch vụ, để đảm bảo tối 
ƣu khi lƣu trữ các tập tin có dung lƣợng nhỏ. Sau khi phân mảnh, RBCS sẽ thêm vào các mảnh dữ liệu này phần header 
chứa các thông tin để quản lý nhƣ sau: 
Hình 5. Cấu trúc header của mỗi phần 
Trong đó: 
 Total package: Tổng số mảnh mà tập tin này đƣợc phân mảnh. 
 Order package: Số thứ tự của mảnh trong cấu trúc. 
 Next storage: Lƣu mã của kho dữ liệu chứa mảnh tiếp theo. 
 Filesize: Kích thƣớc tập tin, dùng kiểm tra khi ghép mảnh lại. 
 Data: Dữ liệu của mảnh. 
Do đƣợc phân mảnh và đƣợc lƣu trữ phân tán trên các tài khoản của các kho dữ liệu khác nhau, nên dữ liệu của 
mỗi mảnh trong trƣờng hợp bị truy cập trái phép cũng không thể hiện đƣợc nội dung của toàn bộ tài liệu. Tuy nhiên, 
với các tập tin đơn giản không có cấu trúc header nhƣ tập tin txt, thì dữ liệu từng mảnh cũng có thể đƣợc khai thác, do 
vậy thao tác mã hoá dữ liệu của từng mảnh cũng sẽ đƣợc quan tâm nghiên cứu tiếp. 
B. Đánh giá và so sánh RBCS với giải pháp khác 
Làm sao có thể ngăn chặn truy cập bất hợp pháp tới dữ liệu của ngƣời dùng khi mật khẩu của họ đang bị đánh 
cắp? Mã hóa có thể là một giải pháp cho vấn đề này, vì đơn giản chỉ cần mã hóa các tập tin trƣớc khi gửi lên các dịch 
vụ cloud sẽ ngăn chặn thông tin rò rỉ từ các tập tin bị đánh cắp. Khi đó nếu mật khẩu bị đánh cắp, bên thứ 3 vẫn sẽ có 
quyền truy cập đến dữ liệu, nhƣng họ sẽ không có khả năng giải mã để xem dữ liệu [16]. Hiện nay một số phần mềm 
đã đƣợc phát triển dựa trên nguyên lý mã hoá dữ liệu của ngƣời dùng trƣớc khi đƣa lên cloud: 
Credeoncp là một ứng dụng mã hoá phía client cho các dịch vụ lƣu trữ trên cloud [15], phần mềm có thể làm 
việc với tất cả các nhà cung cấp dịch vụ lƣu trữ cloud phổ biến hiện nay, cho phép mã hoá các tập tin dữ liệu của ngƣời 
dùng, bảo vệ dữ liệu trƣớc những truy cập trái phép bên ngoài và đặc biệt hơn, ứng dụng này cam kết bảo vệ dữ liệu 
ngƣời dùng khỏi sự can thiệp của cả chính quyền, cung cấp mã hoá AES 256 và FIPS 140-2. 
Một ứng dụng khác là Spideroak, dịch vụ này cho phép ngƣời dùng lƣu trữ dữ liệu trên cloud và các tập tin sẽ 
đƣợc mã hoá bởi mật khẩu của chính họ trƣớc khi đƣợc chuyển lên server. Thông tin về mật khẩu ngƣời dùng sẽ đƣợc 
giữ an toàn tại chính máy tính của họ và không lƣu trên máy chủ của nhà cung cấp dịch vụ. Do đó, vấn đề về an toàn 
dữ liệu có thể đảm bảo khi chính nhà cung cấp cũng không thể truy cập trái phép các tập tin của ngƣời dùng khi không 
có mật khẩu. 
BoxCryptor là dịch vụ trung gian giữa ngƣời sử dụng và các dịch vụ lƣu trữ cloud nhƣ Dropbox, Google Drive, 
OneDrive, dịch vụ này sẽ thực hiện cơ chế mã hoá các dữ liệu của ngƣời dùng trƣớc khi tiến hành lƣu trữ chúng trên 
các kho dữ liệu trên cloud. Dữ liệu có thể đƣợc truy cập trên các nền tảng khác nhau nhƣ mobile, desktop và các hệ 
điều hành nhƣ Windows, MAC, Linux. 
Các giải pháp để nâng cao tính bảo mật cho các dịch vụ lƣu trữ cloud hiện nay đa phần đều ứng dụng cơ chế mã 
hoá dữ liệu, điều này hạn chế đƣợc việc lộ dữ liệu bí mật và truy cập bất hợp pháp. Tuy nhiên, cần nhận định rằng, 
những điều cam kết về quyền riêng tƣ của ngƣời dùng từ các nhà cung cấp dịch vụ chỉ là tƣơng đối và chúng ta chƣa 
thể khẳng định đƣợc do hạ tầng và giải pháp của họ là hoàn toàn đóng. Bên cạnh đó, yếu tố đảm bảo tính toàn vẹn dữ 
520 NGHIÊN CỨU VỀ CÁC CƠ CHẾ RAID VÀ ĐỀ XUẤT GIẢI PHÁP LƢU TRỮ DỮ LIỆU AN TOÀN TRÊN DỊCH VỤ ĐÁM MÂY 
liệu chƣa đƣợc đề cập nhiều, dịch vụ cloud có thể dừng bất cứ khi nào do nhiều nguyên nhân, khi đó dữ liệu của ngƣời 
dùng sẽ không thể khôi phục đƣợc. Với đề xuất về giải pháp RBCS, nhóm nghiên cứu đã tính đến yếu tố bảo mật dữ 
liệu và tính dự phòng cho việc khôi phục trong trƣờng hợp bị mất mát. 
IV. KẾT LUẬN VÀ HƢỚNG NGHIÊN CỨU 
Công nghệ điện toán đám mây đang phát triển nhanh chóng và trở thành một nền tảng đƣợc sử dụng rộng rãi 
cho các ứng dụng tính toán phức tạp và hình thành cụm lƣu trữ dữ liệu. Vấn đề an ninh và an toàn dữ liệu luôn là điều 
đƣợc quan tâm và thu hút nhiều nghiên cứu của các nhà khoa học. Trong nội dung bài báo, nhóm nghiên cứu đã đƣa ra 
những lập luận và dẫn chứng về sự mất an toàn và chính sách ngƣời dùng ở khía cạnh là các dịch vụ lƣu trữ đám mây 
công cộng. Từ đó đề xuất một giải pháp lƣu trữ dữ liệu an toàn dựa trên cơ chế của RAID. Giải pháp này đã phần nào 
giải quyết đƣợc 2 vấn đề đƣợc quan tâm hiện nay trên dịch vụ cloud: tính bảo mật và toàn vẹn cho dữ liệu ngƣời dùng. 
Hƣớng nghiên cứu tiếp theo sẽ tập trung vào xây dựng mô hình hoá cho giải pháp RBCS để cài đặt thử nghiệm, 
đánh giá mức độ tin cậy và khả năng sẵn sàng cũng nhƣ mức độ chịu lỗi của hệ thống lƣu trữ. Đồng thời tìm cơ chế mã 
hoá cho dữ liệu khi lƣu trữ trên cloud, cũng nhƣ cơ chế đồng bộ dữ liệu trên các thiết bị hay hệ điều hành nhƣ một số 
dịch vụ lƣu trữ hiện nay cung cấp. 
Qua đây, nhóm tác giả bài báo xin bày tỏ lòng cảm ơn đối với Dự án sản phẩm công nghệ cao của Bộ Công 
Thƣơng "Ứng dụng công nghệ bảo đảm an ninh, an toàn mạng và bí mật thông tin ở mức cao để phát triển bộ giải pháp 
an toàn an ninh mạng LAN cho cơ quan Nhà nƣớc và doanh nghiệp". 
V. TÀI LIỆU THAM KHẢO 
[1] Anju Chhibber, Dr. Sunil Batra, “Security Analysis of Cloud Computing”, International Journal of Advanced Research in 
Engineering and Applied Sciences, ISSN: 2278-6252. Vol. 2, No. 3, pp.49-53, March 2013. 
[2] Jaydip Sen, “Security and Privacy Issues in Cloud Computing”, Innovation Labs, Tata Consultancy Services Ltd., Kolkata, 
INDIA, 2013. 
[3] Monjur Ahmed, Mohammad Ashraf Hossain, “Cloud Computing and Security Issues in The Cloud”, International Journal of 
Network Security & Its Applications (IJNSA), Vol.6, No.1, January 2014. 
[4] Cloud Security Alliance, “Top Threats to Cloud Computing”, 2010. 
[5] Dimitrios Zissis, “Addressing cloud computing security issues”, Future Generation Computer Systems, 28 (3), 583-592, 2012. 
[6] Nir Kshetri, “Privacy and security issues in cloud computing: The role of institutions and institutional evolution”, 
Telecommunications Policy, Volume 37, Issues 4–5, Pages 372–386, 2013. 
[7] Daniel Fitch, Haiping Xu, “A Raid-Based Secure and Fault-Tolerant Model for Cloud Information Storage”, International 
Journal of Software Engineering and Knowledge Engineering, 2013. 
[8] A. Cruz, Update on Today’s Gmail Outage, Google, February 24, 2009, retrieved on September 20, 2010 from 
 blogspot.com/2009/02/update-on-todays-gmail- outage.html. 
[9] J. Mintz, Microsoft Dumps Windows Live Spaces for WordPress.com, Huffington Post, September 27, 2010, retrieved on April 
25, 2011 from  2010/09/27/microsoft-dumps-windows-l_n_741023.html. 
[10] Fahmida Y. Rashid, Introducing the 'Treacherous 12,' the top security threats organizations face when using cloud services, 
from  
[11] Claire Reilly, Hackers hold 7 million Dropbox passwords ransom, from 
dropbox-passwords-ransom/. 
[12] RAID Levels and SQL Server, https://technet.microsoft.com/en-us/library/ms190764(v=sql.105).aspx. 
[13] Lucas Mearian, “No, your data isn't secure in the cloud”, from  cloud-
security/no--your-data-isn-t-secure-in-the-cloud.html, 2013. 
[14] Credeoncp Application, https://credeoncp.hitachisolutions-us.com. 
[15] Hector Salcedo, Google Drive, Dropbox, Box and iCloud Reach the Top 5 Cloud Storage Security Breaches List, from 
https://psg.hitachi-solutions.com/credeon/blog/google-drive-dropbox-box-and-icloud-reach-the-top-5-cloud-storage-security-
breaches-list. 
[16] Glenn Berry, SQL Server Hardware, ISBN: 978-1-906434-62-5, Simple Talk Publishing 2011. 
RESEARCH ON THE MECHANISM OF RAID AND PROPOSE A 
SOLUTION FOR SAFETY DATA STORAGE ON CLOUD SERVICES 
Le Quang Minh, Nguyen Anh Chuyen, Le Khanh Duong, Phan Huy Anh, Trinh Thi Thu 
ABSTRACT— Cloud technology is developed and widely used in the deployment of network and data storage services. Users 
benefit from online data storage service when registering for free accounts, the data is stored on the Cloud and has a convenient 
synchronization mechanism, that across multiple platforms, devices. However, the protection for this important data without lost 
when storage services occur errors, or to avoid infringement of an illegal manner is beyond the control of the user. In this paper, 
our team propose a solution for safety storage of user’s data based on RAID mechanism, in order to overcome the above risks, while 
still able to use the storage accounts from free services. 

File đính kèm:

  • pdfnghien_cuu_ve_cac_co_che_raid_va_de_xuat_giai_phap_luu_tru_d.pdf