Đánh giá độ mạnh mật khẩu sử dụng ngôn ngữ tiếng Việt dựa trên ước lượng entropy

Mật khẩu là một trong những

nhân tố được sử dụng phổ biến nhất trong hệ

thống xác thực. Vai trò của mật khẩu là đảm

bảo người dùng có quyền hợp lệ với dữ liệu

mà họ đang muốn truy cập. Hầu hết các hệ

thống đều cố gắng thực thi bảo mật bằng

cách bắt buộc người dùng tuân theo các

chính sách tạo mật khẩu thông qua đánh giá

độ mạnh mật khẩu. Bài báo này giới thiệu

một số phương pháp đánh giá độ mạnh mật

khẩu trong đó tập trung vào phương pháp

đánh giá dựa trên ước lượng entropy, từ đó

đề xuất phát triển một công cụ đánh giá độ

mạnh mật khẩu có thể ứng dụng được trong

các phần mềm xác thực người dùng dựa trên

mật khẩu sử dụng ngôn ngữ tiếng Việt.

Download

Trang 1

Trang 2

Trang 3

Trang 4

Trang 5

Trang 6

Trang 7

Trang 8

Trang 9

Trang 10

Tải về để xem bản đầy đủ

11 trang duykhanh 13760

Download

Bạn đang xem 10 trang mẫu của tài liệu "Đánh giá độ mạnh mật khẩu sử dụng ngôn ngữ tiếng Việt dựa trên ước lượng entropy", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Đánh giá độ mạnh mật khẩu sử dụng ngôn ngữ tiếng Việt dựa trên ước lượng entropy

còn của các ký tự còn lại là 6). Vì cố gắng thử các chuỗi mẫu có độ dài ngắn hơn
, nên j chỉ nhận giá trị duy trƣớc với giá trị tối thiểu là D lần đoán đối với
| |
nhất là 1. Với , mỗi mẫu, và sẽ mất tổng cộng ∑
Do đó, số lần đoán | | | | lần đoán. Ví dụ, nếu
trung bình của mẫu này là: một mật khẩu bao gồm token mật khẩu t phổ
∑ ∑
biến thứ 20 với một chữ số d ở cuối –một chuỗi
. Công thức (1) gồm 2 mẫu – và kẻ tấn công biết D = 10000 mật
cũng sẽ đƣợc áp dụng để tính điểm cộng nếu khẩu phổ biến nhất và td không ở trong danh
1
trong mẫu có sử dụng các phím đƣợc kết hợp sách 10000 này, D biểu thị một kẻ tấn công thử
với phím Shift, khi đó L và U trở thành số 10000 lần đoán trong danh sách này trƣớc khi
lƣợng các phím có kết hợp và không kết hợp với thử đoán hai mẫu.
phím Shift. zxcvbn đƣợc đánh giá là xem xét thành
Các đối tượng so khớp lặp lại đƣợc phân phần của mật khẩu kỹ lƣỡng hơn tất cả các công
tích thành một cơ sở đƣợc lặp lại n lần, trong đó cụ kiểm tra khác trong các thử nghiệm của [3],
các bƣớc so khớp – ƣớc lƣợng – tìm kiếm đệ dẫn đến việc đánh giá thực tế hơn về độ phức
quy trƣớc đó đƣợc thực hiện lại với một số lần tạp của mật khẩu cho trƣớc. Tuy nhiên, có quá
đoán cơ sở g. Do đó, số lần đoán mẫu lặp lại nhiều mẫu khác nhau ngƣời dùng có thể sử
đƣợc ƣớc lƣợng là . dụng để tạo mật khẩu mà zxcvbn không thể
Các mẫu chuỗi đƣợc tính điểm theo công nhận biết hết đƣợc, ví dụ nhƣ các từ đã bị bỏ đi
thức | |, trong đó s là số ký tự bắt đầu chữ cái đầu, các từ không có nguyên âm, các từ
có thể, n là độ dài của chuỗi và d là độ lệch (ví đánh vần sai, n-gram, mã zip của các khu vực,
các tổ hợp bàn phím cách xa nhau ví dụ nhƣ
dụ: d 2 trong mẫu ―9753‖).
qzwxec, v.v [13]. Nhóm phát triển bộ công cụ
Đối với mẫu ngày tháng, công thức tính số này cũng đã đƣa ra khuyến nghị rằng việc bổ
lần đoán là | |. sung các mẫu ví dụ nhƣ các bộ từ điển và cụm
Cuối cùng, các so khớp bruteforce có độ dài từ thông dụng trong các ngôn ngữ khác ngoài
l đƣợc gán một hằng số C = 10 lần đoán cho tiếng Anh, các mẫu tổ hợp bàn phím theo các sơ
mỗi ký tự, mang lại giá trị ƣớc lƣợng tổng là . đồ bàn phím khác, v.v.. trong bƣớc so khớp
D. Bước tìm kiếm chính là một cách hiệu quả để cải thiện tính hiệu
Với một mật khẩu chuỗi và một tập hợp các quả cho bộ công cụ này.
so khớp trùng lặp tƣơng ứng , bƣớc cuối cùng IV. ĐỀ XUẤT PHƢƠNG PHÁP ĐÁNH GIÁ
là tìm kiếm chuỗi kết hợp S liền kề không trùng ĐỘ MẠNH MẬT KHẨU
lặp bao gồm hoàn toàn mật khẩu và thỏa mãn
Phần này sẽ trình bày đề xuất phƣơng pháp
biểu thức sau [1]:
đánh giá độ mạnh mật khẩu đƣợc phát triển dựa
|S | 1
arg minD | S |! m . guesses trên ƣớc lƣợng entropy theo thuật toán zxcvbn
S mS (3)
đã đƣợc phân tích ở trên.
Trong đó, |S| là độ dài của chuỗi S, D là một
Mã nguồn chƣơng trình zxcvbn đã đƣợc
hằng số. Giả sử rằng chuỗi đƣợc chọn S đƣợc
phát triển thêm một số nội dung để biến nó trở
64 Số 2.CS (08) 2018
Nghiên cứu Khoa học và Công nghệ trong lĩnh vực An toàn thông tin
thành một công cụ đánh giá độ mạnh mật khẩu Đủ mạnh (4 điểm) đối với các mật khẩu
sử dụng đƣợc trong các hệ thống xác thực ngƣời cần trên 1012 lần đoán.
dùng dựa trên mật khẩu có sử dụng tiếng Việt. B. Bổ sung tiếng việt vào dữ liệu so khớp từ điển
Các nội dung đã đƣợc phát triển thêm bao gồm:
Một trong những điểm yếu của zxcvbn là ở
tính toán ngƣỡng an toàn theo entropy của mật
chỗ bộ từ điển của nó chỉ bao gồm các từ tiếng
khẩu và tích hợp mô-đun đánh giá độ mạnh mật
Anh, do đó, nó không thể nhận ra các từ hoặc
khẩu theo thang điểm; và tích hợp từ điển tiếng
cụm từ phổ biến trong các ngôn ngữ khác. Ở
Việt vào dữ liệu bƣớc so khớp.
đây, một từ điển tiếng Việt đã qua xử lý đã đƣợc
Các mục tiếp theo đây sẽ lần lƣợt phân tích bổ sung vào dữ liệu so khớp từ điển của chƣơng
chi tiết các nội dung đã đƣợc bổ sung vào mã trình này.
nguồn chƣơng trình zxcvbn trên.
Đặt giả thiết rằng các hệ thống thƣờng chỉ
A. Tính toán ngưỡng an toàn theo entropy của cho phép ngƣời dùng thiết lập mật khẩu không
mật khẩu và tích hợp mô-đun đánh giá độ mạnh dấu hoặc nếu có cho phép thì cũng rất ít ngƣời
mật khẩu theo thang điểm dùng sử dụng tiếng Việt có dấu cho mật khẩu
Zxcvbn cung cấp giá trị ƣớc lƣợng entropy của mình, do đó, kẻ tấn công khi muốn bẻ khóa
của một mật khẩu đầu vào. Tuy nhiên, với một một mật khẩu sẽ thử đoán bằng một từ điển bao
ngƣời dùng thông thƣờng, giá trị entropy này gồm các từ không dấu trƣớc và các mật khẩu là
cũng không thể giúp họ đánh giá đƣợc mật khẩu các từ có dấu đƣợc xem là khó đoán hơn hay
mà họ lựa chọn đã đủ an toàn hay chƣa. Để cụ mạnh hơn. Một danh sách các từ tiếng việt đƣợc
thể hơn, cần phải có một mô-đun đánh giá mức lấy từ dự án Từ điển tiếng Việt miễn phí (The
độ mạnh yếu của mật khẩu theo thang điểm. Free Vietnamese Dictionary Project [15]) sau đó
Căn cứ đánh giá độ mạnh của một mật khẩu đƣợc chuyển đổi thành định dạng các từ tiếng
theo giá trị entropy đƣợc dựa vào là RFC 4086 Việt không dấu và viết thƣờng rồi đƣa vào dữ
– ―Các yêu cầu về tính ngẫu nhiên đối với bảo liệu từ điển so khớp của chƣơng trình.
mật‖ [14] năm 2004. Tài liệu này đã trình bày Hình 2 mô tả định dạng các từ trong từ điển
một số mô hình tấn công lên các giá trị bí mật tiếng Việt nguyên gốc đƣợc lấy từ [15] (bên
(mật khẩu, khóa mật mã) và entropy cần thiết trái) và sau khi đƣợc chuyển đổi thành định
đối với từng mô hình. Kết quả là để chống lại dạng phù hợp để sử dụng trong cơ sở dữ liệu so
các tấn công trực tuyến, một mật khẩu có 29 bit khớp của chƣơng trình (bên phải).
entropy đƣợc đánh giá là đủ an toàn. Tuy nhiên,
đây là giá trị cần thiết tại năm 2004. Theo định
luật Moore, mỗi năm giá trị này chỉ cần thêm
2/3 bit, có nghĩa là đến năm 2019, giá trị
entropy tối thiểu để mật khẩu đƣợc đánh giá là
đủ an toàn trƣớc các tấn công trực tuyến phải là:
.
Vì nên các ngƣỡng đánh giá độ
mạnh của mật khẩu dựa trên số lần đoán cần
thiết để tìm ra một mật khẩu đƣợc thiết lập nhƣ
sau:
Rất yếu (0 điểm) đối với các mật khẩu có
thể bị bẻ khóa với chƣa đến 103 lần đoán;
Yếu (1 điểm) nếu số lần đoán cần thiết
nằm trong khoảng 103-106;
Trung bình (2 điểm) nếu cần từ 106-109 Hình 2. Định dạng dữ liệu tiếng Việt trước và sau
lần đoán; khi được xử lý
Khá mạnh (3 điểm) nếu cần từ 109-
1012lần và;
Số 2.CS (08) 2018 65
Journal of Science and Technology on Information Security
V. MỘT SỐ KẾT QUẢ THỬ NGHIỆM Kết quả thử nghiệm đánh giá các danh sách
PHƢƠNG PHÁP ĐÁNH GIÁ mật khẩu trên đƣợc thể hiện trong Bảng 3.
ĐỘ MẠNH MẬT KHẨU ĐƢỢC ĐỀ XUẤT BẢNG 3. KẾT QUẢ THỬ NGHIỆM CÔNG CỤ
Để đánh giá hoạt động của phƣơng pháp ĐÁNH GIÁ ĐỘ MẠNH MẬT KHẨU
đƣợc đề xuất, một số danh sách mật khẩu dƣới Điểm xato phpBB MySpace vnzoom
đây đã đƣợc lựa chọn để thử nghiệm đánh giá 0 78 148 41 220
độ mạnh mật khẩu.
1 8932 26145 4835 96895
Danh sách top 10.000 mật khẩu từ nghiên
cứu của Mark Burnett đƣợc công bố trên trang 2 990 81948 18340 1117424
web xato.net [16]: Danh sách 10.000 mật khẩu 3 0 52588 10456 2359467
phổ biến này đƣợc xếp hạng theo số lƣợng 4 0 23559 3454 2470234
ngƣời dùng sử dụng cùng một mật khẩu và đã
Tổng
10000 184388 37126 6044240
đƣợc chuyển đổi thành tất cả các chữ cái viết số
thƣờng [17].
Điểm
1.09 2.40 2.34 3.19
Danh sách mật khẩu người dùng của diễn TB
đàn phpBB.com [18]. Năm 2009, diễn đàn này
đã bị xâm nhập do một ứng dụng bên thứ ba và Bảng trên cho thấy, trong các danh sách mật
một cơ sở dữ liệu chứa mật khẩu băm đã bị rò khẩu dựa trên tiếng Anh, xato.net cung cấp danh
rỉ. Do nền tảng kỹ thuật của ngƣời dùng đăng ký sách 10.000 mật khẩu phổ biến, thƣờng có mặt
trên trang web này, mật khẩu có xu hƣớng phức trong các từ điển đối chiếu của các công cụ
tạp hơn một chút so với các từ điển khác. Thành đánh giá độ mạnh, do đó, điểm đánh giá độ
phần mật khẩu: 41,24% chỉ bao gồm chữ cái mạnh đạt thấp nhất, chỉ khoảng hơn 1 điểm và
viết thƣờng, 35,7% chỉ bao gồm chữ cái viết không có mật khẩu nào đạt đƣợc điểm 3 hoặc 4.
thƣờng và chữ số, 11,24% chỉ bao gồm chữ số, Trong khi đó, mật khẩu thực sự đƣợc ngƣời
4,82% có sử dụng cả chữ cái viết hoa và viết dùng sử dụng (phpBB.com và MySpace.com)
thƣờng và chữ số, 2,68% sử dụng chữ cái hỗn có độ mạnh trung bình cao hơn, nằm trong
hợp và phần còn lại đƣợc tạo thành từ các tổ khoảng giữa 2 và 3 điểm, và có cả mật khẩu đủ
hợp ký tự khác nhau [2]. an toàn (4 điểm).
Danh sách mật khẩu người dùng của trang
web MySpace.com. Trang web này đã bị hack
vào ngày 11 tháng 6 năm 2013 bởi công cụ
LeakedSource, một công cụ tìm kiếm có khả
năng tìm kiếm, tổng hợp dữ liệu từ hàng trăm
nguồn khác nhau. Danh sách đầy đủ bao gồm
tổng cộng 427.484.128 mật khẩu của gồm
360.000.000 ngƣời dùng [19], một danh sách
thu nhỏ bao gồm 37.126 mật khẩu đƣợc cung
cấp trong [20] đã đƣợc sử dụng để thử nghiệm
công cụ này.
Danh sách mật khẩu người dùng của diễn
đàn vnzoom.com. Diễn đàn chia sẻ công nghệ
này đã bị tấn công vào ngày 31/5/2012 và để bị
Hình 3. Biểu đồ phân bố độ mạnh mật khẩu của các
rò rỉ ra một cơ sở dữ liệu bao gồm mật khẩu của danh sách mật khẩu dựa trên tiếng Anh
sáu triệu ngƣời dùng trên diễn đàn này. Danh
sách sáu triệu mật khẩu này [21] đã đƣợc đƣa Hình 3 và 4 minh họa cụ thể hơn sự phân bố
vào để thử nghiệm nhằm mục đích đánh giá dữ mật khẩu dựa trên ngôn ngữ tiếng Anh của ba
liệu từ điển tiếng Việt đã đƣợc đƣa tích hợp danh sách đầu tiên (xato.net, phpBB.com,
thêm vào dữ liệu so khớp của bộ công cụ đánh MySpace.com) theo thang điểm độ mạnh.
giá.
66 Số 2.CS (08) 2018
Nghiên cứu Khoa học và Công nghệ trong lĩnh vực An toàn thông tin
Hình 6 minh họa kết quả tích hợp mô-đun
đánh giá độ mạnh mật khẩu vào phần mềm.
Hình 4. Biểu đồ phân bố độ mạnh mật khẩu của từng Hình 6. Tích hợp mô-đun đánh giá mật khẩu
danh sách mật khẩu dựa trên tiếng Anh
Những danh sách mật khẩu ở các trang web Các kết quả đánh giá độ mạnh mật khẩu có
trên chỉ chứa ngôn ngữ tiếng Anh. Để đánh giá thể giúp các nhà quản trị hệ thống đƣa ra chính
tác động của từ điển tiếng Việt đối với bộ công sách tạo mật khẩu phù hợp, ví dụ nhƣ chỉ cho
cụ đƣợc đề xuất, chúng tôi đã thực hiện đánh phép các mật khẩu có độ mạnh đạt một giá trị
giá mật khẩu của vnzoom.com trong hai trƣờng tối thiểu nhất định. Mô-đun đánh giá độ mạnh
hợp: từ điển chỉ bao gồm tiếng Anh và từ điển mật khẩu đƣợc trình bày trong bài báo này cũng
bao gồm cả tiếng Anh và tiếng Việt. Kết quả đã đƣợc thử nghiệm cài đặt vào một số hệ thống
thử nghiệm hai trƣờng hợp này lần lƣợt đƣợc và cho thấy đƣợc tính hiệu quả.
minh họa trong hình 5(a) và 5(b). Kết quả này
cho thấy rằng khi có thêm từ điển tiếng Việt vào VI. KẾT LUẬN
dữ liệu so khớp, số lƣợng mật khẩu đƣợc đánh Bài báo này đã phân tích và đề xuất phƣơng
giá là đủ mạnh giảm hơn 10% (từ 51,479% pháp đánh giá độ mạnh mật khẩu dựa trên
xuống còn 40,869%). Điều này chứng tỏ rằng entropy và thử nghiệm đánh giá hoạt động của
việc đánh giá độ mạnh mật khẩu phụ thuộc phƣơng pháp đánh giá độ mạnh mật khẩu này.
nhiều vào ngôn ngữ mà ngƣời sử dụng lựa chọn Kết quả thử nghiệm sử dụng phƣơng pháp đƣợc
để thiết lập mật khẩu, và việc bổ sung từ điển đề xuất để đánh giá độ an toàn mật khẩu của
tiếng Việt đã giúp đánh giá độ mạnh mật khẩu ngƣời dùng một số hệ thống trên thực tế cho
của ngƣời dùng sử dụng ngôn ngữ tiếng Việt thấy rằng ngay cả các hệ thống mà ngƣời dùng
một cách chính xác hơn. có trình độ công nghệ thông tin thì cũng chƣa
đến một nửa số ngƣời dùng lựa chọn đƣợc một
mật khẩu đủ an toàn. Vì vậy, vấn đề về độ an
toàn của mật khẩu cần phải đặt ra ngay cả đối
với những ngƣời dùng am hiểu về công nghệ.
Ngoài ra, kết quả thử nghiệm cài đặt mô-
đun đánh giá độ mạnh mật khẩu trong một số hệ
thống cũng cho thấy khả năng công cụ này có
thể đƣợc triển khai một cách đơn giản và hiệu
Hình 5. Biểu đồ phân bố độ mạnh mật khẩu của quả trong các hệ thống xác thực ngƣời dùng dựa
vnzoom.com trên mật khẩu.
Số 2.CS (08) 2018 67
Journal of Science and Technology on Information Security
TÀI LIỆU THAM KHẢO SƠ LƢỢC VỀ TÁC GIẢ
[1]. https://en.wikipedia.org/wiki/Password CN. Hoàng Thu Phương
[2]. Xavier De Carne De Carnavalet, Mohammad Đơn vị công tác: Viện KH-CN mật
Mannan (2015) ―A Large-Scale Evaluation of mã, Ban Cơ yếu Chính phủ.
High-Impact Password Strength Meters‖. Email: thuphuonghoang306@gmail.com
[3]. https://en.wikipedia.org/wiki/Password_strength
Quá trình đào tạo: Nhận bằng kỹ sƣ
[4]. NIST Special Publication 800-63: Electronic tại Đại học Thƣợng Hải 2012.
Authentication Guideline, 2004.
[5]. Nouf Mohammed D. Aljaffan, ―Password Hƣớng nghiên cứu hiện nay: Bảo
Security and Usability: From Password mật trên thiết bị di động
Checkers To a New Framework For User ThS. Trần Sỹ Nam
Authentication‖, 2017. Đơn vị công tác: Viện KH-CN mật
[6]. A. Narayanan and V. Shmatikov, ―Fast mã, Ban Cơ yếu Chính phủ.
dictionary attacks on passwords using time- Email: transynam1989@gmail.com
space tradeoff‖, 2005.
[7]. M. Weir, S. Aggarwal, B. de Medeiros, and B. Quá trình đào tạo: Nhận bằng kỹ sƣ
Glodek, ―Password cracking using probabilistic chuyên ngành An toàn thông tin và
context-free grammars‖, 2009. Hệ thống mạng tại Học viện FSO, Nga và nhận bằng
[8]. W. Melicher, B. Ur, S. M. Segreti, S. thạc sĩ chuyên ngành Kỹ thuật mật mã tại Học viện
Komanduri, L. Bauer, N. Christin, and L. F. Kỹ thuật mật mã 2018
Cranor, ―Fast, lean and accurate: Modeling Hƣớng nghiên cứu hiện nay: Bảo mật mạng, dữ liệu
password guessability using neural networks‖, lƣu trữ
2016.
[9]. C. Castelluccia, A. Chaabane, M. Durmuth, and
D. Perito, ―When privacy meets security:
Leveraging personal information for password
cracking‖, 2013.
[10]. Y. Li, H. Wang, and K. Sun, ―A study of
personal information in human-chosen
passwords and its security implications‖, 2016.
[11]. Daniel Lowe Wheeler (2016), ―zxcvbn: Low-
Budget Password Strength Estimation‖.
[12]. S. Ji, S. Yang, T. Wang, C. Liu, W.H. Lee, and
R. Beyah, ―PARS: A uniform and open-source
password analysis and research system‖, 2015.
[13]. https://blogs.dropbox.com/tech/2012/04/zxcvbn
-realistic-password-strength-estimation/
[14]. https://tools.ietf.org/html/rfc4086
[15]. https://www.informatik.unileipzig.de/~duc/Dict
[16]. https://github.com/danielmiessler/SecLists/blob/
master/Passwords/xato-net-10-million-passwords-
100000.txt
[17]. https://xato.net/10-000-top-passwords 6d63807
16fe0
[18]. https://raw.githubusercontent.com/danielmiessl
er/SecLists/master/Passwords/Leaked-Databases/
phpbb.txt
[19]. https://leakedsource.ru/blog/myspace
[20]. https://raw.githubusercontent.com/danielmiess
ler/SecLists/master/Passwords/Leaked-
Databases/myspace.txt
[21].
/6tr-user-vn-zoom.rar
68 Số 2.CS (08) 2018

File đính kèm:

danh_gia_do_manh_mat_khau_su_dung_ngon_ngu_tieng_viet_dua_tr.pdf