Bài giảng Xác suất thống kê - Chương 7: Lý thuyết kiểm định

 Việc dùng kết quả của mẫu để khẳng định hay bác bỏ một giả thiết H nào đó được gọi là kiểm định giả thiết H. Khi kiểm định ta có thể mắc 1 trong 2 loại sai lầm sau:

Sai lầm loại1: Là sai lầm mắc phải nếu ta bác bỏ H trong khi H đúng. Ta ký hiệu xác suất để mắc sai lầm này là và gọi là mức ý nghĩa.

2. Sai lầm loại 2: Là sai lầm mắc phải nếu ta công nhận H trong khi H sai. Ta ký hiệu xác suất để mắc sai lầm loại nay là B và gọi 1-B là lực kiểm định.

Trong các bài toán kiểm định ta sẽ xét sau này mức ý nghĩa là cho trước.

Ví dụ 2.1:Nếu áp dụng phương pháp I thì tỉ lệ phế phẩm là 6%, còn nếu áp dụng phương pháp II thì trong 100 phế phẩm có 5 phế phẩm. Vậy có thể kết luận áp dụng phương pháp thứ II thì tỉ lệ phế phẩm ít hơn phương pháp thứ I không? Hãy kết luận với mứa ý nghĩa 0,05.

Giải: Ký hiệu là tỉ lệ phế phẩm của phương pháp I ;

Bài giảng Xác suất thống kê - Chương 7: Lý thuyết kiểm định trang 1

Trang 1

Bài giảng Xác suất thống kê - Chương 7: Lý thuyết kiểm định trang 2

Trang 2

Bài giảng Xác suất thống kê - Chương 7: Lý thuyết kiểm định trang 3

Trang 3

Bài giảng Xác suất thống kê - Chương 7: Lý thuyết kiểm định trang 4

Trang 4

Bài giảng Xác suất thống kê - Chương 7: Lý thuyết kiểm định trang 5

Trang 5

Bài giảng Xác suất thống kê - Chương 7: Lý thuyết kiểm định trang 6

Trang 6

Bài giảng Xác suất thống kê - Chương 7: Lý thuyết kiểm định trang 7

Trang 7

Bài giảng Xác suất thống kê - Chương 7: Lý thuyết kiểm định trang 8

Trang 8

Bài giảng Xác suất thống kê - Chương 7: Lý thuyết kiểm định trang 9

Trang 9

Bài giảng Xác suất thống kê - Chương 7: Lý thuyết kiểm định trang 10

Trang 10

Tải về để xem bản đầy đủ

ppt 43 trang duykhanh 7920
Bạn đang xem 10 trang mẫu của tài liệu "Bài giảng Xác suất thống kê - Chương 7: Lý thuyết kiểm định", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài giảng Xác suất thống kê - Chương 7: Lý thuyết kiểm định

Bài giảng Xác suất thống kê - Chương 7: Lý thuyết kiểm định
Chương 7. Lý thuyết kiểm định 
 §1: Khái niệm chung về kiểm định 
 Việc dùng kết quả của mẫu để khẳng định hay bác bỏ một giả thiết H nào đó được gọi là kiểm định giả thiết H. Khi kiểm định ta có thể mắc 1 trong 2 loại sai lầm sau: 
Sai lầm loại1: Là sai lầm mắc phải nếu ta bác bỏ H trong khi H đúng. Ta ký hiệu xác suất để mắc sai lầm này là và gọi là mức ý nghĩa. 
2. Sai lầm loại 2: Là sai lầm mắc phải nếu ta công nhận H trong khi H sai. Ta ký hiệu xác suất để mắc sai lầm loại nay là B và gọi 1-B là lực kiểm định. 
Trong các bài toán kiểm định ta sẽ xét sau này mức ý nghĩa là cho trước. 
Khoa Khoa Học và Máy Tính 
1 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
Giả thiết 
 (thiếu) 
Giả thiết đối lập: (thừa) 
 (đối xứng-ta chỉ xét bài này) 
§2: Kiểm định giả thiết về tỉ lệ 
1. Bài toán 1 mẫu: 
Bài toán : Ký hiệu tỉ lệ của 1 tổng thể là P(chưa biết). Từ tổng thể lấy 1 mẫu kích thước n, có tỉ lệ mẫu f. Với mức ý nghĩa hãy kiểm định giả thiết: 
Khoa Khoa Học và Máy Tính 
2 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
Giải: 
Bước 1: Tra 
Bước 2: Tính giá trị quan sát: 
Bước 3: Kết luận: 
 H đúng 
 H sai 
Khoa Khoa Học và Máy Tính 
3 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
2. Bài toán 2 mẫu 
Bài toán: kí hiệu tỉ lệ của tổng thể 1, 2 là (cả 2 chưa biết).Từ các tổng thể lấy các mẫu kích thước ,có tỉ lệ 
 mẫu . Với mức ý nghĩa , hãy kiểm định 
giả thiết: 
Bước 1: 
Bước 2: 
Khoa Khoa Học và Máy Tính 
4 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
Bước 3: Kết luận: 
 H đúng 
 H sai 
Khoa Khoa Học và Máy Tính 
5 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
Khoa Khoa Học và Máy Tính 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
6 
Ví dụ 2.1:Nếu áp dụng phương pháp I thì tỉ lệ phế phẩm là 6%, còn nếu áp dụng phương pháp II thì trong 100 phế phẩm có 5 phế phẩm. Vậy có thể kết luận áp dụng phương pháp thứ II thì tỉ lệ phế phẩm ít hơn phương pháp thứ I không? Hãy kết luận với mứa ý nghĩa 0,05. 
Giải: Ký hiệu là tỉ lệ phế phẩm của phương pháp I ; 
 P là tỉ lệ phế phẩm của phương pháp II ( chưa biết) 
Bước 1: 
Bước 2: 
Bước 3: .Vậy tỉ lệ phế phẩm của phương pháp II bằng với tỉ lệ của phương pháp I 
Ví dụ 2.2.Thống kê số phế phẩm của 2 nhà máy cùng sản xuất một loại sản phẩm có bảng số liệu : 
Với mức ý nghĩa 0.05 ,hãy xét xem tỷ lệ phế phẩm ở 2 nhà máy trên có như nhau hay không ? 
Nhà máy 
Số sản phẩm 
 Số phế phẩm 
 I 
 1200 
 20 
 II 
 1400 
 60 
Khoa Khoa Học và Máy Tính 
7 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
 -tỷ lệ phế phẩm của nhà máy I 
 -tỷ lệ phế phẩm của nhà máy II 
Bước 1 
Bước 2 
Bước 3 
Vậy tỷ lệ phẩm của nhà máy 1 thấp hơn nhà máy 2 
Khoa Khoa Học và Máy Tính 
8 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
§ 3.Kiểm định giả thiết về giá trị trung bình 
1.Bài toán 1 mẫu : 
Ký hiệu trung bình của 1 tổng thể là a (chưa biết).Từ tổng thể lấy 1 mẫu kích thước n có trung bình mẫu , và phương sai điều chỉnh mẫu . Với mức ý nghĩa 
,hãy kiểm định giả thiết: 
Giải: 
Trường hợp1: Đã biết phương sai tổng thể 
B1: 
B2: 
Khoa Khoa Học và Máy Tính 
9 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
B3. H đúng: 
 H sai : 
TH 2: Chưa biết phương sai tổng thể 
B1: 
B2: 
B3: H đúng: 
 H sai: 
Khoa Khoa Học và Máy Tính 
10 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
. 
TH3: Chưa biết phương sai tổng thể 
B1. 
B2: 
B3:Kết luận H đúng 
 H sai 
Khoa Khoa Học và Máy Tính 
11 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
. Ví dụ 3.1. Trọng lượng (X) của một loại sản phẩm do nhà máy sản xuất ra là đại lượng ngẫu nhiên có phân phối chuẩn với độ lệch chuẩn là ,trọng lượng trung bình là 50kg. Nghi ngờ hoạt động không bình thường làm thay đổi trọng lượng trung bình của sản phẩm người ta cân thử 100 sản phẩm và thu được kết quả sau: 
 Với mức ý nghĩa 0.05,hãy kết luận về nghi ngờ nói trên. 
Trọng lượng sản phẩm(kg) 
48 
49 
50 
51 
52 
Số lượng sản phẩm 
10 
60 
20 
5 
5 
Khoa Khoa Học và Máy Tính 
12 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
. Giải. 
Vì nên đây là trường hợp 1 
Vậy máy đã hoat động không bình thường làm giảm trọng lượng trung bình của sản phẩm. 
Khoa Khoa Học và Máy Tính 
13 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
Ví dụ 3.2. 
. Mức hao phí xăng(X) cho một loại xe ô tô chay trên đoạn đường AB là một đại lượng ngẫu nhiên có phân phối chuẩn có kỳ vọng là 50 lít. Nay do đường được tu sửa lại, người ta cho rằng hao phí trung bình đã giảm xuống. Quan sát 55 chuyến xe chạy trên đường AB ta thu được bảng số liệu sau : 
Với mức ý nghĩa hãy cho kết luận về ý kiến trên. 
Mức hao phí(lít) 
48,5-49,0 
49,0-49,5 
49,5-500 
500-505 
505-510 
Số chuyến xe 
10 
11 
10 
4 
20 
Khoa Khoa Học và Máy Tính 
14 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
mức hao phí xăng khi sửa lại đường mức hao phí xăng khi chưa sửa lại đường 
Vậy mức hao phí xăng trung bình đã giảm . 
Khoa Khoa Học và Máy Tính 
15 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
.Ví dụ 3.3. Định mức để hòan thành 1 sản phẩm là 1,45 phút. Có nên thay đổi định mức không,nếu theo dõi thời gian hoàn thành của 25 công nhân,ta có bảng số liệu sau: 
Hãy kết luận với mức ý nghĩa 0.05 biết rằng thời gian hoàn thành một sản phẩm (X) là một đại lượng ngẫu nhiên có phân phối chuẩn. 
Thời gian sản xuất một sản phẩm(phút) 
10-12 
12-14 
14-16 
1-18 
18-20 
Số công nhân tương ứng 
2 
6 
10 
4 
3 
Khoa Khoa Học và Máy Tính 
16 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
. Giải 
 là định mức cũ ,a là năng suất trung bình mới 
Vậy không nên thay đổi định mức. 
Khoa Khoa Học và Máy Tính 
17 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
2. Bài toán 2 mẫu: 
 Kí hiệu trung bình của tổng thể 1,2 là ( cả hai chưa 
biết. Từ các tổng thể lấy các mẫu kích thước có 
trung bình mẫu và phương sai hiệu chỉnh mẫu Với mức ý nghĩa ,hãy kiểm định giả thiết: 
Trường hợp1. Đã biết phương sai tổng thể 
B1: 
B2: 
Khoa Khoa Học và Máy Tính 
18 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
B3. Kết luận 
. H đúng: 
 H sai 
TH2: Chưa biết 
B1: 
B2: 
Khoa Khoa Học và Máy Tính 
19 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
TH3: Chưa biết 
B1. 
B2. 
 H đúng 
 H sai 
Khoa Khoa Học và Máy Tính 
20 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
Khoa Khoa Học và Máy Tính 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
21 
Quy ước:Nếu 
Ví dụ 3.4: Ngườì ta thí nghiệm 2 phương pháp chă nuôi gà khác nhau, sau 1 tháng kết quả tăng trọng như sau: 
Với mức ý nghĩa 0.05 có thể kết luận phương pháp II hiệu quả hơn phương pháp I không? 
Phương pháp 
Số gà được theo dõi 
Mức tăng trọng trung bình (kg) 
Độ lệch tiêu chuẩn 
I 
100 
1,2 
0,2 
II 
150 
1,3 
0.3 
. 
Giải: 
 - Mức tăng trong trung bình của phương pháp I 
 -Mức tăng trọng trung bình của phương pháp II 
Vậy phương pháp 2 hiệu quả hơn phương pháp 1 
Khoa Khoa Học và Máy Tính 
22 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
.Ví dụ 3.5:Tương tự ví dụ trên nhưng thay bảng số liệu sau 
Vậy hai phương pháp hiệu quả như nhau. 
Khoa Khoa Học và Máy Tính 
23 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
§4. Kiểm định giả thiết về phương sai 
Bài toán : kí hiệu phương sai cuả tổng thể là ,từ tổng thể lấy 1 mẫu kích thước n có phương sai hiệu chỉnh mẫu , với mức ý nghĩa ,hãy kiểm định giả thiết: 
B1: 
B2: 
B3:Kết luận: 
Khoa Khoa Học và Máy Tính 
24 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
Khoa Khoa Học và Máy Tính 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
25 
Ví dụ 4.1. 
Chọn ngẫu nhiên 27 vòng bi cùng loại thì thấy độ lệch trung bình S=0.003. Theo số liệu quy định thì độ lệch chuẩn cho phép không vượt quá 0.0025. Với mức ý nghĩa 0.05, hãy cho kết luận? 
.Giải : 
Vậy lô vòng bi này chưa vượt mức cho phép về độ phân tán 
Khoa Khoa Học và Máy Tính 
26 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
§5. Kiểm định giả thiết về quy luật phân phối. 
Bài toán :Giả sử đại lượng ngẫu nhiên gốc X của tổng thể chưa rõ phân phối. Từ tổng thể lấy một mẫu kích thước n. Với mức ý nghĩa hãy kiểm định giả thiết : 
 H: có X có phân phối F(x) 
1.F(x) là phân phối rời rạc 
Giả sử bảng phân phối tần số mẫu có dạng 
 ... 
Khoa Khoa Học và Máy Tính 
27 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
B1:Ký hiệu r là số tham số chưa biết của phân phối F(x),ta thay các tham số đó bằng các ước lượng hợp lý tối đa . 
B2: Tra 
B3: Tính 
B4: Tính giá trị quan sát 
B5: Kết luận: 
 H đúng: X có phân phối F(X) 
 H sai : X không có phân phối F(X) 
Khoa Khoa Học và Máy Tính 
28 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
1. Kiểm định giả thiết về phân phối đều rời rạc 
 H:X có phân phối đều rời rạc 
B1. r = 0 (do phân phối đều không có tham số chưa biết) 
B2. 
B3. 
B4. 
B5. Theo bài toán chung như trên 
Khoa Khoa Học và Máy Tính 
29 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
Ví dụ 5.1. Tung 1 con xúc xắc ta được bảng điểm sau đây: 
 Số điểm 1 2 3 4 5 6 
 Số lần 3 7 6 5 6 4 
Với mức ý nghĩa 0.05 ,hãy kết luận con xúc sắc trên có đều hay không? 
Giải: 
Vậy con xúc xắc đều 
Khoa Khoa Học và Máy Tính 
30 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
2. Kiểm định giả thiết về phân phối Poison . 
. 
 X 0 1 2 k-1 
B1.r =1 (có 1 tham số chưa biết là a), 
B2. 
B3. 
B4. 
B5. Như b5 ở bài trên 
Khoa Khoa Học và Máy Tính 
31 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
Khoa Khoa Học và Máy Tính 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
32 
Ví dụ 5.2: 
Để kiểm tra công việc của 200 công nhân,người ta chọn ngẫu nhiên 1000 sản phẩm của mỗi người đem đi thử nghiệm để tìm ra phế phẩm. Kết quả như sau: 
 Với mức ý nghĩa 0.01, có thể coi mẫu trên phù hợp với phân phối Poisson 
Số phế phẩm trên1000 sản phẩm 
0 
1 
2 
3 
4 
Số công nhân 
109 
65 
22 
3 
1 
Khoa Khoa Học và Máy Tính 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
33 
Giải: 
i 
0 
1 
2 
3 
4 
109 
65 
22 
3 
1 
108,67 
66,29 
20,21 
4,111 
0,627 
Khoa Khoa Học và Máy Tính 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
34 
. 
Vậy mẫu trên phù hợp với phân phối Poison. 
Khoa Khoa Học và Máy Tính 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
35 
II. Trường hợp F(x) liên tục: 
Giả sử bảng phân phối tần số mẫu có dạng: 
B1. r là số tham số chưa biết.Thay các tham số đó bằng 
các ước lượng hợp lý tối đa của chúng. 
B2.Tra 
B3. Tính 
 Chú ý: 
Khoa Khoa Học và Máy Tính 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
36 
B4. 
B5. Giống trường hợp F(x) rời rạc. 
 Kiểm định về phân phối chuẩn. 
 B1: 
Khoa Khoa Học và Máy Tính 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
37 
B2. 
B3. 
Khoa Khoa Học và Máy Tính 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
38 
B4. 
B5. kết luận như b5 bài toán chung 
Ví dụ 5.3 : Bảng điểm của 1 lớp học như sau 
Với hãy kết luận bảng này có phù hợp với phân phối chuẩn hay không? 
Số điểm 
0-3 
3-5 
5-7 
7-8 
8-10 
Số học sinh 
6 
24 
43 
16 
11 
Khoa Khoa Học và Máy Tính 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
39 
Bài giải: 
. 
Khoa Khoa Học và Máy Tính 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
40 
§6.Bảng phân phối tần số đồng thời hay bảng tương quan mẫu 
Giả sử X,Y là 2 đại lượng ngẫu nhiên gốc của cùng 1 tổng thể. Bảng phân phối tần số mẫu đồng thời của X,Y là: 
X 
 n 
Khoa Khoa Học và Máy Tính 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
41 
Khoa Khoa Học và Máy Tính 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
42 
§7. Kiểm định độc lập. 
Giả sử X,Y là 2 đại lượng ngẫu nhiên của cùng 1 tổng 
thể,từ tổng thể lấy 1 mẫu kích thước n. Với mức ý nghĩa hãy kiểm định giả thiết : H:X,Y độc lập 
B1. 
B2. 
B3. độc lập 
 phụ thuộc 
Khoa Khoa Học và Máy Tính 
Xác Suất Thống Kê. Chương 7 
@Copyright 2010 
43 
Ví dụ.7.1:Nghiên cứu ảnh hưởng của hoàn cảnh gia đình đối với tình trạng phạm tội của trẻ em có kết quả: 
Vậy hoàn cảnh gia đình không ảnh hưởng tới tính trạng phạm tội 
Tình trạng phạm tội 
Bố mẹ đã mất 
Bố mẹ ly hôn 
Còn cả bố mẹ 
Không phạm tội 
20 
25 
13 
58 
Có phạm tội 
29 
43 
18 
90 
49 
68 
31 
148 

File đính kèm:

  • pptbai_giang_xac_suat_thong_ke_chuong_7_ly_thuyet_kiem_dinh.ppt