Bài giảng Xác suất thống kê - Chương 4: Thống kê. Ước lượng tham số - Nguyễn Thị Thu Thủy

4.1 Lý thuyết mẫu

Thống kê toán là bộ môn toán học nghiên cứu quy luật của các hiện tượng ngẫu nhiên có

tính chất số lớn trên cơ sở thu thập và xử lý số liệu thống kê các kết quả quan sát về những

hiện tượng ngẫu nhiên này. Nếu ta thu thập được các số liệu liên quan đến tất cả đối tượng

cần nghiên cứu thì ta có thể biết được đối tượng này (phương pháp toàn bộ). Tuy nhiên trong

thực tế điều đó không thể thực hiện được vì quy mô của các đối tượng cần nghiên cứu quá

lớn hoặc trong quá trình nghiên cứu đối tượng nghiên cứu bị phá hủy. Vì vậy cần lấy mẫu để

nghiên cứu.

Mục này giới thiệu về phương pháp lấy mẫu ngẫu nhiên và các thống kê thường gặp của

mẫu ngẫu nhiên.

4.1.1 Tổng thể và mẫu

Khái niệm tổng thể

Khi nghiên cứu các vấn đề về kinh tế - xã hội, cũng như nhiều vấn đề thuộc các lĩnh vực vật

lý, sinh vật, quân sự . . . thường dẫn đến khảo sát một hay nhiều dấu hiệu (định tính hoặc định

lượng) thể hiện bằng số lượng trên nhiều phần tử. Tập hợp tất cả các phần tử này gọi là tổng

thể hay đám đông (population). Số phần tử trong tổng thể có thể là hữu hạn hoặc vô hạn. Cần

nhấn mạnh rằng ta không nghiên cứu trực tiếp bản thân tổng thể mà chỉ nghiên cứu dấu hiệu

nào đó của nó.

Ký hiệu N là số phần tử của tổng thể; X là dấu hiệu cần khảo sát.

Ví dụ 4.1. (a) Muốn điều tra thu nhập bình quân của các hộ gia đình ở Hà Nội thì tập hợp

cần nghiên cứu là các hộ gia đình ở Hà Nội, dấu hiệu nghiên cứu là thu nhập của từng

hộ gia đình (dấu hiệu định lượng).

Bài giảng Xác suất thống kê - Chương 4: Thống kê. Ước lượng tham số - Nguyễn Thị Thu Thủy trang 1

Trang 1

Bài giảng Xác suất thống kê - Chương 4: Thống kê. Ước lượng tham số - Nguyễn Thị Thu Thủy trang 2

Trang 2

Bài giảng Xác suất thống kê - Chương 4: Thống kê. Ước lượng tham số - Nguyễn Thị Thu Thủy trang 3

Trang 3

Bài giảng Xác suất thống kê - Chương 4: Thống kê. Ước lượng tham số - Nguyễn Thị Thu Thủy trang 4

Trang 4

Bài giảng Xác suất thống kê - Chương 4: Thống kê. Ước lượng tham số - Nguyễn Thị Thu Thủy trang 5

Trang 5

Bài giảng Xác suất thống kê - Chương 4: Thống kê. Ước lượng tham số - Nguyễn Thị Thu Thủy trang 6

Trang 6

Bài giảng Xác suất thống kê - Chương 4: Thống kê. Ước lượng tham số - Nguyễn Thị Thu Thủy trang 7

Trang 7

Bài giảng Xác suất thống kê - Chương 4: Thống kê. Ước lượng tham số - Nguyễn Thị Thu Thủy trang 8

Trang 8

Bài giảng Xác suất thống kê - Chương 4: Thống kê. Ước lượng tham số - Nguyễn Thị Thu Thủy trang 9

Trang 9

Bài giảng Xác suất thống kê - Chương 4: Thống kê. Ước lượng tham số - Nguyễn Thị Thu Thủy trang 10

Trang 10

Tải về để xem bản đầy đủ

pdf 25 trang xuanhieu 980
Bạn đang xem 10 trang mẫu của tài liệu "Bài giảng Xác suất thống kê - Chương 4: Thống kê. Ước lượng tham số - Nguyễn Thị Thu Thủy", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài giảng Xác suất thống kê - Chương 4: Thống kê. Ước lượng tham số - Nguyễn Thị Thu Thủy

Bài giảng Xác suất thống kê - Chương 4: Thống kê. Ước lượng tham số - Nguyễn Thị Thu Thủy
hương sai
 n − 1 i=1 i
 hiệu chỉnh mẫu ngẫu nhiên S2 là ước lượng không chệch, hiệu quả và vững của phương
 sai V(X) = σ2 của biến ngẫu nhiên gốc của tổng thể.
 m
 - Chọn G = = f nếu ước lượng cho xác suất p. Tần suất mẫu ngẫu nhiên f là ước
 n
 lượng không chệch, hiệu quả và vững của xác suất p của tổng thể.
Ví dụ 4.5. Trong đợt vận động bầu cử tổng thống người ta phỏng vấn ngẫu nhiên 1600 cử tri
thì được biết 960 người sẽ bỏ phiếu cho ứng cử viên A. Hãy chỉ ra ước lượng điểm cho tỷ lệ
phiếu thực mà ứng cử viên A sẽ thu được.
 960
Lời giải Ví dụ 4.5 Ước lượng điểm cần tìm là f = = 0, 6 = 60%.
 1600
4.2.4 Một số phương pháp tìm ước lượng điểm
(a) Phương pháp hợp lý cực đại (maximum-likelihood estimation)
(b) Phương pháp mô men (moment estimation)
(c) Phương pháp Bayes, phương pháp minimax, phương pháp bootstrap . . .
(Sinh viên tự đọc).
4.2. Ước điểm cho kỳ vọng, phương sai và tỷ lệ 111
MI2020-KỲ 20192–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST
TUẦN 12
4.3 Phương pháp ước lượng bằng khoảng tin cậy
Phương pháp ước lượng điểm nói trên có nhược điểm là khi kích thước mẫu bé thì ước lượng
điểm có thể sai lệch rất nhiều so với giá trị của tham số cần ước lượng. Mặt khác phương pháp
trên cũng không thể đánh giá được khả năng mắc sai lầm khi ước lượng là bao nhiêu. Do đó
khi kích thước mẫu bé người ta thường dùng phương pháp ước lượng khoảng tin cậy cho
trường hợp một tham số.
Khái niệm ước lượng khoảng
Giả sử chưa biết đặc trưng θ nào đó của biến ngẫu nhiên X. Ước lượng khoảng của θ là chỉ ra
một khoảng số (g1, g2) nào đó chứa θ, tức là có thể ước lượng g1 < θ < g2.
Phương pháp khoảng ước lượng tin cậy
Để ước lượng tham số θ của biến ngẫu nhiên X, từ biến ngẫu nhiên này ta lập mẫu ngẫu nhiên
WX = (X1, X2,..., Xn) cỡ n. Chọn thống kê G(X, θ) sao cho mặc dù chưa biết giá trị của θ,
quy luật phân phối xác suất của G vẫn hoàn toàn xác định. Do đó, với xác suất α khá bé ta
tìm được P(G1 < θ < G2) = 1 − α. Vì α khá bé, nên γ = 1 − α khá lớn (thông thường yêu
cầu 1 − α = γ ≥ 0, 95 để có thể áp dụng nguyên lý xác suất lớn cho sự kiện (G1 < θ < G2)).
Khi đó, sự kiện (G1 < θ < G2) hầu như chắc chắn xảy ra trong một phép thử. Thực hiện một
phép thử đối với mẫu ngẫu nhiên WX ta thu được mẫu cụ thể Wx = (x1, x2,..., xn), từ đó tính
được các giá trị của G1, G2, ký hiệu là g1, g2. Như vậy có thể kết luận: với độ tin cậy 1 − α = γ
tham số θ nằm trong khoảng (g1, g2).
(a) (G1, G2) được gọi là khoảng tin cậy của θ với độ tin cậy γ = 1 − α.
(b) 1 − α = γ được gọi là độ tin cậy của ước lượng.
(c) I = G2 − G1 được gọi là độ dài khoảng tin cậy.
4.3.1 Khoảng tin cậy của kỳ vọng của biến ngẫu nhiên phân phối chuẩn
Bài toán 4.1. Giả sử biến ngẫu nhiên X tuân theo luật phân phối chuẩn N (µ, σ2) với kỳ vọng
E(X) = µ chưa biết. Hãy ước lượng E(X).
Các bước tiến hành: Từ tổng thể, ta lập mẫu ngẫu nhiên WX = (X1, X2,..., Xn) cỡ n và xét
các trường hợp sau.
4.3. Phương pháp ước lượng bằng khoảng tin cậy 112
MI2020-KỲ 20192–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST
Trường hợp đã biết phương sai V(X) = σ2
Bước 1 Chọn thống kê
 X − µ√
 U = n (4.25)
 σ
 Theo Mục 4.1.6, thống kê U có phân phối chuẩn tắc N (0; 1).
Bước 2 Chọn cặp số không âm α1, α2 thỏa mãn α1 + α2 = α, tìm các phân vị chuẩn tắc
 uα1 , u1−α2 sao cho P(U < uα1 ) = α1; P(U < u1−α2 ) = 1 − α2. Do tính chất của phân
 phối chuẩn tắc uα1 = −u1−α1 , suy ra
 P(−u1−α1 < U < u1−α2 ) = P(uα1 < U < u1−α2 )
 = P(U < u1−α2 ) − P(U < uα1 ) = 1 − α2 − α1 = 1 − α.
 Như vậy,
  X − µ√ 
 1 − α = P(−u − < U < u − ) = P − u − < n < u −
 1 α1 1 α2 1 α1 σ 1 α2
  σ σ 
 = P X − u − √ < µ < X + u − √ .
 1 α2 n 1 α1 n
Bước 3 Lập mẫu cụ thể WX = (x1, x2,..., xn), tính được giá trị cụ thể x của X, khi đó khoảng
 tin cậy cho µ với độ tin cậy γ = 1 − α là:
  σ σ 
 x − u − √ ; x + u − √ (4.26)
 1 α2 n 1 α1 n
 Như vậy, với độ tin cậy γ = 1 − α cho trước, có vô số khoảng tin cậy cho µ vì có vô số cặp
α1, α2 thỏa mãn α1 + α2 = α. Ở đây ta chỉ xét một số trường hợp đặc biệt.
(a) Khoảng tin cậy đối xứng (α1 = α2 = α/2)
  σ σ 
 x − u1− α √ ; x + u1− α √ (4.27)
 2 n 2 n
 trong đó u α được xác định từ bảng giá trị hàm phân phối chuẩn tắc (Phụ lục 3) từ hệ
 1− 2
 thức
 α
 Φ(u1− α ) = 1 − (4.28)
 2 2
 σ
Sai số của ước lượng: ε = u1− α √ được gọi là sai số (độ chính xác) của ước lượng. Với
 2 n
 2
 phương sai σ đã biết không đổi và độ tin cậy γ không đổi thì giá trị u α không đổi, do
 1− 2
 đó sai số của ước lượng chỉ phụ thuộc vào kích thước mẫu n. Khi n càng lớn thì ε càng
 bé, do đó khoảng ước lượng càng chính xác.
4.3. Phương pháp ước lượng bằng khoảng tin cậy 113
MI2020-KỲ 20192–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST
Tìm kích thước mẫu: Nếu muốn ước lượng kỳ vọng với độ chính xác ε0 và độ tin cậy γ cho
 trước, kích thước mẫu cần thiết là số tự nhiên n nhỏ nhất thỏa mãn:
 2 2
 σ u1− α
 ≥ 2
 n 2 (4.29)
 ε0
(b) Khoảng tin cậy trái (α1 = α, α2 = 0):
  σ 
 − ∞ ; x + u − √ (4.30)
 1 α n
 trong đó u1−α được xác định từ bảng giá trị hàm phân phối chuẩn tắc (Phụ lục 3) từ hệ
 thức
 Φ(u1−α) = 1 − α . (4.31)
(c) Khoảng tin cậy phải (α1 = 0, α2 = α):
  σ 
 x − u − √ ; +∞ (4.32)
 1 α n
Ví dụ 4.6. Trọng lượng của một loại sản phẩm là biến ngẫu nhiên tuân theo luật phân phối
chuẩn với độ lệch tiêu chuẩn là 1 gam. Cân thử 25 sản phẩm loại này ta thu được kết quả sau:
 Trọng lượng (gam) 18 19 20 21
 Số sản phẩm 3 5 15 2
 (a) Với độ tin cậy 1 − α = 95%, hãy tìm khoảng tin cậy đối xứng của trọng lượng trung bình
 của loại sản phẩm nói trên.
 (b) Không cần tính toán, nếu độ tin cậy 99% thì khoảng ước lượng trung bình sẽ rộng hơn,
 hẹp hơn hay bằng như trong ý (a)?
 (c) Nếu muốn độ chính xác của ước lượng tăng lên gấp đôi, độ tin cậy không đổi thì cần
 nghiên cứu mẫu có kích thước là bao nhiêu?
Lời giải Ví dụ 4.6
 (a) Gọi X là trọng lượng sản phẩm, X ∼ N (µ, σ2) với σ = 1. Trọng lượng trung bình của sản
 phẩm là E(X) = µ chưa biết cần ước lượng.
 X − µ√
 Bước 1: Chọn thống kê U = n. Thống kê U ∼ N (0; 1).
 σ
4.3. Phương pháp ước lượng bằng khoảng tin cậy 114
MI2020-KỲ 20192–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST
 !
 σ σ
 Bước 2: Áp dụng khoảng tin cậy đối xứng x − u1− α √ ; x + u1− α √ .
 2 n 2 n
 0,05
 Với α = 0, 05, Φ(u α ) = 1 − = 0, 975, tra bảng giá trị hàm phân phối chuẩn tắc
 1− 2 2
 (Phụ lục 3) nhận được u α = 1, 96.
 1− 2
 Bước 3: Từ số liệu đã cho ta có n = 25, σ = 1 và tính được x = 19, 64, suy ra khoảng
  1 1 
 tin cậy đối xứng của E(X) = µ là 19, 64 − 1, 96 × √ 19, 64 + 1, 96 × √ hay
 25 25
 (19, 248 ; 20, 032).
 Bước 4: Kết luận, với độ tin cậy 95%, trọng lượng trung bình của loại sản phẩm nói trên từ
 19,248 gam đến 20,032 gam.
 (b) Nếu độ tin cậy 1 − α tăng từ 95% lên 99% thì khoảng ước lượng sẽ rộng hơn khoảng ước
 lượng xét trong ý (a), do giá trị của u1−α/2 tăng từ 1, 96 lên 2, 58.
 σ
 (c) Theo ý (a), độ chính xác của ước lượng là ε = u1− α √ = 0, 392. Để độ chính xác tăng lên
 2 n
 0,392
 gấp đôi, tức là ε0 = 2 = 0, 196. Theo (4.29) ta cần mẫu có kích thước nhỏ nhất là
  2 2   2 2 
 σ u1− α 1 × (1, 96)
 n = 2 = ' 100.
 2 ( )2
 ε0 0, 196
Chú ý 4.2. (a) Chú ý rằng không thể viết P(19, 248 < X < 20, 032) = 0, 95 vì độ tin cậy
 gắn với khoảng tin cậy ngẫu nhiên chứ không gắn với mẫu cụ thể. Hơn nữa vì µ là
 một hằng số nên nó chỉ có thể thuộc hoặc không thuộc khoảng (19,248; 20,032) nên
 (19, 248 < µ < 20, 032) không phải là sự kiện ngẫu nhiên.
(b) Ta có thể xác định u α = 1, 96 ở ý Ví dụ 4.6(a) từ bảng giá trị hàm Láp-la-xơ (Phụ lục 2)
 1− 2
 1 − α
 từ hệ thức φ(u − ) = .
 1 α 2
(c) Từ (4.29) ta nhận thấy khi kích thước mẫu tăng và độ tin cậy giữ nguyên thì ε giảm hay
 ước lượng chính xác hơn; nếu tăng độ tin cậy và giữ nguyên kích thước mẫu, do giá trị
 phân vị chuẩn tăng nên sai số của ước lượng ε tăng.
Trường hợp chưa biết phương sai, cỡ mẫu n < 30
Do σ chưa biết nên ta thay thế bằng S và chọn thống kê
 X − µ√
 T = n (4.33)
 S
Như đã biết (Mục 4.1.6) thống kê T có phân phối Student với n − 1 bậc tự do. Ta có các kết
luận sau đây.
4.3. Phương pháp ước lượng bằng khoảng tin cậy 115
MI2020-KỲ 20192–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST
(a) Khoảng tin cậy đối xứng
  s s 
 − (n−1) √ + (n−1) √
 x t1− α ; x t1− α (4.34)
 2 n 2 n
 s
 = (n−1) √
 Sai số của ước lượng là ε t1− α . Kích thước mẫu được suy từ sai số hay độ chính
 2 n
 xác của ước lượng, là số tự nhiên n nhỏ nhất thỏa mãn:
  2
 (n−1) 2
 t α × s
 1− 2
 n ≥ (4.35)
 ε2
(b) Khoảng tin cậy trái
  
 (n− ) s
 − ∞ ; x + t 1 √ (4.36)
 1−α n
(c) Khoảng tin cậy phải
  
 (n− ) s
 x − t 1 √ ; +∞ (4.37)
 1−α n
 (n−1) (n−1)
 trong đó t α , t − được xác định từ bảng phân phối Student với n − 1 bậc tự do (Phụ
 1− 2 1 α
 lục 4).
Ví dụ 4.7. Theo dõi mức xăng hao phí (X) cho một loại ô tô đi từ A đến B thu được bảng số
liệu sau:
 Mức xăng hao phí (lít) 19-19,5 19,5-20,0 20,0-20,5 20,5-21,0
 Số lần đi 2 10 8 5
Với độ tin cậy 1 − α = 95% hãy tính mức xăng hao phí trung bình tối thiểu khi đi từ A đến B
biết X tuân theo luật phân phối chuẩn.
Lời giải Ví dụ 4.7 Gọi X là lượng xăng hao phí của loại ô tô trên đoạn đường AB, X ∼ N (µ, σ2)
với phương sai σ2 chưa biết. Mức xăng hao phí trung bình là E(X) = µ chưa biết, cần ước
lượng.
 X − µ√
 Bước 1: Vì phương sai chưa biết và n = 25 < 30, chọn thống kê T = n. Thống kê T
 S
 có phân phối Student với n − 1 bậc tự do.
 Bước 2: Sử dụng khoảng tin cậy phải cho E(X) = µ:
  
 (n− ) s
 x − t 1 √ ; +∞
 1−α n
 (n−1) (24)
 trong đó t1−α = t0,95 = 1, 711 được xác định từ bảng phân phối Student (Phụ lục 4).
4.3. Phương pháp ước lượng bằng khoảng tin cậy 116
MI2020-KỲ 20192–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST
 Bước 3: Từ số liệu của đầu bài, tính được n = 25, x = 20, 07, s = 0, 45. Suy ra khoảng tin cậy
  0, 45 
 phải của µ là 20, 07 − 1, 711 × √ < µ < +∞ hay (19, 92 < µ < +∞).
 25
 Bước 4: Kết luận mức xăng hao phí trung bình tối thiểu khi đi từ A đến B là 19,92 lít với độ
 tin cậy 95%.
Trường hợp chưa biết phương sai, cỡ mẫu n ≥ 30
Khi n ≥ 30 thống kê T trong (4.33) sẽ có phân phối tiệm cận chuẩn tắc N (0, 1). Hay thống kê
 X − µ√
 U = n ∼ N (0, 1) (4.38)
 S
Do đó,
(a) Khoảng tin cậy đối xứng
  s s 
 x − u1− α √ ; x + u1− α √ (4.39)
 2 n 2 n
 s
 Sai số của ước lượng là ε = u1− α √ . Kích thước mẫu được suy từ sai số hay độ chính
 2 n
 xác của ước lượng, là số tự nhiên n nhỏ nhất thỏa mãn:
  2
 2
 u α × s
 1− 2
 n ≥ (4.40)
 ε2
(b) Khoảng tin cậy trái
  s 
 − ∞ ; x + u − √ (4.41)
 1 α n
(c) Khoảng tin cậy phải
  s 
 x − u − √ ; +∞ (4.42)
 1 α n
Ví dụ 4.8. Để ước lượng trọng lượng trung bình của loại trái cây A tại một vùng, người ta thu
hoạch ngẫu nhiên 100 trái cây A của vùng đó và thu được kết quả sau
 Trọng lượng (gam) 40-42 42-44 44-46 46-48 48-50 50-52
 Số trái 7 13 25 35 15 5
Hãy ước lượng trọng lượng trung bình của loại trái cây A trong vùng bằng khoảng tin cậy đối
xứng với độ tin cậy 95%. Cho biết trọng lượng loại trái cây A là biến ngẫu nhiên tuân theo
luật phân phối chuẩn.
4.3. Phương pháp ước lượng bằng khoảng tin cậy 117
MI2020-KỲ 20192–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST
Lời giải Ví dụ 4.8 Gọi X là trọng lượng loại trái cây A, X ∼ N (µ, σ2) với phương sai σ2 chưa
biết. Trọng lượng trung bình của loại trái cây A là E(X) = µ chưa biết, cần ước lượng.
 X − µ√
 Bước 1: Chọn thống kê U = n. Vì n = 100 > 30 nên thống kê U ∼ N (0, 1).
 S
 !
 s s
 Bước 2: Khoảng tin cậy đối xứng cho E(X) = µ là x − u1− α √ ; x + u1− α √ trong đó,
 2 n 2 n
 với α = 0, 05, u α = u = 1, 96 được tra từ bảng giá trị hàm phân phối chuẩn tắc
 1− 2 0,975
 (Phụ lục 3).
 Bước 3: Từ số liệu đã cho tính được n = 100, x = 46, 06, s = 2, 48. Suy ra khoảng tin cậy đối
  2, 48 2, 48 
 xứng của µ là 46, 06 − 1, 96 × √ ; 46, 06 + 1, 96 × √ hay (45, 573 ; 46, 546).
 100 100
 Bước 4: Kết luận, với độ tin cậy 95%, trọng lượng trung bình của loại trái cây A ở vùng trên
 từ 45,573 gam đến 46,546 gam.
4.3.2 Ước lượng khoảng cho tỷ lệ
Bài toán 4.2. Xác suất xảy ra sự kiện A là p. Do không biết p nên người ta thực hiện n phép
thử độc lập, cùng điều kiện, trong đó có m phép thử xảy ra A. Khi đó tần suất xuất hiện A là
 f = m/n là ước lượng điểm không chệch cho p. Với độ tin cậy γ = 1 − α hãy ước lượng khoảng
cho p.
Phương pháp tiến hành
 f − p √
Bước 1 Chọn thống kê Z = p n. Theo Mục 4.1.6, Z có phân phối chuẩn tắc N (0; 1).
 p(1 − p)
 Trong trường hợp n khá lớn ta có thể dùng f để thay thế cho p. Khi đó,
 f − p √
 Z = p n ∼ N (0; 1) (4.43)
 f (1 − f )
Bước 2: Khi có mẫu cụ thể Wx = (x1, x2,..., xn), ta tính được giá trị cụ thể của f và suy ra
 khoảng ước lượng cho p với độ tin cậy γ = 1 − α là:
  f (1 − f ) f (1 − f )
 f − u − ; f + u − (4.44)
 1 α2 n 1 α1 n
 với α = α1 + α2.
Các trường hợp ước lượng hay dùng:
4.3. Phương pháp ước lượng bằng khoảng tin cậy 118
MI2020-KỲ 20192–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST
(a) Khoảng tin cậy đối xứng
  f (1 − f ) f (1 − f )
 f − u1− α ; f + u1− α (4.45)
 2 n 2 n
 f (1 − f )
 Độ chính xác của ước lượng ε = u1− α . Với độ tin cậy γ = 1 − α và độ chính
 2 n
 xác ε0 cho trước thì kích thước mẫu cần thiết là số tự nhiên n nhỏ nhất thỏa mãn:
  2
 u α × f × (1 − f )
 1− 2
 ≥
 n 2 (4.46)
 ε0
(b) Khoảng tin cậy trái
  f (1 − f )
 − ∞ ; f + u − (4.47)
 1 α n
(c) Khoảng tin cậy phải
  f (1 − f ) 
 f − u − ; +∞ (4.48)
 1 α n
Chú ý 4.3. (a) Do tỷ lệ chỉ nhận giá trị từ 0 đến 1 nên ta có thể thay giá trị −∞ bằng 0 và +∞
 bằng 1 trong khoảng tin cậy trái (phải).
(b) Các khoảng tin cậy trên được xây dựng khi kích thước mẫu n đủ lớn thỏa mãn n f ≥ 5 và
 n(1 − f ) ≥ 5.
Ví dụ 4.9. Điều tra nhu cầu tiêu dùng loại hàng A trong 100 hộ gia đình ở khu dân cư B thấy
60 hộ gia đình có nhu cầu loại hàng trên. Với độ tin cậy 1 − α = 95% hãy tìm khoảng tin cậy
đối xứng của tỷ lệ hộ gia đình có nhu cầu loại hàng đó.
Lời giải Ví dụ 4.9 Gọi p là tỷ lệ hộ gia đình ở khu dân cư B có nhu cầu mặt hàng A. Kiểm tra
điều kiện n f = 100 × 0, 6 = 60 > 5 và n(1 − f ) = 100 × 0, 4 = 40 > 5.
 f − p √
 Bước 1: Chọn thống kê Z = p n. Thống kê Z ∼ N (0, 1).
 f (1 − f )
 Bước 2: Khoảng tin cậy đối xứng của xác suất p là
  f (1 − f ) f (1 − f )
 f − u1− α ; f + u1− α
 2 n 2 n
 trong đó u α = u = 1, 96 được tra từ bảng giá trị hàm phân phối chuẩn tắc (Phụ
 1− 2 0,975
 lục 3).
4.3. Phương pháp ước lượng bằng khoảng tin cậy 119
MI2020-KỲ 20192–TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy–SAMI-HUST
 m
 Bước 3: Với n = 100, m = 60, f = = 0, 6, suy ra khoảng tin cậy đối xứng của p là
 n
  0, 6 × 0, 4 0, 6 × 0, 4
 0, 6 − 1, 96 ; 0, 6 − 1, 96 = (0, 504 ; 0, 696).
 100 100
 Bước 4: Kết luận, tỷ lệ hộ gia đình ở khu dân cư B có nhu cầu loại hàng A là từ 50,4% đến
 69,6% với độ tin cậy 95%.
4.3. Phương pháp ước lượng bằng khoảng tin cậy 120

File đính kèm:

  • pdfbai_giang_xac_suat_thong_ke_chuong_4_thong_ke_uoc_luong_tham.pdf