Bài giảng Nguyên lý thống kê
1.1. Tổng quan quá trình hình thành và phát triển của thống kê học
Thống kê học ra đời, phát triển từ nhu cầu thực tiễn của xã hội và là một
trong những môn khoa học xã hội lịch sử lâu dài nhất. Đó là một quá trình phát
triển không ngừng từ đơn giản đến phức tạp, được đúc rút dần thành lý luận và
ngày nay đã trở thành một môn khoa học độc lập.
Trong lịch sử, những ý tưởng và phương pháp thống kê phát triển cũng với
sự phát triển nhu cầu xã hội về thu thập và sử dụng thông tin cho các mục đích
khác nhau. Ngay từ thời cổ đại, con người đã biết chú ý tới việc đăng ký, ghi
chép và tính toán số người trong bộ tộc, số súc vật, số người có thể huy động
phục vụ các cuộc chiến tranh giữa các bộ tộc, số người được tham gia ăn chia
phân phối của cải thu được. Mặc dù việc ghi chép còn rất giản đơn với phạm vi
hẹp, nhưng đó chính là những cơ sở thực tiễn ban đầu của thống kê học. Trong
xã hội phong kiến, hầu hết các quốc gia ở châu Á, châu Âu đều tổ chức việc
đăng ký, kê khai về số dân, về ruộng đất, tài sản với phạm vi rộng hơn, có tính
chất thống kê rõ hơn. Tuy nhiên, các đăng ký này còn mang tính tự phát, thiếu
khoa học. Thống kê đã có một bước phát triển quan trọng, nhưng vẫn chưa thực
sụ hình thành một môn khoa học độc lập.
Sự ra đời phát triển mạnh mẽ của phương thức sản xuất tư bản chủ nghĩa
đòi hỏi các nhà khoa học phải nghiên cứu lý luận cũng như phương pháp thu
thập, tính toán và phân tích về mặt lượng các hiện tượng kinh tế - xã hội. Năm
1660, nhà kinh tế học người Đức H. Conhring (1606 - 1681) đã giảng về phương
pháp nghiên cứu hiện tượng xã hội dựa vào các số liệu điều tra cụ thể. Năm
1682, William Petty (1623 - 1687) nhà kinh tế học người Anh đã xuất bản cuốn:
“Số học chính trị”. Đây là tác phẩm có tính phân tích thống kê đầu tiên, trong đó
tác giả nghiên cứu các hiện tượng xã hội bằng cách tổng hợp và so sánh các con
số. Kar Mark đã gọi William Petty là người sáng lập ra môn thống kê học. Năm
1750, giáo sư người Đức G.Achenwall (1710 - 1772) lần đầu dùng danh từ
“Statistick” để chỉ phương pháp nghiên cứu nói trên và quan niệm đó là môn
học so sánh các nước khác nhau về mọi mặt qua các số liệu thu thập được.4
Những thành tựu của khoa học tự nhiên trong thế kỉ XVIII, đặc biệt sự ra đời
của lý thuyết xác suất và thống kê toán đã có ảnh hưởng lớn đến sự phát triển của
thống kê học. Kể từ đó, thống kê có sự phát triển rất mạnh mẽ và ngày càng hoàn
thiện, gắn liền với tên tuổi của nhiều nhà toán học - thống kê học nổi tiếng, như:
M. V. Lomonoxop (Nga, 1711 - 1765); A. Quetelet (Bỉ, 1796 - 1874); Laplace
(Pháp, 1749 - 1827); I-Fisher W. M. Pearsons, W. Far (Anh, 1807 - 1883).
Kể từ khi ra đời, thống kê ngày càng đóng vai trò quan trọng trong đời sống
xã hội. Thông qua việc phát hiện, phản ánh những quy luật về lượng của hiện
tượng, các con số thống kê giúp cho việc kiểm tra, giám sát, đánh giá các
chương trình, kế hoạch và định hướng phát triển kinh tế - xã hội trong tương lai.
Ngày nay, thống kê được coi là một trong những công cụ quản lý vĩ mô quan
trọng, có vai trò cung cấp các thông tin thống kê trung thực, khách quan, chính
xác, đầy đủ, kịp thời phục vụ các cơ quan nhà nước trong việc đánh giá, dự báo
tình hình, hoạch định chiến lược, chính sách, xây dựng kế hoạch phát triển kinh
tế - xã hội ngắn hạn và dài hạn. Đồng thời, các con số thống kê cũng là những cơ
sở quan trọng nhất để đánh giá tình hình thực hiện các kế hoạch, chiến lược và
các chính sách đó. Trên giác độ quản lý vi mô, thống kê không những có vai trò
đáp ứng nhu cầu thông tin thống kê của các tổ chức, cá nhân trong xã hội, mà
còn phải xây dựng, cung cấp các phương pháp phân tích đánh giá về mặt lượng
các hoạt động kinh tế - xã hội của các tổ chức, đơn vị.
Trang 1
Trang 2
Trang 3
Trang 4
Trang 5
Trang 6
Trang 7
Trang 8
Trang 9
Trang 10
Tải về để xem bản đầy đủ
Tóm tắt nội dung tài liệu: Bài giảng Nguyên lý thống kê
biết phương sai của tổng thể chung và tỷ lệ của tổng thể chung. - Nếu đã tiến hành điều tra chọn mẫu với hiện tượng này thì chọn phương sai của lần điều tra có phương sai lớn nhất và chọn tỷ lệ của lần điều tra nào có tỷ lệ gần bằng 0,5. - Nếu là lần đầu tiên thì có thể thực hiện điều tra thử trong phạm vi nhỏ hơn hoặc sử dụng kết quả của nơi khác có đặc điểm và điều kiện tương tự. - Khi suy rộng về bình quân nếu lượng biến tiêu thức nghiên cứu phân phối theo quy luật chuẩn thì có thể ước lượng. 99 Ví dụ 5.1: Một địa phương có 1.000 hộ, người ta chọn ngẫu nhiên 200 hộ theo cách chọn không lặp để điều tra về thu nhập bình quân hàng tháng một nhân khẩu của hộ và thu được kết quả sau: Thu nhập BQ Số hộ n x x n x 2 n (1.000 đ) i i i i i i Dưới 150 14 125 1.750 218.750 150 - 200 26 175 4.550 796.250 200 - 250 34 225 7.650 1.721.250 250 - 300 40 275 11.000 3.025.000 300 – 350 36 325 11.700 3.802.500 350 - 400 30 375 11.250 4.218.750 Từ 400 trở lên 20 425 8.500 3.612.500 Tổng cộng 200 56.400 17.395.000 a. Tính thu nhập bình quân hàng tháng của một nhân khẩu của địa phương với xác suất bằng 0,9544. b. Tính xác suất khi suy rộng tài liệu về thu nhập bình quân một nhân khẩu của địa phương với phạm vi sai số không vượt quá 16,42 nghìn đồng. c. Với xác suất bằng 0,9544 và phạm vi sai số chọn mẫu không vượt quá 10 nghìn đồng khi suy rộng về thu nhập bình quân của nhân khẩu, số hộ cần chọn (theo cách chọn không lặp) để điều tra là bao nhiêu? d. Với xác suất bằng 0,9544, xác định tỷ lệ số hộ có thu nhập bình quân hàng tháng một nhân khẩu dưới 200 nghìn đồng của địa phương. e. Tính xác suất khi suy rộng tỷ lệ số hộ của địa phương có thu nhập bình quân hàng tháng một nhân khẩu dưới 200 nghìn và phạm vi sai số không vượt quá 7,59%. f. Với xác suất theo bài cho và phạm vi sai số chọn mẫu không vượt quá 5% khi suy rộng tỷ lệ về số hộ có thu nhập bình quân hàng tháng một nhân khẩu dưới 200 nghìn, tính số hộ cần chọn để điều tra. Bài giải: a. Tính thu nhập bình quân hàng tháng một nhân khẩu của địa phương với xác suất bằng 0,9544. x x x x 100 Với: = 2 = 2 * 5,473 = 10.946 (đồng) Do đó: c. Tính xác suất khi suy rộng tài liệu về thu nhập bình quân một nhân khẩu của địa phương với phạm vi sai số không vượt quá 16,42 nghìn đồng. 2 (3) = 0,9974 d. Với xác suất bằng 0,9544 và phạm vi sai số chọn mẫu không vượt quá 10 nghìn đồng khi suy rộng về thu nhập bình quân của nhân khẩu, số hộ cần chọn (theo cách chọn không lặp) để điều tra là bao nhiêu? e. Với xác suất bằng 0,9544, xác định tỷ lệ số hộ có thu nhập bình quân hàng tháng một nhân khẩu dưới 200 nghìn đồng của địa phương. = Do đó: 101 f. Tính xác suất khi suy rộng tỷ lệ số hộ của địa phương có thu nhập bình quân hàng tháng một nhân khẩu dưới 200 nghìn và phạm vi sai số không vượt quá 7,59%. g. Với xác suất theo bài cho và phạm vi sai số chọn mẫu không vượt quá 5% khi suy rộng tỷ lệ về số hộ có thu nhập bình quân hàng tháng một nhân khẩu dưới 200 nghìn, tính số hộ cần chọn để điều tra. 5.2.2. Các phương pháp tổ chức điều tra chọn mẫu thường dùng trong thống kê 5.2.2.1. Chọn mẫu ngẫu nhiên đơn giản Trước hết cần lập phiếu (thẻ, thăm) cho từng đơn vị của tổng thể chung. Sau đó lần lượt rút từng phiếu một theo cách lặp hoặc không lặp. Mỗi một phiếu được rút ra sẽ cho biết đơn vị cụ thể của tổng thể mẫu. Cứ tiếp tục rút như vậy cho đến khi số phiếu được rút ra đúng bằng số lượng đơn vị tổng thể mẫu, danh sách các đơn vị của tổng thể mẫu đã được xác định, dựa vào danh sách này để tiến hành thu thập tài liệu theo nội dung điều tra đã được đề ra. Phương pháp này có thể cho kết quả tốt nếu giữa các đơn vị của tổng thể chung không có sự khác nhau. Nhưng nếu tổng thể chung có kết cấu phức tạp giữa các đơn vị có sự khác nhau nhiều thì mẫu được chọn ra khó đảm bảo tính chất đại diện cao. Hơn nữa với những tổng thể chung quá lớn có nhiều đơn vị thì việc lập phiếu sẽ rất khó khăn và phức tạp. 5.2.2.2. Chọn mẫu hệ thống Đầu tiên cần sắp xếp các đơn vị của tổng thể chung theo một thứ tự nào đó, như sắp xếp theo thứ tự vần A,B, C... của tên gọi, theo thứ tự địa dư, theo quy mô từ nhỏ đến lớn... Sau đó xác định khoảng cách chọn bằng cách lấy số lượng đơn vị tổng thể chung chia cho số lượng đơn vị tổng thể mẫu. Nếu gọi khoảng cách chọn là d, thì: d = N/n Cứ sau một khoảng cách bằng d sẽ chọn một đơn vị. Đơn vị đầu tiên của tổng thể mẫu sẽ được chọn theo phương pháp chọn ngẫu nhiên đơn giản, đơn vị thứ hai của tổng mẫu được chọn bằng cách lấy số thứ tự của đơn vị mẫu thứ nhất cộng với d, cứ tiếp tục như vậy sẽ xác định danh sách các đơn vị của tổng thể mẫu. 102 Ví dụ 5.2: Một doanh nghiệp có 200 lao động cần chọn 40 lao động để điều tra. Đầu tiên, sắp xếp tên 200 người theo thứ tự A, B, C... Sau đó tính khoảng cách chọn d = 200 : 40 = 5. Lập phiếu cho 5 người đầu tiên, rồi rút ngẫu nhiên ra một phiếu, giả sử rút được người thứ 3 - người đầu tiên của mẫu. Người thứ 2 được chọn là người thứ tám, người thứ 3 được chọn là người thứ 13, cứ tiếp tục như vậy cho đến khi chọn đủ 40 người. Như vậy, phương pháp chọn hệ thống được tiến hành theo cách chọn không lặp và thường cho sai số nhỏ hơn phương pháp chọn ngẫu nhiên đơn giản. 5.2.2.3. Chọn mẫu phân loại Để thực hiện phương pháp này trước hết phải phân tổ các đơn vị của tổng thể chung thành các tổ theo tiêu thức có liên quan trực tiếp đến nội dung nghiên cứu. Sau đó, phân chia số lượng các đơn vị tổng thể mẫu cho từng tổ. Việc phân chia có thể được tiến hành bằng 1 trong 3 cách: - Thứ nhất, chia đều số lượng đơn vị tổng thể mẫu cho số tổ. Giả sử tổng thể chung được chia làm 3 tổ thì số lượng đơn vị tổng thể mẫu được chia cho mỗi tổ bằng ni = n/3 với i = 1, 2, 3; - Thứ hai, chia số lượng đơn vị tổng thể mẫu theo tỷ lệ số lượng đơn vị của từng tổ trong tổng thể chung. Như vậy, số lượng đơn vị tổng thể mẫu được chia cho tổ thứ i sẽ là: N i ni n N - Thứ ba, chia số lượng đơn vị tổng thể mẫu theo tỷ lệ số lượng đơn vị của từng tổ trong tổng thể chung và độ lệch chuẩn của từng tổ trong tổng thể chung. Như vậy, số lượng đơn vị tổng thể mẫu được chia cho tổ thứ i sẽ là: N i i n i n N i i Sau khi đã phân chia các đơn vị của tổng thể mẫu cho các tổ của tổng thể chung thì việc chọn các đơn vị của tổng thể mẫu trong từng tổ của tổng thể chung được tiến hành bằng phương pháp thứ nhất hoặc thứ hai. Tương ứng với 3 cách chia số lượng đơn vị tổng thể mẫu cho các tổ của tổng thể chung, sẽ có các công thức tính sai số bình quân chọn mẫu như sau: - Chia đều: 103 + Chọn lặp: 1 2 N 2 i i Suy rộng bình quân: x N ni 2 1 p i (1 p ) N i Suy rộng tỷ lệ: f N ni + Chọn không lặp: n 2 N 2 (1 i ) 1 i i N i Suy rộng bình quân: x N n i 2 n i p i (1 p ) N i (1 ) 1 N i Suy rộng tỷ lệ: f N n i - Chọn theo tỷ lệ: + Chọn lặp: 2 2 N i 2 i i Suy rộng bình quân: x với n N i p (1 p ) p i (1 p i ) N i Suy rộng tỷ lệ: f với p (1 p ) n N i + Chọn không lặp: 2 n Suy rộng bình quân: (1 ) x n N p (1 p ) n Suy rộng tỷ lệ: f (1 ) n N - Chọn tối ưu: + Chọn lặp: 1 i N i Suy rộng bình quân: x N n 104 1 p i (1 p i ) N i Suy rộng tỷ lệ: f N n + Chọn không lặp: 1 i N i n Suy rộng bình quân: (1 ) x N n N 1 p i (1 p i ) N i n Suy rộng tỷ lệ: f (1 ) N n N 5.2.2.4. Chọn mẫu cả khối Theo phương pháp tổ chức chọn mẫu này thì trước tiên các đơn vị tổng thể chung được chia thành R khối (chùm) với số lượng đơn vị bằng nhau hoặc không bằng nhau. Từ R khối chọn ngẫu nhiên ra r khối theo phương pháp chọn ngẫu nhiên đơn giản hoặc chọn hệ thống và điều tra tất cả các đơn vị của r khối. Ưu điểm của phương pháp này là tổ chức gọn nhẹ, đơn giản, giảm chi phí. Tuy nhiên, vì một số đơn vị được chọn để điều tra chỉ tập trung vào một số khối nên có thể sai số lớn nếu giữa các khối có sự khác biệt nhau nhiều. * Công thức tính sai số bình quân chọn mẫu: - Khi suy rộng bình quân: R r 2 ( ) x R 1 x r 2 Trong đó x là phương sai giữa các số bình quân khối được chọn và được tính như sau: 2 2 ()xi x n i + Nếu số lượng đơn vị các khối không bằng nhau: x ni 2 2 ( x i x ) + Nếu số lượng đơn vị các khối bằng nhau: x r Với xi ( i 1, 2, 3,...., r ) là số bình quân của mỗi khối được chọn; x : Là số bình quân của các khối được chọn. - Khi suy rộng tỷ lệ: 105 R r f (1 f )( ) r r R 1 f r Trong đó f r là tỷ lệ bình quân của các khối được chọn và được tính như sau: f i n i + Nếu số lượng đơn vị các khối không bằng nhau: f r n i f i + Nếu số lượng đơn vị các khối bằng nhau: f r r Với i = 1, 2, 3, , r là tỷ lệ của mỗi khối được chọn. 5.2.2.5. Chọn mẫu phân tầng Phương pháp tổ chức chọn mẫu phân tầng (còn được gọi là tổ chức chọn mẫu nhiều cấp) là phương pháp tổ chức chọn mẫu phải thông qua ít nhất hai cấp chọn trung gian. Đầu tiên cần xác định các đơn vị mẫu cấp I, sau đó các đơn vị mẫu cấp I lại được phân chia thành các đơn vị chọn mẫu cấp II và cứ như thế cho đến cấp cuối cùng. Về bản chất, phương pháp này là sự biến thể của phương pháp chọn mẫu cả khối. 5.2.3. Điều tra chọn mẫu nhỏ và điều tra chọn mẫu thời điểm 5.2.3.1. Điều tra chọn mẫu nhỏ Một trong các yêu cầu trong điều tra chọn mẫu đó là cần phải sử dụng phương pháp chọn mẫu và một quy mô mẫu phù hợp để hạn chế được sai số, các sai số trong điều tra chọn mẫu chỉ có thể xác định được đó là sai số do tính đại biểu tức là đơn vị mẫu phải đại diện cho tổng thể chung và như vậy để giảm sai số cho tính đại biểu thì quy mô mẫu điều tra phải lớn. Tuy nhiên, trong nhiều trường hợp chúng ta không thể tăng được quy mô mẫu điều tra do chi phí lớn, do không kịp về thời gian để thực hiện hay có thể không chọn được nhiều đơn vị mẫu. Do vậy, cần xem xét đến điều tra chọn mẫu với quy mô mẫu nhỏ, thông thường quy mô mẫu điều tra nhỏ hơn 20 được coi là mẫu nhỏ (tuy nhiên, tùy vào mục đích nghiên cứu, tùy đặc điểm của đối tượng điều tra mà số lượng mẫu bao nhiêu được coi là nhỏ). Về cơ bản việc lựa chọn phương pháp chọn mẫu cũng như tính toán các tham số khi ước lượng kết quả cho tổng thể chung được thực hiện giống như điều tra chọn mẫu thông thường, tuy nhiên cần lưu ý là khi số đơn vị mẫu điều 106 tra nhỏ thì chúng ta cần sử dụng hệ số tin cậy (t) (phân phối student) thay cho hệ số tin cậy (z) (phân phối chuẩn). 5.2.3.2. Điều tra chọn mẫu thời điểm Nội dung cơ bản của điều tra chọn mẫu thời điểm là tiến hành thu thập số liệu tại những thời điểm nhất định của đối tượng điều tra, không kể thời gian tồn tại của đối tượng điều tra tại thời điểm đó dài hay ngắn. Chẳng hạn như để điều tra về tỷ lệ sản phẩm hỏng trong 2 dây chuyền sản xuất, cứ sau 30 phút người ta tiến hành kiểm tra sản phẩm được sản xuất ra tại 2 dây chuyền và ghi lại kết quả. Như vậy, toàn bộ số lượng sản phẩm của 2 dây chuyền sản xuất ra trong một ngày chính là tổng thể chung, tuy nhiên nếu cứ sau 30 phút lại tiến hành điều tra thì đó chính là điều tra chọn mẫu vì chỉ tiến hành điều tra tại những thời điểm nhất định. Trong điều tra chọn mẫu thời điểm thì khái niệm tổng thể chung và tổng thể mẫu hoàn toàn phụ thuộc vào yếu tố thời gian, tổng thể chung chính là toàn bộ số sản phẩm được sản xuất ra trong một ngày của dây chuyền sản xuất, còn tổng thể mẫu chính là số sản phẩm được chọn tại các thời điểm điều tra. Do tổng thể chung và tổng thể mẫu thay đổi theo yếu tố thời gian nên chúng ta không thể xác định được quy mô tổng thể chung. Do vậy, điều tra chọn mẫu thời điểm thực hiện phương pháp chọn ngẫu nhiên hay chọn hệ thống và các đơn vị được chọn theo cách chọn 1 lần (chọn không lặp). 5.3. Điều tra chọn mẫu phi ngẫu nhiên Điều tra chọn mẫu phi ngẫu nhiên là điều tra chọn mẫu mà trong đó các đơn vị của tổng thể mẫu được chọn ra trên cơ sở phân tích đặc điểm của hiện tượng và kinh nghiệm thực tế. Do đó, để đảm bảo chất lượng của tài liệu điều tra, cần phải giải quyết tốt các vấn đề sau đây: - Thứ nhất, phân tổ chính xác hiện tượng nghiên cứu: Hiện tượng nghiên cứu thường có kết cấu phức tạp, gồm nhiều tổ, nhiều bộ phận có đặc điểm và tính chất khác nhau. Trên cơ sở phân tổ chính xác hiện tượng nghiên cứu, các đơn vị có đặc điểm và tính chất giống nhau (hoặc gần giống nhau) sẽ được đưa vào một tổ. Từ mỗi tổ sẽ chọn ra các đơn vị đại diện (còn gọi là điển hình) cho tổ đó. Tập hợp các đơn vị đại diện của các tổ tạo thành tổng thể mẫu. Giả sử điều tra về mức sống ở một địa phương, có thể phân mức sống thành ba tổ là nghèo, trung bình, khá giả. Từ mỗi tổ sẽ chọn ra một số hộ đại diện cho tổ đó để tiến hành điều tra. - Thứ hai, xác định số lượng đơn vị cần điều tra: 107 Việc xác định số lượng đơn vị cần điều tra phải căn cứ vào tính chất phức tạp của hiện tượng nghiên cứu, lực lượng cán bộ, kinh phí cho cuộc điều tra... Từ đó, quyết định nên điều tra bao nhiêu đơn vị. Đương nhiên, số lượng các đơn vị được chọn ra để điều tra phải đủ lớn, có thể đại diện cho toàn bộ hiện tượng; - Thứ ba, lựa chọn các đơn vị điều tra: Các đơn vị được lựa chọn để điều tra thực tế thường là những đơn vị có mức độ của tiêu thức xấp xỉ với mức độ bình quân của tổ. Khi lựa chọn các đơn vị để điều tra thực tế cần phải thông qua việc phân tích, bàn bạc tập thể của những người có kinh nghiệm, am hiểu tình hình thực tế; - Thứ tư, suy rộng kết quả điều tra: Sau khi đã thu thập được tài liệu ở các đơn vị điều tra thì tiến hành tính toán suy rộng trực tiếp cho toàn bộ hiện tượng. Vì các đơn vị điều tra được lựa chọn đại diện cho từng tổ nên khi suy rộng phải chú ý đến tỷ trọng của mỗi tổ chiếm trong toàn bộ hiện tượng. 108 CÂU HỎI ÔN TẬP CHƯƠNG 5 Câu 1: Trình bày và phân tích khái niệm điều tra chọn mẫu? Câu 2: Phân biệt cách chọn một lần (không lặp lại) và chọn nhiều lần (chọn lặp lại)? Câu 3: Trình bày khái niệm tổng thể chung và tổng thể mẫu? Câu 4: Trình bày nội dung sai số trong điều tra chọn mẫu? Câu 5: Trình bày các biện pháp giảm sai số trong điều tra chọn mẫu? Câu 6: Trình bày nội dung của các phương pháp chọn mẫu ngẫu nhiên? Câu 7: Trình bày nội dung của các phương pháp chọn mẫu phi ngẫu nhiên? Câu 8: Trình bày nội dung cơ bản của quy trình thực hiện cuộc điều tra chọn mẫu? 109 TÀI LIỆU THAM KHẢO 1. TS. Trần Thị Kỳ, TS. Nguyễn Văn Phúc (2012). Giáo trình nguyên lý thống kê. Nxb Lao động, Hà Nội. 2. PGS. TS Trần Thị Kim Thu (2015). Lý thuyết thống kê. Nxb Đại học Kinh tế quốc dân, Hà Nội. 3. PGS.TS Nguyễn Thị Kim Thúy (2008). Giáo trình nguyên lý thống kê (lý thuyết thống kê) ứng dụng trong quản lý kinh tế & kinh doanh sản xuất dịch vụ. Nxb Văn hóa Sài Gòn. 110
File đính kèm:
- bai_giang_nguyen_ly_thong_ke.pdf