Bài giảng Tin học ứng dụng - Chương 5: Ứng dụng công cụ phân tích dữ liệu
MỤC TIÊU
▪Biết được một số công cụ phân tích dữ liệu thông
dụng
▪Hiểu và áp dụng được thang đo và dữ liệu để giải
quyết một số mô hình thực tế
▪Sử dụng được phần mềm SPSS phục vụ cho phân
tích dữ liệu nghiên cứu.
1 GIỚI THIỆU
2 CÁC CÔNG CỤ PHÂN TÍCH DỮ LIỆU
3 ỨNG DỤNG SPSS1 GIỚI THIỆU
2 CÁC CÔNG CỤ PHÂN TÍCH DỮ LIỆU
3 ỨNG DỤNG SPSS
Trang 1
Trang 2
Trang 3
Trang 4
Trang 5
Trang 6
Trang 7
Trang 8
Trang 9
Trang 10
Tải về để xem bản đầy đủ
Bạn đang xem 10 trang mẫu của tài liệu "Bài giảng Tin học ứng dụng - Chương 5: Ứng dụng công cụ phân tích dữ liệu", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Bài giảng Tin học ứng dụng - Chương 5: Ứng dụng công cụ phân tích dữ liệu
Thực hiện kiểm định One-Sample T-Test ▪ Bước 4: So sánh p-value (Sig.) với giá trị • Sig. > : Chấp nhận Ho • Sig. : Bác bỏ Ho One-Sample T-Test 146 những bước chập chững vào thế giới số 1. KIỂM ĐỊNH TRUNG BÌNH 1 TỔNG THỂ • Ví dụ: Kiểm định giả thuyết “Độ tuổi trung bình của khách hàng trả lương qua thẻ VCB là 35” • Quy trình thực hiện ─ Select Case lọc các trường hợp trả lương qua thẻ VCB ─ Analyze Compare Means One-Sample T- Test ─ Cung cấp biến kiểm định, giá trị trung bình kỳ vọng ─ Chọn độ tin cậy 147 những bước chập chững vào thế giới số V.D., KIỂM ĐỊNH TRUNG BÌNH 1 TỔNG THỂ Giả thuyết H0: Tuổi trung bình của chủ thẻ lương VCB là 35 148 những bước chập chững vào thế giới số KIỂM ĐỊNH TRUNG BÌNH 1 TỔNG THỂ (SPV) Giả thuyết H0: Tuổi trung bình của chủ thẻ lương VCB là 35 Số lượng quan sát Giá trị trung bình Mức ý nghĩa = 0.00 < 0.05 Giá trị kiểm định t Bác bỏ giả thuyết H0 KẾT LUẬN: Tuổi trung bình của chủ thẻ lương VCB trên 35 149 những bước chập chững vào thế giới số 2. KIỂM ĐỊNH TRUNG BÌNH 2 TỔNG THỂ a. Mẫu độc lập (Independent) b. Mẫu phụ thuộc hoặc theo từng cặp (Paired) 150 những bước chập chững vào thế giới số TRUNG BÌNH CỦA 2 TỔNG THỂ - ĐỘC LẬP ▪Bước 1: Giả thuyết Ho: “Giá trị trung bình của 2 biến tổng thể là như nhau” ▪Bước 2: Thực hiện Independent-Samples T-Test Independent-Sample T-Test 151 những bước chập chững vào thế giới số TRUNG BÌNH CỦA 2 TỔNG THỂ - ĐỘC LẬP ▪Bước 3: Tìm Sig. với kiểm định sự bằng nhau của 2 phương sai tổng thể Levene: • Nếu Sig. < thì phương sai giữa 2 nhóm là khác nhau dùng kết quả “Equal variances not assumed” • Nếu Sig. thì phương sai giữa 2 nhóm là bằng nhau dùng kết quả “Equal variances assumed” ▪Bước 4: So sánh Sig. của kiểm định t ở bước 3 với : • Sig. > : Chấp nhận Ho • Sig. : Bác bỏ Ho 152 những bước chập chững vào thế giới số TRUNG BÌNH CỦA 2 TỔNG THỂ - ĐỘC LẬP • Ví dụ: Kiểm định giả thuyết “Tuổi trung bình của khách hàng nam và nữ là ngang nhau” • Quy trình thực hiện – Analye Compare Means Independent- samples T Test – Cung cấp các biến định lượng (tính trung bình), biến định tính (phân thành 2 nhóm độc lập) – Chỉ định 2 nhóm cần so sánh... 153 những bước chập chững vào thế giới số V.D., TRUNG BÌNH CỦA 2 TỔNG THỂ - ĐỘC LẬP 154 những bước chập chững vào thế giới số TRUNG BÌNH CỦA 2 TỔNG THỂ - ĐỘC LẬP (SPV) Giả thuyết H0: Tuổi trung bình giữa nam và nữ là bằng nhau Sig. < 5% phương sai 2 mẫu Kiểm định sự bằng nhau về khác nhau phương sai của 2 mẫu “Equal variances not assumed” (Levenve’s Test) Sig. > 5% phương sai 2 mẫu bằng nhau “Equal variances assumed” 155 những bước chập chững vào thế giới số TRUNG BÌNH CỦA 2 TỔNG THỂ - ĐỘC LẬP (SPV) Sig. > 5% phương sai 2 Kết quả kiểm định sự mẫu bằng nhau bằng nhau về trị trung “Equal variances assumed” bình của 2 mẫu Mức ý nghĩa = 0.00 < 0.05 Bác bỏ giả thuyết H0 KẾT LUẬN: Tuổi trung bình giữa nam và nữ là khác nhau 156 những bước chập chững vào thế giới số TRUNG BÌNH CỦA 2 TỔNG THỂ - TỪNG CẶP ▪ Bước 1: Giả thuyết Ho: “Không có sự khác nhau về trị 2 trung bình tổng thể” (Khác biệt giữa 2 trung bình là bằng 0) ▪ Bước 2: Thực hiện Paired-Samples T-Test ▪ Bước 3: So sánh Sig. của kiểm định t ở bước 2 với : • Sig. > : Chấp nhận Ho • Sig. : Bác bỏ Ho Paired-Sample T-Test 157 những bước chập chững vào thế giới số TRUNG BÌNH CỦA 2 TỔNG THỂ - TỪNG CẶP • Ví dụ: Cảm nhận của khách hàng trước và sau khi ngân hàng triển khai cam kết chất lượng dịch vụ (SLA) • Quy trình thực hiện ─ Analye Compare Means Paired-Samples T-Test ─ Cung cấp cặp biến phối hợp ─ Điều chỉnh độ tin cậy (nếu cần)... 158 những bước chập chững vào thế giới số V.D., TRUNG BÌNH CỦA 2 TỔNG THỂ - TỪNG CẶP 159 những bước chập chững vào thế giới số TRUNG BÌNH CỦA 2 TỔNG THỂ - TỪNG CẶP (SPV) Giả thuyết H0: Cảm nhận của khách hàng là không đổi Mức ý nghĩa = 0.00 < 0.05 Bác bỏ giả thuyết H0 KẾT LUẬN: Cảm nhận của khách hàng có thay đổi 160 những bước chập chững vào thế giới số những bước chập chững vào thế giới số PHÂN TÍCH TƯƠNG QUAN Tương quan 2 biến (Bivariate) 1. Tương quan Pearson 2. Tương quan Spearman 162 những bước chập chững vào thế giới số 1. TƯƠNG QUAN 2 BIẾN ▪Tương quan Pearson • Áp dụng trong trường hợp mẫu có phân phối chuẩn • Lượng hóa mối liên hệ tuyến tính giữa 2 biến định lượng • Mối liên hệ giữa 2 biến có thể [-1, 1] – r > 0: liên hệ tuyến tính thuận – r < 0: liên hệ tuyến tính nghịch – r = 0: không có liên hệ hoặc liên hệ phi tuyến • Mối liên hệ này có tính chất đối xứng. r 163 những bước chập chững vào thế giới số TƯƠNG QUAN 2 BIẾN ▪Hệ số tương quan giữa hai biến x và y: 표푣( , ) = 푣 ∗ 푣 Trong đó: – cov(x,y): hiệp phương sai của x và y – var(x): phương sai của x – var(y): phương sai của y 164 những bước chập chững vào thế giới số TƯƠNG QUAN 2 BIẾN r = –0.90 r = 0.00 r = 0.90 165 những bước chập chững vào thế giới số A. TƯƠNG QUAN PEARSON ▪Giả thuyết: H0 và H1, và hệ số tương quan (r) • Kiểm định 2 phía (two-tailed) – H0: r = 0 - không có mối tương quan – H1: r ≠ 0 - có mối tương quan • Kiểm định 1 phía (one-tailed) ─ H0: r = 0 - không có mối tương quan ─ H1: r > 0 - có mối tương quan thuận ─ H1: r < 0 - có mối tương quan nghịch 166 những bước chập chững vào thế giới số TƯƠNG QUAN PEARSON ▪Một số yêu cầu về dữ liệu: • 2 biến liên tục (thang đo khoảng/tỷ lệ) • Các quan sát có giá trị trên cả 2 biến • Các quan sát độc lập • Các biến có phân phối chuẩn • Không có trường hợp bất thường 167 những bước chập chững vào thế giới số TƯƠNG QUAN PEARSON ▪Ví dụ, • Mục tiêu nghiên cứu: Có mối quan hệ như thế nào giữa độ tuổi và thu nhập. • Câu hỏi nghiên cứu: Độ tuổi và thu nhập có mối quan hệ với nhau hay không? • Các biến: Độ tuổi và thu nhập (2 biến định lượng). • H0: “Độ tuổi và thu nhập không có liên hệ với nhau” những bước chập chững vào thế giới số TƯƠNG QUAN PEARSON • Quy trình thực hiện ─Analyze Correlate Bivariate ─Chọn biến vào Variables ─Tại Correlation Coefficients Pearson Test of Significance OK 169 những bước chập chững vào thế giới số V.D., TƯƠNG QUAN PEARSON 170 những bước chập chững vào thế giới số V.D., TƯƠNG QUAN PEARSON (SPV) H0: Độ tuổi và thu nhập không có liên hệ với nhau Hệ số tương quan giữa 2 biến là r = 0.670 Mức ý nghĩa sig. = 0.000 < 0.05 Bác bỏ giả thuyết H0 KẾT LUẬN: Độ tuổi và thu nhập có liên hệ với nhau 171 những bước chập chững vào thế giới số B. TƯƠNG QUAN SPEARMAN ▪ Tương quan - Spearman • Rank Correlation Coefficient • Áp dụng trong trường hợp tổng thể không có phân phối chuẩn 172 những bước chập chững vào thế giới số những bước chập chững vào thế giới số PHÂN TÍCH HỒI QUY 1.Hồi quy tuyến tính đơn biến 2.Hồi quy tuyến tính đa biến (bội) 푌 = 훽0 + σ(훽푖 ∗ 푖) 174 những bước chập chững vào thế giới số PHÂN TÍCH HỒI QUY ▪Mô hình hóa mối quan hệ tuyến tính giữa 1 biến phụ thuộc (Y) với nhiều biến độc lập ( 푖) ▪Không có tính đối xứng như tương quan • Ví dụ, Các yếu tố ảnh hưởng đến chất lượng KTX BUH... 175 những bước chập chững vào thế giới số 1. HỒI QUY TUYẾN TÍNH ĐƠN • Mô hình tổng quát 풀풊 = 휷 + 휷 ∗ 푿풊 +휺풊 Trong đó – 푌푖: giá trị dự đoán thứ i của biến phụ thuộc – 푖: giá trị quan sát thứ i của biến độc lập – 훽0 và 훽1: các hệ số hồi quy - theo phương pháp OLS 2 – 휀푖: phần dư, biến độc lập ngẫu nhiên N(0, ) 176 những bước chập chững vào thế giới số V.D: ĐỒ THỊ HỒI QUY TUYẾN TÍNH ĐƠN Y X 177 những bước chập chững vào thế giới số HỒI QUY TUYẾN TÍNH ĐƠN ▪Một số giả định và yêu cầu về dữ liệu • 2 biến liên tục (thang đo khoảng/tỷ lệ) • Các quan sát có giá trị trên cả 2 biến • Tồn tại quan hệ tuyến tính giữa 2 biến • Các giá trị của Y độc lập với nhau • Phân phối chuẩn của Y với phương sai không đổi • Các giá trị trung bình 휇 푌 nằm trên đường thẳng • Phần dư có phân phối chuẩn 178 những bước chập chững vào thế giới số HỒI QUY TUYẾN TÍNH ĐƠN • Quy trình thực hiện ─Analyze Regression Linear ─Chọn biến vào Dependent và Independent ─Kiểm định các giả định Statistics ─Biểu đồ Plots OK 179 những bước chập chững vào thế giới số V.D: HỒI QUY TUYẾN TÍNH ĐƠN 180 những bước chập chững vào thế giới số V.D., HỒI QUY TUYẾN TÍNH ĐƠN (SPV) Phương pháp nhập một lần Đo lường mức độ phù hợp của mô hình đối với mẫu (R2) Mức độ phù hợp của mô hình với tổng thể (F lớn, sig. < 0.05) Hệ số hồi quy Mức ý nghĩa của các hệ số hồi quy sig. = 0.00 < 0.05 những bước chập chững vào풀 thế풊 giới= số . ퟒ + . ∗ 푿풊 + 휺 HỒI QUY TUYẾN TÍNH ĐƠN (SPV) ▪ Variables Entered/Removed • Model: cho phép chạy nhiều mô hình mỗi lần thực hiện hồi quy, cột Model là số thứ tự của mô hình. • Variables Entered: cho phép nhập các biến vào theo khối (blocks) và thực hiện hồi quy theo từng bước (stepwise) • Variables Removed: liệt kê các biến bị loại bỏ khỏi hồi quy, cột này thường trống trừ khi thực hiện hồi quy theo từng bước. • Method: phương pháp. V.d., từng bước, nhập một lần những bước chập chững vào thế giới số HỒI QUY TUYẾN TÍNH ĐƠN (SPV) ▪ Model Summary • Model: số thứ tự của mô hình hồi quy • R: tương quan giữa biến độc lập và biến phụ thuộc • R-Squared: mức độ biến thiên của biến phụ thuộc được giải thích bởi biến độc lập • Adjusted R-Square: mức độ biến thiên của biến phụ thuộc được giải thích bởi biến độc lập – V.d., 44.8% (R2 = 0.448) sự biến thiên của chất lượng KTX được giải thích bởi chất lượng nhân viên KTX. những bước chập chững vào thế giới số R2 VÀ R2 HIỆU CHỈNH • R-Squared tăng khi thêm 1 biến độc lập (X) vào mô hình, dù biến thêm vào không có ý nghĩa thống kê • Adjusted R-Squared chỉ tăng khi biến độc lập (X) có ý nghĩa thống kê và ảnh hưởng đến biến phụ thuộc (Y) • R-Squared không có giá trị âm • Adjusted R-Squared có thể âm khi R-Squared gần giá trị 0 2 R 184 những bước chập chững vào thế giới số HỒI QUY TUYẾN TÍNH ĐƠN (SPV) ▪ ANOVA • Sum of squares: tổng bình phương • df: bậc tự do, Residual = n – 1 • Mean Square: Sum of Squares/df • F và Sig.: kiểm định F và p-value – F = Mean Square (Regression)/Mean Square (Residual). – Giả thuyết H0: “tất cả các hệ số hồi quy của mô hình bằng 0” – Sig. < α: mô hình hồi quy có ý nghĩa thống kê. những bước chập chững vào thế giới số HỒI QUY TUYẾN TÍNH ĐƠN (SPV) ▪ Coefficients • B: các hệ số hồi quy tuyến tính. • Std. Error: sai số chuẩn cho các hệ số • Beta: các hệ số được chuẩn hóa. • t và Sig.: Kiểm định t và p-value ─ Sig. > α: không có ý nghĩa thống kê (loại bỏ b/beta tương ứng) ─ Sig. < α: có ý nghĩa thống kê (giữ lại b/beta tương ứng) những bước chập chững vào thế giới số những bước chập chững vào thế giới số 2. HỒI QUY TUYẾN TÍNH BỘI • Mô hình tổng quát 풀풊 = 휷 + 휷 ∗ 푿 풊 + 휷 ∗ 푿 풊 + ⋯ + 휷퐩 ∗ 푿퐩풊 + 휺풊 Trong đó – 푌푖: giá trị dự đoán thứ i của biến phụ thuộc – Xk푖: giá trị quan sát thứ i của biến độc lập thứ k – 푖: các hệ số hồi quy riêng phần - theo phương pháp OLS 2 – 휀푖: phần dư, biến độc lập ngẫu nhiên N(0, ). 188 những bước chập chững vào thế giới số HỒI QUY TUYẾN TÍNH BỘI ▪Một số giả định và yêu cầu về dữ liệu • Các biến độc lập - phụ thuộc liên tục (thang đo khoảng/tỷ lệ) • Các quan sát có giá trị độc lập • Tồn tại quan hệ tuyến tính giữa các biến độc lập - phụ thuộc • Các giá trị của Y độc lập với nhau • Phân phối chuẩn của Y với phương sai không đổi • Không tồn tại đa cộng tuyến giữa các biến độc lập • Phần dư có phân phối chuẩn 189 những bước chập chững vào thế giới số V.D: HỒI QUY TUYẾN TÍNH BỘI • Xác định mức độ tác động của các yếu tố có ảnh hưởng đến ý định mua nước hoa ở TP. HCM. Các yếu tố Tính nhân khẩu học hữu dụng H1+ H5 Chất lượng thông tin H2+ Ý định mua hàng Sự tin cậy của thông tin H3+ Nhu cầu H4+ thông tin 190 những bước chập chững vào thế giới số HỒI QUY TUYẾN TÍNH BỘI ▪Quy trình thực hiện A. Xem xét ma trận hệ số tương quan B. Xây dựng phương trình hồi quy C. Kiểm định các giả thuyết D. Giải thích các hệ số hồi quy E. Xác định tầm quan trọng của các biến F. Lựa chọn các biến độc lập cho mô hình G. Dò tìm các vi phạm giả định cần thiết [5] 191 những bước chập chững vào thế giới số A. MA TRẬN HỆ SỐ TƯƠNG QUAN 192 những bước chập chững vào thế giới số MA TRẬN HỆ SỐ TƯƠNG QUAN (SPV) Hệ số tương quan giữa hai biến độc lập thấp & không có ý nghĩa Hệ số tương quan giữa biến phụ thuộc và các biến độc lập tương đối cao & có ý nghĩa KẾT LUẬN: Có thể sử dụng các biến độc lập trong mô hình 193 những bước chập chững vào thế giới số B. XÂY DỰNG MÔ HÌNH HỒI QUY • Quy trình thực hiện ─Analyze Regression Linear ─Chọn biến vào Dependent và các biến Independent ─Kiểm định các giả định Statistics ─Biểu đồ Plots OK 194 những bước chập chững vào thế giới số XÂY DỰNG MÔ HÌNH HỒI QUY 195 những bước chập chững vào thế giới số PHƯƠNG TRÌNH HỒI QUY Hệ số hồi quy Hệ số xác định tổng thể R2 = 0.717, nên các biến độc lập giải thích được khoảng 71,7 % sự biến thiên của biến phụ thuộc 풀 = 2. + . ∗ 푿 + . ∗ 푿 + 휺 196 những bước chập chững vào thế giới số C. KIỂM ĐỊNH CÁC GIẢ THUYẾT (SPV) Mức độ phù hợp của mô hình với tổng thể (F lớn, sig. < 0.05) Các biến đều có ý nghĩa trong mô hình (sig. < 0.05) KẾT LUẬN: Các giả thuyết đều được ủng hộ (không bác bỏ) 197 những bước chập chững vào thế giới số E. TẦM QUAN TRỌNG CÁC BIẾN (SPV) Xác định tầm quan trọng của các biến trong mô hình 198 những bước chập chững vào thế giới số TẦM QUAN TRỌNG CÁC BIẾN (SPV) 2 biến này có ảnh hưởng đối với mô hình lớn hơn các biến còn lại 199 những bước chập chững vào thế giới số F. LỰA CHỌN CÁC BIẾN ĐỘC LẬP ▪Mục đích • Lựa chọn hiệu quả các biến đưa vào mô hình ▪Thực hiện • Tăng dần số lượng các biến và kiểm tra mức độ phù hợp của mô hình 200 những bước chập chững vào thế giới số LỰA CHỌN CÁC BIẾN ĐỘC LẬP Lựa chọn các biến độc lập 201 những bước chập chững vào thế giới số LỰA CHỌN CÁC BIẾN ĐỘC LẬP (SPV) Hệ số xác định tổng thể (R2) thay đổi F2 >> F1 KẾT LUẬN: Mô hình 2 biến tốt hơn hẳn so với mô hình 1 biến những bước chập chững vào thế giới số G. HIỆN TƯỢNG ĐA CỘNG TUYẾN Xem xét hiện tượng đa cộng tuyến (VIF) 203 những bước chập chững vào thế giới số HIỆN TƯỢNG ĐA CỘNG TUYẾN (SPV) Nếu VIF < 10: Các biến độc lập không có tương quan với nhau KẾT LUẬN: Không xảy ra hiện tượng đa cộng tuyến những bước chập chững vào thế giới số những bước chập chững vào thế giới số Q&A 206 HẾT
File đính kèm:
- bai_giang_tin_hoc_ung_dung_chuong_5_ung_dung_cong_cu_phan_ti.pdf