Bài giảng Tin học ứng dụng nâng cao - Chương: Phân tích hồi quy tương quan và dự báo kinh tế - Lê Viết Mẫn
Khái niệm cơ bản (1/2)
• Giữa các yếu tố luôn có mối liên hệ ràng buộc lẫn nhau
• Năng suất lao động tăng lên làm cho giá thành sản phẩm giảm đi
• Vốn đầu tư cho trang thiết bị tăng lên thì năng suất lao động sẽ tăng lên
• Quan hệ hàm - hai biến ngẫu nhiên X và Y được gọi là phụ thuộc
hàm số nếu tồn tại f sao cho Y = f(X) tức là khi đại lượng X biến đổi
thì theo một quy tắc nào đó có thể xác định được giá trị đại lượng Y
tương ứng
• Quan hệ thống kê - hai biến ngẫu nhiên X và Y được gọi là phụ
thuộc thống kê nếu mỗi giá trị của X có thể xác định được quy luật
phân phối xác suất có điều kiện của Y: F(y/X=x) = P(Y>y/X=x)
• Đây là sự phụ thuộc không hoàn toàn chặt chẽ tức là khi một hiện tượng
biến đổi thì làm cho hiện tượng liên quan biến đổi nhưng nó không ảnh
hưởng hoàn toàn đến sự biến đổi này
Trang 1
Trang 2
Trang 3
Trang 4
Trang 5
Trang 6
Trang 7
Trang 8
Trang 9
Trang 10
Tải về để xem bản đầy đủ
Tóm tắt nội dung tài liệu: Bài giảng Tin học ứng dụng nâng cao - Chương: Phân tích hồi quy tương quan và dự báo kinh tế - Lê Viết Mẫn
Phân tích hồi quy tương quan và dự báo kinh tế v 1.1 - 04/2013 Lê Viết Mẫn - lvman@hce.edu.vn 1 Phân tích hồi quy và dự báo Wednesday, May 8, 13 Nội dung 1. Hồi quy và tương quan 1.1. Phân tích tương quan 1.2. Phân tích hồi quy 2. Dự báo Lê Viết Mẫn - lvman@hce.edu.vn 2 Phân tích hồi quy và dự báo Wednesday, May 8, 13 Hồi quy và tương quan Lê Viết Mẫn - lvman@hce.edu.vn 3 Phân tích hồi quy và dự báo Wednesday, May 8, 13 Khái niệm cơ bản (1/2) • Giữa các yếu tố luôn có mối liên hệ ràng buộc lẫn nhau • Năng suất lao động tăng lên làm cho giá thành sản phẩm giảm đi • Vốn đầu tư cho trang thiết bị tăng lên thì năng suất lao động sẽ tăng lên • Quan hệ hàm - hai biến ngẫu nhiên X và Y được gọi là phụ thuộc hàm số nếu tồn tại f sao cho Y = f(X) tức là khi đại lượng X biến đổi thì theo một quy tắc nào đó có thể xác định được giá trị đại lượng Y tương ứng • Quan hệ thống kê - hai biến ngẫu nhiên X và Y được gọi là phụ thuộc thống kê nếu mỗi giá trị của X có thể xác định được quy luật phân phối xác suất có điều kiện của Y: F(y/X=x) = P(Y>y/X=x) • Đây là sự phụ thuộc không hoàn toàn chặt chẽ tức là khi một hiện tượng biến đổi thì làm cho hiện tượng liên quan biến đổi nhưng nó không ảnh hưởng hoàn toàn đến sự biến đổi này Lê Viết Mẫn - lvman@hce.edu.vn 4 Phân tích hồi quy và dự báo Wednesday, May 8, 13 Khái niệm cơ bản (2/2) • Phân tích tương quan - đo mức độ kết hợp tuyến tính giữa hai biến • Không có sự phân biệt giữa các biến • Các biến có tính chất đối xứng • Phân tích hồi quy - nghiên cứu mối liên hệ phụ thuộc của một biến với một hay nhiều biến khác • Biến phụ thuộc • Biến độc lập Lê Viết Mẫn - lvman@hce.edu.vn 5 Phân tích hồi quy và dự báo Wednesday, May 8, 13 Phân tích tương quan Lê Viết Mẫn - lvman@hce.edu.vn 6 Phân tích hồi quy và dự báo Wednesday, May 8, 13 Hệ số tương quan • Hệ số tương quan - đo lường mức độ quan hệ tuyến tính giữa hai biến • Quan hệ tuyến tính giữa hai biến không phân biệt biến này phụ thuộc vào biến kia Cov(X,Y ) ρ = Corr(X,Y ) = σ xσ y • Tính chất : • Hệ số tương quan không có đơn vị, có tính hoán đổi ρ X Y = ρ Y X và ρXY ≤ 1 • ρ X Y dương - hai biến có quan hệ cùng chiều (đồng biến) • ρ X Y = 0 - X và Y độc lập hoặc có quan hệ phi tuyến • ρ X Y = 1 - X và Y có quan hệ tuyến tính • ρ X Y > 0.8 - tương quan mạnh • ρ X Y < 0.4 - tương quan yếu • ρ X Y = 0.4 − 0.8 - tương quan TB Lê Viết Mẫn - lvman@hce.edu.vn 7 Phân tích hồi quy và dự báo Wednesday, May 8, 13 CORREL Correlation • Chức năng : tính hệ số tương quan của hai yếu tố • Cú pháp CORREL (array1, array2) Lê Viết Mẫn - lvman@hce.edu.vn 8 Phân tích hồi quy và dự báo Wednesday, May 8, 13 Correlation Vùng địa chỉ dữ liệu cần tính độ tương quan Bấm OK để thực hiện tính toán Vùng địa chỉ dữ liệu Dữ liệu theo hàng hay cột được chọn bao gồm cả nhãn ? Nơi chứa kết quả tính được Lê Viết Mẫn - lvman@hce.edu.vn 9 Phân tích hồi quy và dự báo Wednesday, May 8, 13 Ví dụ Lê Viết Mẫn - lvman@hce.edu.vn 10 Phân tích hồi quy và dự báo Wednesday, May 8, 13 Ví dụ Lê Viết Mẫn - lvman@hce.edu.vn 11 Phân tích hồi quy và dự báo Wednesday, May 8, 13 Đồng phương sai • Là trung bình của tích các cặp sai lệch • Dùng để xác định mối quan hệ giữa hai tập số liệu 1 n Cov(x, y) = ∑(x j − µx )(yi − µy ) n i=1 • Giá trị không giới hạn trong [-1, 1] • Hàm COVAR COVAR (array1, array2) Lê Viết Mẫn - lvman@hce.edu.vn 12 Phân tích hồi quy và dự báo Wednesday, May 8, 13 Covariance Vùng địa chỉ dữ liệu cần tính đồng phương sai Bấm OK để thực hiện tính toán Vùng địa chỉ dữ liệu Dữ liệu theo hàng hay cột được chọn bao gồm cả nhãn ? Nơi chứa kết quả tính được Lê Viết Mẫn - lvman@hce.edu.vn 13 Phân tích hồi quy và dự báo Wednesday, May 8, 13 Ví dụ Lê Viết Mẫn - lvman@hce.edu.vn 14 Phân tích hồi quy và dự báo Wednesday, May 8, 13 Ví dụ Lê Viết Mẫn - lvman@hce.edu.vn 15 Phân tích hồi quy và dự báo Wednesday, May 8, 13 Phân tích hồi quy Lê Viết Mẫn - lvman@hce.edu.vn 16 Phân tích hồi quy và dự báo Wednesday, May 8, 13 Hồi quy tuyến tính đơn • Dạng đơn giản nhất của một mô hình hồi qui chứa một biến phụ thuộc và một biến độc lập Y = β0 + β1X • Hệ số r2 (phương sai mẫu) - đo độ phù hợp của mô hình hồi quy RSQ (known_y’s, known_x’s) Lê Viết Mẫn - lvman@hce.edu.vn 17 Phân tích hồi quy và dự báo Wednesday, May 8, 13 SLOPE và INTERCEPT • Intercept dùng để ước lượng hệ số góc β 0 của phương trình hồi quy tuyến tính đơn • Slope dùng để ước lượng tung độ góc β 1 của phương trình hồi quy tuyến tính đơn • Cú pháp SLOPE (known_y’s, known_x’s) INTERCEPT (known_y’s, known_x’s) Lê Viết Mẫn - lvman@hce.edu.vn 18 Phân tích hồi quy và dự báo Wednesday, May 8, 13 Regression Vùng địa chỉ dữ liệu cho biến phụ thuộc Bấm OK để thực hiện Vùng địa chỉ dữ liệu tính toán cho các biến độc lập Vùng địa chỉ dữ liệu Chọn để loại bỏ hệ số góc được chọn bao gồm cả nhãn ? Độ tin cậy Nơi chứa kết quả tính được Các tuỳ chọn hiển thị sai số Phân phối chuẩn Lê Viết Mẫn - lvman@hce.edu.vn 19 Phân tích hồi quy và dự báo Wednesday, May 8, 13 Ví dụ Lê Viết Mẫn - lvman@hce.edu.vn 20 Phân tích hồi quy và dự báo Wednesday, May 8, 13 Ví dụ Lê Viết Mẫn - lvman@hce.edu.vn 21 Phân tích hồi quy và dự báo Wednesday, May 8, 13 Hồi quy tuyến tính bội • Mô hình thể hiện mức độ phụ thuộc tuyến tính của biến phụ thuộc Y với các biến độc lập Xi Y = β0 + β1X1 + ..+ βk Xk • Hàm LINEST LINEST (known_y’s, [known_x’s], [const], [stat]) Trong đó • const = 0/false - bỏ qua β0 • stat = 1/true - tính toán các tham số thống kê Lê Viết Mẫn - lvman@hce.edu.vn 22 Phân tích hồi quy và dự báo Wednesday, May 8, 13 Ví dụ Lê Viết Mẫn - lvman@hce.edu.vn 23 Phân tích hồi quy và dự báo Wednesday, May 8, 13 Ví dụ Lê Viết Mẫn - lvman@hce.edu.vn 24 Phân tích hồi quy và dự báo Wednesday, May 8, 13 Hồi quy phi tuyến • Biến đổi các phương trình phi tuyến thành phương trình tuyến tính để dễ dàng hồi quy a 1 y az • Phương trình hyperbol y = x , đặt x = z để đưa về = 2 2 • Phương trình parabol y = ax + bx + c , đặt z 1 = x , z 2 = x để đưa về phương trình hồi quy bội y = az1 + bz2 + c b1 bi bn • Hàm sản xuất Cobb Douglas y = A x 1 .. x i .. x n , ta có thể biến đổi bằng cách logarit hoá hai vế ln y = ln A + b1 ln x1 + bn ln xn Lê Viết Mẫn - lvman@hce.edu.vn 25 Phân tích hồi quy và dự báo Wednesday, May 8, 13 Đường xu thế Lê Viết Mẫn - lvman@hce.edu.vn 26 Phân tích hồi quy và dự báo Wednesday, May 8, 13 TrendLine - Đường xu thế • Là đường thể hiện sự phụ thuộc của một biến nghiên cứu vào biến thời gian • Hàm hồi quy của Y phụ thuộc vào X (biến thời gian) • Các giá trị của X bắt đầu từ 1 đến n • Các bước thực hiện tìm đường xu thế : • Vẽ đồ thị XY (Scatter) cho Y • Nháy phải chuột lên một điểm bất kỳ trên đường đồ thị, chọn Add TrendLine... • Chọn loại đường xu thế, đánh dấu hai nút Display Equation on Chart và Display R-squared value on chart • Loại đường xu thế với R2 lớn nhất là đường thể hiện tốt nhất dữ liệu của biến Y Lê Viết Mẫn - lvman@hce.edu.vn 27 Phân tích hồi quy và dự báo Wednesday, May 8, 13 TrendLine - Đường xu thế 1. Chọn vùng địa chỉ C2:C16 2. Vẽ đồ thị XY(Scatter) 3. Nháy phải chuột lên một điểm trên đường đồ thị, chọn Add TrendLine... Lê Viết Mẫn - lvman@hce.edu.vn 28 Phân tích hồi quy và dự báo Wednesday, May 8, 13 Format TrendLine Các kiểu đường xu thế Hàm tuyến tính Hàm e mũ Hàm log Hàm đa thức (có thể xác định bậc đa thức) Hàm mũ Đặt tên cho đường xu thế Cho hiển thị phương trình Thiết lập hệ số góc và giá trị R2 trên đồ thị Lê Viết Mẫn - lvman@hce.edu.vn 29 Phân tích hồi quy và dự báo Wednesday, May 8, 13 Đường xu thế Lê Viết Mẫn - lvman@hce.edu.vn 30 Phân tích hồi quy và dự báo Wednesday, May 8, 13 Dự báo Lê Viết Mẫn - lvman@hce.edu.vn 31 Phân tích hồi quy và dự báo Wednesday, May 8, 13 Dự báo • Dự báo là phán đoán những sự kiện sẽ xảy ra trong tương lai trên cơ sở phân tích khoa học các dữ liệu của quá khứ và hiện tại nhờ một số mô hình toán học • Theo tầm của dự báo • Dự báo dài hạn • Dự báo trung hạn • Dự báo ngắn hạn • Theo kết quả • Dự báo định tính • Dự báo định lượng • Dự báo dựa trên hàm hồi qui tương quan Lê Viết Mẫn - lvman@hce.edu.vn 32 Phân tích hồi quy và dự báo Wednesday, May 8, 13 Dự báo nhờ hàm hồi quy • Sau khi xác định được mô hình hồi qui, người ta thay các giá trị của các biến độc lập vào phương trình hồi qui để dự báo • Ví dụ : dự báo số xe bán được khi giá xăng là 2$/gallon và dân số tăng 70 nghìn Phương trình hồi quy sau khi đã kiểm định y = 57.41x1 + 0.53x2 Thay các giá trị x 1 = 2 , x 2 = 70 vào phương trình Kết quả y = 152.17 Lê Viết Mẫn - lvman@hce.edu.vn 33 Phân tích hồi quy và dự báo Wednesday, May 8, 13 Dự báo nhờ đường xu thế • Sau khi xác định được phương trình của đường xu thế, chúng ta gán giá trị thời gian vào các biến X để tính được giá trị dự báo của biến Y • Ví dụ : dự báo đầu tư cho công nghiệp năm 2014 Phương trình đường xu thế y = −7.6675x4 + 250.15x3 − 2343.5x2 + 9410.6x +18012 Thay giá trị x = 20 vào phương trình trên Kết quả y = 43224 Lê Viết Mẫn - lvman@hce.edu.vn 34 Phân tích hồi quy và dự báo Wednesday, May 8, 13 FORECAST • Chức năng : dự báo theo phương pháp hồi quy tuyến tính đơn • Cú pháp FORECAST (x, known_y’s, known_x’s) Lê Viết Mẫn - lvman@hce.edu.vn 35 Phân tích hồi quy và dự báo Wednesday, May 8, 13 TREND • Chức năng : dự báo theo phương pháp hồi qui tuyến tính bội • Cú pháp TREND (known_y’s, known_x’s, new_x, [const]) Lê Viết Mẫn - lvman@hce.edu.vn 36 Phân tích hồi quy và dự báo Wednesday, May 8, 13 GROWTH • Chức năng : dự báo theo hàm mũ • Cú pháp GROWTH (known_y’s, known_x’s, new_x, [const]) Lê Viết Mẫn - lvman@hce.edu.vn 37 Phân tích hồi quy và dự báo Wednesday, May 8, 13 Cảm ơn sự chú ý Câu hỏi ? Lê Viết Mẫn - lvman@hce.edu.vn 38 Phân tích hồi quy và dự báo Wednesday, May 8, 13
File đính kèm:
- bai_giang_tin_hoc_ung_dung_chuong_phan_tich_hoi_quy_tuong_qu.pdf