Bài giảng Phân tích dữ liệu với SPSS - Chương I: Phân loại dữ liệu, mã hóa, nhập liệu và một số xử lý trên biến - Nguyễn Thị Phương Giang

NỘI DUNG

• Phân loại dữ liệu

• Các loại thang đo

• Nguyên tắc mã hóa và nhập liệu

• Cửa sổ làm việc của SPSS

• Tạo tập tin dữ liệu trong SPSS

• Một số xử lý trên biến

• Thay đổi một số mặc định

• Tiếng việt trong SPSS

Bài giảng Phân tích dữ liệu với SPSS - Chương I: Phân loại dữ liệu, mã hóa, nhập liệu và một số xử lý trên biến - Nguyễn Thị Phương Giang trang 1

Trang 1

Bài giảng Phân tích dữ liệu với SPSS - Chương I: Phân loại dữ liệu, mã hóa, nhập liệu và một số xử lý trên biến - Nguyễn Thị Phương Giang trang 2

Trang 2

Bài giảng Phân tích dữ liệu với SPSS - Chương I: Phân loại dữ liệu, mã hóa, nhập liệu và một số xử lý trên biến - Nguyễn Thị Phương Giang trang 3

Trang 3

Bài giảng Phân tích dữ liệu với SPSS - Chương I: Phân loại dữ liệu, mã hóa, nhập liệu và một số xử lý trên biến - Nguyễn Thị Phương Giang trang 4

Trang 4

Bài giảng Phân tích dữ liệu với SPSS - Chương I: Phân loại dữ liệu, mã hóa, nhập liệu và một số xử lý trên biến - Nguyễn Thị Phương Giang trang 5

Trang 5

Bài giảng Phân tích dữ liệu với SPSS - Chương I: Phân loại dữ liệu, mã hóa, nhập liệu và một số xử lý trên biến - Nguyễn Thị Phương Giang trang 6

Trang 6

Bài giảng Phân tích dữ liệu với SPSS - Chương I: Phân loại dữ liệu, mã hóa, nhập liệu và một số xử lý trên biến - Nguyễn Thị Phương Giang trang 7

Trang 7

Bài giảng Phân tích dữ liệu với SPSS - Chương I: Phân loại dữ liệu, mã hóa, nhập liệu và một số xử lý trên biến - Nguyễn Thị Phương Giang trang 8

Trang 8

Bài giảng Phân tích dữ liệu với SPSS - Chương I: Phân loại dữ liệu, mã hóa, nhập liệu và một số xử lý trên biến - Nguyễn Thị Phương Giang trang 9

Trang 9

Bài giảng Phân tích dữ liệu với SPSS - Chương I: Phân loại dữ liệu, mã hóa, nhập liệu và một số xử lý trên biến - Nguyễn Thị Phương Giang trang 10

Trang 10

pdf 10 trang xuanhieu 5580
Bạn đang xem tài liệu "Bài giảng Phân tích dữ liệu với SPSS - Chương I: Phân loại dữ liệu, mã hóa, nhập liệu và một số xử lý trên biến - Nguyễn Thị Phương Giang", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài giảng Phân tích dữ liệu với SPSS - Chương I: Phân loại dữ liệu, mã hóa, nhập liệu và một số xử lý trên biến - Nguyễn Thị Phương Giang

Bài giảng Phân tích dữ liệu với SPSS - Chương I: Phân loại dữ liệu, mã hóa, nhập liệu và một số xử lý trên biến - Nguyễn Thị Phương Giang
1
Chương I
PHÂN LOẠI DỮ LIỆU, MÃ HÓA, NHẬP 
LIỆU VÀ MỘT SỐ XỬ LÝ TRÊN BIẾN
Biên soạn: TS. NGUYỄN THỊ PHƯƠNG GIANG
Phone: 0944.822.211
E-Mail: nguyenthiphuonggiang@iuh.edu.vn
02/08/2017 2
NỘI DUNG
• Phân loại dữ liệu
• Các loại thang đo
• Nguyên tắc mã hóa và nhập liệu
• Cửa sổ làm việc của SPSS
• Tạo tập tin dữ liệu trong SPSS
• Một số xử lý trên biến
• Thay đổi một số mặc định
• Tiếng việt trong SPSS
02/08/2017 3
Phân loại Dữ liệu
• Dữ liệu định tính: Phản ánh tính chất, sự 
hơn kém, không tính được trị trung bình.
• Ví dụ: Giới tính, kết quả học tập.
• Dữ liệu định lượng: Phản ánh mức độ hơn 
kém, được thể hiện bằng các con số nên 
tính được giá trị trung bình. Các con số 
thu thập có thể ở dạng liên tục hay rời rạc.
2
02/08/2017 4
Các loại thang đo
• Thang đo danh nghĩa (Nominal scale): 
Trong thang đo này, các con số chỉ dùng 
để phân loại các đối tượng.
• Những phép toán thống kê có thể sử dụng 
được là: đếm, tính tần suất của một biểu 
hiện nào đó
02/08/2017 5
Các loại thang đo
• Thang đo thứ bậc (Ordinal scale): Các con 
số trong thang đo danh nghĩa được sắp 
xếp theo một qui thứ bậc.
Ví dụ: Bạn hài lòng như thế nào về mùi của 
sản phẩm Snack Khoai tây chiên mà bạn 
vừa dùng thử? (Hài lòng, bình thường, 
không hài lòng)
02/08/2017 6
Các loại thang đo
• Thang đo khoảng (Interval scale): Là dạng 
đặc biệt của thang đo thứ bậc vì nó cho 
biết được khoảng cách giữa các thứ bậc.
Thông thường thang đo khoảng có dạng là 
một dãy các chữ số liên tục và đều đặn từ 
1 đến 5, từ 1 đến 7 hay từ 1 đến 10,
Dãy số này có 2 cực ở hai đầu thể hiện 2 
trạng thái đối nghịch nhau.
3
02/08/2017 7
Các loại thang đo
• Thang đo tỉ lệ (Ratio scale): có tất cả các 
đặc tính khoảng cách và thứ tự của thang 
đo khoảng, ngoài ra điểm không trong 
thang đo khoảng là một giá trị thật nên có 
thể thực hiện được phép chia để tính tỉ lệ.
Thang đo khoảng và thang đo tỉ lệ có thể đo 
lường nên SPSS gộp chung hai loại thang 
đo này thành thang đo mức độ (Scale 
Measures).
02/08/2017 8
Nguyên tắc Mã hóa – Nhập liệu
Giới tính Tuổi Nghề nghiệp
1 Nữ 21 Sinh viên
2 Nữ 32 Nhân viên văn phòng
3 Nam 53 Về hưu
n Nam 42 Nghề khác
02/08/2017 9
Nguyên tắc Mã hóa –
Nhập liệu
Giới tính Tuổi Nghề nghiệp
1 2 21 10
2 2 32 3
3 1 53 11
n 1 42 14
4
02/08/2017 10
Nguyên tắc Mã hóa –
Nhập liệu
• Phần lớn mỗi biến tương ứng với một câu 
hỏi cụ thể trong bản trả lời. Như thế ta chỉ 
cần tạo 1 biến.
• Trường hợp câu hỏi có thể chọn nhiều trả 
lời thì chúng ta phải có nhiều con số để 
nhập nên cần phải có nhiều ô để nhập.
• Qui tắc nhập liệu: Từ trái qua phải (theo 
từng dòng) và từ trên xuống (sang dòng)
02/08/2017 11
Cửa sổ làm việc của SPSS
• Khởi động
- Click biểu chương trình trên thanh công cụ
- Từ Menu Start, chọn Program, chọn SPSS
• Nội dung của Menu
- File: xử lý File
- Edit: chỉnh sửa
- View: Hiển thị
02/08/2017 12
Cửa sổ làm việc của SPSS
- Data: các công tác liên quan đến dữ liệu
- Transform: Chuyển đổi dữ liệu, tính toán, 
mã hóa lại các biến.
- Analyze: Thực hiện các thủ tục thống kê
- Graphs: Tạo biểu đồ, đồ thị
- Windows: Sắp xếp các cửa sổ làm việc 
trong SPSS.
5
02/08/2017 13
Tạo tập tin dữ liệu trong 
SPSS for Windows
• Khai báo biến:
- Click Variable view.
- Khai báo biến trên từng dòng, nội dung 
của dòng là các thuộc tính của biến.
- Name: Tên biến
- Type: Kiểu biến
- Width: Độ rộng của biến
02/08/2017 14
Tạo tập tin dữ liệu trong 
SPSS for Windows
- Decimals: Số số lẻ
- Label: Nhãn biến
- Value: Mã hóa cho các giá trị định tính
- Missing: Khai báo các loại giá trị khuyết
- Column: Độ rộng của biến khi nhập liệu
- Align: Vị trí dữ liệu trong cột
- Measure: Chọn loại thang đo
02/08/2017 15
Tạo tập tin dữ liệu trong 
SPSS for Windows
• Lưu tập tin dữ liệu:
- Menu File, chọn Save.
- Save in: chọn nơi lưu
- File name: Đặt tên file (chỉ đặt tên chính)
- Click nút Save
Mặc định kiểu tập tin là sav
6
02/08/2017 16
Một số xử lý trên biến
• Mã hóa lại biến (Recode):
Sử dụng khi cần giảm số biểu hiện của một 
biến định tính.
Hoặc muốn chuyển biến định lượng thành 
biến định tính
- Qui trình thực hiện:
- Menu Transform > Recode into Different 
Variables (tạo biến mới) hoặc Recode into 
Same Variables (thay biến cũ)
02/08/2017 17
Một số xử lý trên biến
- Chọn biến muốn Recode
- Đặt lại Name và Label, Click Change
- Click Old and New Values để xác định sự 
chuyển đổi.
- Click Continue và OK để thực hiện lệnh.
02/08/2017 18
Một số xử lý trên biến
• Chuyển biến dạng Category thành biến 
dạng Dichotomy:
Biến dạng Category có nhiều trị số mã hóa 
tượng trưng cho nhiều trạng thái.
Biến Dichotomy là biến phân loại chỉ có 2 trị 
số mã hóa tượng trưng cho 2 trạng thái 
khác nhau (có hoặc không)
7
02/08/2017 19
Một số xử lý trên biến
• Cách thực hiện:
– Menu transform, chọn Count
– Target Variable: Khai báo tên biến cần tạo
– Target Label: Khai báo nhãn
– Đưa các biến cần chuyển vào Numeric Var
– Click Define Values mở hộp thoại
– Nhận 7 vào ô Value
– Click Continue và OK
02/08/2017 20
Tùy chọn của chương 
trình
• Menu Edit, chọn Options:
– Measurement System: Thay đổi đơn vị
– Variable list: Thay đổi cách thể hiện
– Pivot Table: Chọn cách thể hiện bảng kết quả
– File Location: Chọn nơi lưu trữ và mở file dữ 
liệu
– Viewer: Chọn font hiển thị kết quả
02/08/2017 21
Câu hỏi ôn tập 
1. Hãy cho biết các loại dữ liệu và các 
loại thang đo?
2. Nguyên tắc mã hóa và nhập liệu
3. Trình bày cách tạo tập tin dữ liệu 
trong SPSS For Windows.
4. Qui trình thực hiện việc mã hóa lại 
biến (Recode)
5. Chuyển Category thành Dichotomy
8
CHƯƠNG II
LÀM SẠCH DỮ LIỆU
NỘI DUNG
 Sự cần thiết
 Các biện pháp ngăn ngừa
 Các phương pháp làm sạch dữ liệu
Sự cần thiết
Dữ liệu sau khi nhập xong chưa thể đưa vào xử lý và 
phân tích vì:
 Chất lượng của phỏng vấn và đọc soát (hiểu sai, thu 
thập sai, chọn sai đối tượng, trả lời sai ý, người đọc 
soát chưa phát hiện,)
 Nhập dữ liệu (sai, sót, thừa)
9
Các biện pháp ngăn ngừa
 Thiết kế bản câu hỏi rõ ràng, dễ hỏi, dễ trả lời.
 Chọn lọc và huấn luyện phỏng vấn viên kỹ lưỡng.
 Sau khi phỏng vấn, bản câu hỏi phải được đọc soát 
trước khi nhập.
 Việc mã hóa phải được tiến hành tập trung với một số 
ít cá nhân phụ trách.
Các phương pháp làm sạch dữ liệu
 Dùng bảng tần số
- Lập bảng tần số cho tất cả các biến, đọc và rà soát các 
giá trị lạ. Sau đó dùng lệnh FIND để tìm lỗi.
 Cách thực hiện
- Trong Data View, chọn cột có giá trị lỗi
- Vào Menu Edit > Find
- Nhập vào giá trị lỗi
- Truy ngược lại số thứ tự của hàng để biết được bản 
câu hỏi tương ứng.
Các phương pháp làm sạch dữ liệu
 Dùng bảng phối hợp hai hay ba biến
- Lập bảng tần số cho tất cả các biến, đọc và rà soát các 
giá trị lạ. Sau đó dùng lệnh FIND để tìm lỗi.
 Cách thực hiện
- Trong Data View, chọn cột có giá trị lỗi
- Vào Menu Edit > Find
- Nhập vào giá trị lỗi
- Truy ngược lại số thứ tự của hàng để biết được bản 
câu hỏi tương ứng.
- Vào Data > Sort Case để sắp xếp biến filter_$
10
Các phương pháp làm sạch dữ liệu
 Cách tìm lỗi đơn giản ngay trên cửa sổ dữ liệu
- Sử dụng lệnh Data > Sort Case để tìm lỗi đơn giản 
cho các biến giới tính.
Câu hỏi ôn tập
 Sự cần thiết phải làm sạch dữ liệu.
 Các biện pháp ngăn ngừa lỗi cho dữ liệu
 Trình bày các phương pháp làm sạch dữ 
liệu từ đơn giản đến phức tạp.
30
CHƯƠNG III
TÓM TẮT VÀ TRÌNH BÀY 
DỮ LIỆU

File đính kèm:

  • pdfbai_giang_phan_tich_du_lieu_voi_spss_chuong_i_phan_loai_du_l.pdf