Bài giảng Nhập môn Công nghệ thông tin 1 - Chương 3: Kiến thức cơ sở

Tổng quan thông tin

 Hệ thống đếm

 Biễu diễn thông tin trong máy tính

 Hệ thống mã hoá

 Hệ thống tập tin (theo góc nhìn lập trình)

Bài giảng Nhập môn Công nghệ thông tin 1 - Chương 3: Kiến thức cơ sở trang 1

Trang 1

Bài giảng Nhập môn Công nghệ thông tin 1 - Chương 3: Kiến thức cơ sở trang 2

Trang 2

Bài giảng Nhập môn Công nghệ thông tin 1 - Chương 3: Kiến thức cơ sở trang 3

Trang 3

Bài giảng Nhập môn Công nghệ thông tin 1 - Chương 3: Kiến thức cơ sở trang 4

Trang 4

Bài giảng Nhập môn Công nghệ thông tin 1 - Chương 3: Kiến thức cơ sở trang 5

Trang 5

Bài giảng Nhập môn Công nghệ thông tin 1 - Chương 3: Kiến thức cơ sở trang 6

Trang 6

Bài giảng Nhập môn Công nghệ thông tin 1 - Chương 3: Kiến thức cơ sở trang 7

Trang 7

Bài giảng Nhập môn Công nghệ thông tin 1 - Chương 3: Kiến thức cơ sở trang 8

Trang 8

Bài giảng Nhập môn Công nghệ thông tin 1 - Chương 3: Kiến thức cơ sở trang 9

Trang 9

Bài giảng Nhập môn Công nghệ thông tin 1 - Chương 3: Kiến thức cơ sở trang 10

Trang 10

Tải về để xem bản đầy đủ

pdf 59 trang xuanhieu 7580
Bạn đang xem 10 trang mẫu của tài liệu "Bài giảng Nhập môn Công nghệ thông tin 1 - Chương 3: Kiến thức cơ sở", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài giảng Nhập môn Công nghệ thông tin 1 - Chương 3: Kiến thức cơ sở

Bài giảng Nhập môn Công nghệ thông tin 1 - Chương 3: Kiến thức cơ sở
Nhập môn Công nghệ thông tin 1
 Tổng quan thông tin
 Hệ thống đếm
 Biễu diễn thông tin trong máy tính
 Hệ thống mã hoá
 Hệ thống tập tin (theo góc nhìn lập trình)
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 2
• Khái niệm
 – Thông tin là tất cả những gì đem lại sự hiểu
 biết về thế giới xung quanh (sự vật, hiện
 tượng .) và về chính con người.
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 4
• Dữ liệu
 – Là hình thức thể hiện của thông tin trong mục
 đích lưu trữ và xử lý nhất định.
• Tri thức
 – Có ý nghĩa khái quát hơn thông tin. 
 – Tri thức là mục đích của nhận thức trên cơ sở
 tiếp nhận thông tin.
 – Quá trình xử lý thông tin chính là quá trình
 nhận thức để có tri thức.
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 5
• Khái niệm
• Hệ đếm cơ số 10
• Hệ đếm cơ số bất kì
• Hệ đếm cơ số 2
• Hệ đếm cơ số 16
• Hệ đếm cơ số 8
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 7
• Khái niệm
 – Hệ thống đếm là tập hợp các kí hiệu và quy
 tắc để biểu diễn và xác định giá trị các số.
 – Mỗi hệ đếm có 1 số kí tự hữu hạn. Tổng số kí
 tự của mỗi hệ đếm được gọi là cơ số (base 
 hay radix), kí hiệu là b.
 – Ví dụ: 
 • Hệ đếm cơ số 10: 10 kí số: 0 1 2 3 4 5 6 7 8 9
 • 2112 là 1 số trong hệ 10
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 8
• Hệ đếm cơ số 10:
 – Gồm 10 kí số: 0 1 2 3 4 5 6 7 8 9
 – Ví dụ:
 21.12 = 2*101 + 1*100 + 1*10-1 + 2*10-2
 21.12 = 2*10 + 1*1 + 1*1/10 + 2*1/100
 21.12 = 20 + 1 + 0.1 + 0.02 = 21.12
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 9
• Tổng quát
 – Có b kí tự để thể hiện giá trị số. Kí tự nhỏ
 nhất là 0, lớn nhất là b-1.
 – Số N(b) trong hệ đếm cơ số b được biểu diễn
 như sau:
 N(b) = anan-1a0a-1a-m
 và có giá trị:
 n n-1 1 0
 N(b) = anb + an-1b +  + a1b + a0b
 -1 -m
 .a-1b +  + a-mb
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 10
• Trong đó
 – b là cơ sở của biểu diễn, b N, b ≥ 2.
 – ai là các ký số và ai N, 0 i n, 0 ai < b.
 – Cách viết trên được gọi là biểu diễn cơ sở b 
 của a.
 – Chiều dài của biểu diễn bằng n + 1.
 – Nếu có số lẻ thì vị trí đầu tiên sau dấu phẩy là
 -1, các vị trí tiếp theo là -2, -3, 
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 11
• Gồm 2 kí số: 0 1
• Ví dụ:
 3 2 1 0 -1 -2
 1010.112=1*2 +0*2 +1*2 +0*2 +1*2 +1*2
 = 8+0+2+0+0.5+0.25=10.7510
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 12
• Các phép toán
 – Phép cộng
 – Phép trừ
 – Phép nhân
 – Phép chia
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 13
• Phép cộng
 – Cộng có nhớ các cặp số cùng vị trí từ phải
 sang trái
 – Bảng cộng Ví dụ:
 + 0 1 1 1 1 0
 +
 0 0 1 1 0 0 0
 1 1 10 1 0 1 1 0
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 14
• Phép trừ
 – Số bù 1: đảo tất cả các bit của 1 số nhị phân ta được
 số bù 1 của nó.
 – Số bù 2: lấy số bù 1 cộng 1 ta được số bù 2 của số
 nhị phân ban đầu.
 – Ví dụ: x = 1010
 – Số bù 1 của x: 0101
 – Số bù 2 của x: 0110
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 15
• Phép trừ
 – Cho 2 số nhị phân x và y, phép trừ:
 x - y  x + số bù 2 của y
 – Ví dụ: x = 1010, y = 0101
 • Số bù 1 của y: 1010
 • Số bù 2 của y: 1011 (y2)
 • x - y=x + y2 = 1010 + 1011 = 0101
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 16
• Phép nhân: nhân từ phải qua trái theo cách 
 nhân tay thông thường.
 – Bảng nhân Ví dụ:
 x 0 1 1 0 1 1
 x
 0 0 0 1 0
 1 0 1 0 0 0 0
 1 0 1 1
 1 0 1 1 0
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 17
• Phép chia: trong hệ nhị phân thực hiện tương 
 tư như phép chia trong hệ cơ số 10.
• Ví dụ: 1 1 1 0 1 1 0 1
 1 0 1 1 0 1
 0 1 0 0
 0 0 0
 1 0 0 1
 1 0 1
 1 0 0 Số dư
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 18
• Gồm 16 kí số: 0 1 2 3 4 5 6 7 8 9 A B C D E F
• Ví dụ:
 3F.2 = 3 x 161 + 15 x 160 + 2 x 16-1
 =48 + 15 + 0.125
 =63.12510
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 19
• Các phép toán: được thực hiện tương tự 
 như ở hệ thập phân.
• (Xem tài liệu để tham khảo thêm)
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 20
• Gồm 8 kí số: 0 1 2 3 4 5 6
• Ví dụ:
 1 0 -1 -2
 21.218 = 2 x 8 + 1 x 8 + 2x8 + 1x8
 = 16 + 1 + 0.125 + 0.015625
 =18.14062510
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 21
• Các phép toán: được thực hiện tương tự 
 như ở hệ thập phân.
• (Xem tài liệu để tham khảo thêm.)
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 22
• Đặc điểm:
 – Con người sử dụng hệ thập phân.
 – Máy tính sử dụng hệ nhị phân, bát phân và
 thập lục phân.
• Nhu cầu: 
 – Chuyển đổi qua lại giữa các hệ đếm. 
 – Hệ đếm cơ số 10 sang cơ số 2.
 – Hệ đếm cơ số 16 sang cơ số 10.
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 23
• Cách 1
 – Khai triển biểu diễn và tính giá trị biểu thức.
 – Ví dụ:
 3 2 1 0 -1
 1011.012 = 1x2 + 0x2 + 1x2 + 1x2 + 0x2
 + 1x2-2
 1011.0= 8 + 0 + 2 + 1 + 0 + 0.25 = 11.2510
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 24
• Cách 2
 – Nhân chia lồng nhau.
 – Ví dụ:
 1011.012 = ((1x2 + 0)x2 + 1)x2 + 1 + (1/2 + 
 0)/2
 1011.012 = 11 + 0.25 = 11.2510
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 25
• Đổi phần nguyên
 – Chia phần nguyên của cho b và tiếp tục lấy phần
 nguyên của kết quả chia cho b.
 – Thực hiện cho đến khi thương của phép chia là 0
 – Dãy các số dư ở mỗi lần chia là a0, a1, ..., an.
 – Phần nguyên của số hệ cở sở b là (ana1a0).
• Đổi phần thực
 – Nhân phần lẻ cho b và tiếp tục lấy phần lẻ của kết
 quả nhân cho b. Tiếp tục cho tới khi nào phần lẻ của
 tích là 0.
 – Dãy các số nguyên ở mỗi lần nhân là a-1, a-2, , a-m
 tạo thành phần lẻ ở hệ cơ sở b.
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 26
• Ví dụ: đổi 21.12510 sang hệ nhị phân (b = 2)
 Đổi phần nguyên Đổi phần lẻ
 21 2 0.125 x 2 = 0.25
 0.25 x 2 = 0.5
 1 10 2 0.5 x 2 = 1.0
 0 5 2
 1 2 2
 0 1 2
 1 0
 Kết quả: 21.125= 10101.001
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 27
• Từ hệ nhị phân sang hệ thập lục phân
 – Nhóm từng bộ 4 bit trong biểu diễn nhị phân 
 rồi chuyển sang kí số tương ứng trong hệ 
 thập lục phân.
 – Bảng chuyển đổi:
 16 2 16 2 16 2 16 2
 0 0000 4 0100 8 1000 C 1100
 1 0001 5 0101 9 1001 D 1101
 2 0010 6 0110 A 1010 E 1110
 3 0011 7 0111 B 1011 F 1111
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 28
• Từ hệ nhị phân sang hệ bát phân:
 – Nhóm từng bộ 3 bit trong biểu diễn nhị phân 
 rồi chuyển sang kí số tương ứng trong hệ bát 
 phân.
 – Bảng chuyển đổi:
 8 2 8 2
 0 000 4 100
 1 001 5 101
 2 010 6 110
 3 011 7 111
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 29
• Số học nhị phân sử dụng hai ký số 0 và 1.
• bit (Binary Digit): Đơn vị chứa thông tin 
 nhỏ nhất.
• Được lưu trong các thanh ghi hoặc trong 
 các ô nhớ.
• Thanh ghi hoặc ô nhớ có kích thước 1 
 byte (8 bit) hoặc 1 word (16 bit)
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 31
 0
 1 bit 2
 1 0
 2 bit 22
 2 1 0
 3 bit 23
 n-1 5 4 3 2 1 0
 n bit  2n
 0000 1111 = 2n – 1
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 32
• Các đơn vị đo thông tin lớn hơn:
 Tên gọi Ký hiệu Giá trị
 Byte B 8 bit
 KiloByte KB 210 B = 1024 Byte
 MegaByte MB 210 KB = 220 Byte
 GigaByte GB 210 MB = 230 Byte
 TeraByte TB 210 GB = 240 Byte
 Peta PB 210 TB = 250 Byte
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 33
• Đặc điểm
 – Biểu diễn các đại lương luôn dương.
 – Ví dụ: chiều cao, cân nặng, mã ASCII
 – Tất cả bit được sử dụng để biểu diễn giá trị.
 – Số nguyên không dấu 1 byte lớn nhất là 
 8
 1111 11112 = 2 – 1 = 25510.
 – Số nguyên không dấu 1 word lớn nhất là 
 16
 1111 1111 1111 11112 = 2 – 1 = 6553510.
 – Tùy nhu cầu có thể sử dụng số 2, 3 word.
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 34
• Đặc điểm
 – Lưu các số dương hoặc âm.
 – Bit cao nhất dùng để biểu diễn dấu
 – Ví dụ đối với số nguyên sử dụng 8 bit lưu trữ
 (gọi tắt là số nguyên 8 bits)
 • 0 biểu diễn số dương. VD: 0101 0011
 • 1 biểu diễn số âm. VD: 1101 0011
 – Số âm trong máy được biểu diễn ở dạng số
 bù 2.
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 35
 Số 5 (1 byte) 0 0 0 0 0 1 0 1
 Số bù 1 của 5 1 1 1 1 1 0 1 0
 + 1
 Số bù 2 của 5 1 1 1 1 1 0 1 1
 + Số 5 0 0 0 0 0 1 0 1
 Kết quả 1 0 0 0 0 0 0 0 0
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 36
• Nhận xét
 – Số bù 2 của x cộng với x là một dãy toàn bit 0 
 (không tính bit 1 cao nhất do vượt quá phạm 
 vi lưu trữ). Do đó số bù 2 của x chính là giá 
 trị âm của x hay – x.
 – Đổi số thập phân âm –5 sang nhị phân?
 => Đổi 5 sang nhị phân rồi lấy số bù 2 của nó.
 – Thực hiện phép toán a – b?
 a – b = a + (–b) => Cộng với số bù 2 của b
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 37
• Tính giá trị không dấu và có dấu của 1 số?
 – Ví dụ số word (16 bit): 1100 1100 1111 0000
 – Số nguyên không dấu ?
 • Tất cả 16 bit lưu giá trị.
 • => giá trị là 52464.
 – Số nguyên có dấu ?
 • Bit cao nhất = 1 do đó số này là số âm.
 => độ lớn là giá trị của số bù 2.
 • Số bù 2 = 0011 0011 0001 0000 = 13072.
 => giá trị là –13072.
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 38
• Sử dụng dấu chấm động (floating-point).
• Ví dụ: 
 – Số thực hệ 10: -123.4d = -12.34 x 101 =
 -1.234 x 102 = -0.1234 x 103
• Biểu diễn khoa học: -1.234 x 102
• Chia làm 3 phần:
 – 1 bit để biểu diễn dấu.
 – Một chuỗi bit để biểu diễn số mũ.
 – Một chuỗi bit để biểu diễn phần định trị
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 39
• Với ví dụ trên: -1.234 x 102
 – Bit biểu diễn dấu là 1 (ứng với giá trị âm)
 – Biểu diễn số mũ là 2
 – Biểu diễn phần trị là 1234
 • Quy ước bên trái dấu chấm là 1 ký số khác không
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 40
• Lưu trữ và xử lý: bit ~ số
• Hiển thị văn bản: ký tự # số
 Cần phải có bảng mã, làm nhiệm vụ
 quy ước sự tương ứng giữa giá trị số và
 giá trị ký tự.
• Bảng mã thông dụng: ASCII và Unicode.
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 42
• American Standard Code for Information
 Interchange.
• ASCII được công bố làm tiêu chuẩn lần
 đầu vào năm 1963.
• Là bộ mã ký tự dựa trên bảng chữ cái
 tiếng Latinh (‘a’– ‘z’, ‘A’ – ‘Z’).
• Ban đầu, bảng mã ASCII chứa 128 mô tả
 cặp ký tự và số.
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 43
• Ký tự in được
 – ‘ ’ (khoảng trắng): 32 (0x20)
 – ‘0’ -> ‘9’: 48 (0x30) -> 57 (0x39)
 – ‘A’ -> ‘Z’: 65 (0x41) -> 90 (0x5A)
 – ‘a’ -> ‘z’: 97 (0x61) -> 122 (0x7A)
• Ký tự điều khiển
 – ký tự rỗng: 0
 – ‘ ’ (tab): 9
 – ký tự xuống dòng: 10
 – ký tự về đầu dòng: 13
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 44
• Bảng mã ASCII mở rộng chứa 256 mô tả
 cặp ký tự số.
 – 128 ký tự đầu giống ASCII ban đầu.
 – 128 ký tự sau bao gồm 1 số ký hiệu tiếng Hy
 Lạp (‘α’, ‘β’, ‘π’, ), các biểu diễn tiền tệ (‘£’,
 ‘¥’, ), 
• Bảng mã ASCII không thể biểu diễn các ký
 tự của các ngôn ngữ khác như tiếng Việt
 (có dấu), Nga, Nhật, 
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 45
• Unicode là bộ mã chuẩn quốc tế được
 thiết kế để dùng làm bộ mã duy nhất cho
 tất cả các ngôn ngữ khác nhau trên thế
 giới.
• Hiện tại, mã unicode có 1.114.112 mã
 (code points), được chia thành 17 miền,
 mỗi miền có 65535 (216) mã.
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 46
• Có nhiều cách biểu diễn mã unicode tùy
 theo kích thước lưu trữ mỗi phần tử mã
 (code point)
 – UTF – 8: sử dụng từ 1 -> 4 Byte.
 – UTF – 16: sử dụng 2 Byte.
 – UTF – 32: sử dụng 4 Byte.
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 47
• Trong bảng mã unicode, có phần mã dành 
 riêng tương ứng với những ký tự tiếng 
 Việt.
• Bảng mã unicode các ký tự tiếng Việt 
 /v3.htm
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 48
• Mỗi bộ mã có nhiều cách hiển thị.
• Font thực hiện chức năng ánh xạ giá trị
 mã unicode với hình [ký tự] hiển thị tương
 ứng.
• Các font hỗ trợ unicode (có tiếng Việt) phổ
 biến:
 – Times New Roman, 
 – Arial, 
 – Tahoma, 
 – 
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 49
• Tập tin văn bản thô
• Tập tin nhị phân
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 51
• Thường dùng để chỉ tập tin văn bản có
 cấu trúc đơn giản và thông dụng, có thể
 xem nội dung và sửa chữa bằng các lệnh
 của hệ điều hành hay chương trình soạn
 thảo đơn giản.
• Không có header – phần thông tin nằm ở 
 đầu tập tin, mô tả cấu trúc dữ liệu của tập
 tin sau phần header.
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 52
• *.txt
• *.cpp
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 53
• Tập tin theo cấu trúc ANSI text (hay ASCII 
 text): chứa các ký tự (mã từ) trong bảng
 mã ASCII.
• Đôi khi tập tin văn bản được tổ chức theo
 quy ước để phục vụ 1 mục đích xác định: 
 gọi là tập tin văn bản được cấu trúc hóa.
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 54
• Ví dụ: Cần lưu trữ nội dung ma trận có 3 
 dòng 4 cột
 – Dòng đầu cho biết số dòng, số cột.
 – 3 dòng tiếp theo mỗi dòng 4 giá trị: nội dung 
 ma trận.
• Các loại tập tin văn bản cấu trúc thông
 dụng hiện tại: 
 – *.RTF
 – *.HTML
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 55
• Văn bản thô ANSI text dựa trên cơ sở các
 ký tự 8-bit (256 ký hiệu).
 Bất tiện khi lưu văn bản của nhiều
 ngôn ngữ
 Văn bản thô dạng mở rộng cho phép
 lưu trữ được nhiều ngôn ngữ
 – Unicode text (lưu ký tự UTF-16)
 – UTF-8 text
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 56
• Đa số tập tin nhị phân được cấu trúc hóa
 theo một quy ước nào đó.
• Thường có phần header: chứa thông tin
 mô tả sự bố trí và mối liên hệ của các byte
 dữ liệu ở phía sau.
• Mở bằng các công cụ (phần mềm) chuyên
 dụng.
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 57
• Tập tin mã thực thi:
 – *.EXE, *.COM, *.DLL trên Windows
• Tập tin văn bản tích hợp dữ liệu văn bản,
 hình ảnh, bảng biểu
 – *.DOC của MS Word hay Open Office
• Tập tin multimedia
 – Ảnh: *.bmp, *.jpg, 
 – Âm thanh: *.wav, *.mp3, 
 – Video: *.avi, *.mp4, 
8/20/2019 Khoa CNTT - ĐH Khoa học Tự nhiên 58

File đính kèm:

  • pdfbai_giang_nhap_mon_cong_nghe_thong_tin_1_chuong_3_kien_thuc.pdf