Bài giảng Kiến trúc máy tính - Chương 2: Lịch sử phát triển của máy tính - Nguyễn Hằng Phương
NỘI DUNG
1. Lịch sử phát triển của Máy tính
Thế hệ đầu tiên: ống chân không
Thế hệ thứ hai: Transitor
Thế hệ thứ ba: mạch tích hợp
Các thế hệ tiếp theo
2. Thiết kế hiệu suất
Tốc độ vi xử lý
Cân bằng Hiệu suất
Cải tiến trong Tổ chức và Kiến trúc Chip
3. Đa lõi, MICs và GPGPUs
4. Sự phát triển của kiến trúc Intel x86
5. Hệ thống nhúng và ARM
6. Đánh giá hiệu suất
Tốc độ đồng hồ và số lệnh trên giây
Tiêu chuẩn
Luật Amdahl
Luật Little
Trang 1
Trang 2
Trang 3
Trang 4
Trang 5
Trang 6
Trang 7
Trang 8
Trang 9
Trang 10
Tải về để xem bản đầy đủ
Bạn đang xem 10 trang mẫu của tài liệu "Bài giảng Kiến trúc máy tính - Chương 2: Lịch sử phát triển của máy tính - Nguyễn Hằng Phương", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Bài giảng Kiến trúc máy tính - Chương 2: Lịch sử phát triển của máy tính - Nguyễn Hằng Phương
được Tốc độ nhanh hơn lõi bằng đơn lõi nhớ 1974, giá 1 bit của bộ nhớ bán dẫn thấp hơn giá của bộ nhớ lõi Giá bộ nhớ tiếp tục giảm mạnh khi mật độ bộ Sự phát triển công nghệ bộ nhớ và xử lý làm nhớ vật lý tăng nhanh thay đổi bản chất của máy tính gần 1 thập kỉ Kể từ năm 1970 bộ nhớ bán dẫn đã trả qua 13 thế hệ phát triển Mỗi thế hệ sau lại tăng mật độ bộ nhớ lên gấp 4 lần so với thế hệ trước cùng với giảm giá thành và thời gian truy câp. + Vi xử lý Mật độ các thành phần trên chip xử lý tiếp tục tăng Ngày càng nhiều thành phần đặt trên chip dẫn đến càng ít chip cần thiết để xây dựng một bộ xử lý máy tính 1971 Intel phát triển dòng 4004 Chip đầu tiên chứa được tất cả thành phần của CPU trên 1 chip đơn Sự ra đời của bộ vi xử lý 4 bit 1972 Intel phát triển dòng 8008 Vi xử lý 8 bit đầu tiên 1974 Intel phát triển dòng 8080 Vi xử lý đa năng đầu tiên Nhanh hơn, tập lệnh phong phú hơn, khả năng định địa chỉ rộng hơn Quá trình phát triển của vi xử lý Intel a. 1970s Processors b. 1980s Processors Quá trình phát triển của vi xử lý Intel c. 1990s Processors d. Recent Processors 2. CÁC ĐẶC TÍNH THIẾT KẾ MÁY TÍNH + + 2.1 Tốc độ vi xử lý Kĩ thuật xây dựng bộ vi xử lý hiện đại bao gồm: Kỹ thuật ống dẫn (Pipelining) • Bộ xử lý thi hành cùng một lúc nhiều lệnh Dự đoán nhánh • Bộ xử lý tra mã lệnh tìm được từ bộ nhớ và dự đoán nhánh nào hoặc nhóm lệnh nào được xử lý tiếp theo. Phân tích dòng dữ liệu • Bộ xử lý phân tích lệnh nào phụ thuộc vào kết quả của lệnh khác, hoặc dữ liệu, để đưa ra lịch trình xử lý lệnh tối ưu nhất Thi hành lệnh theo suy đoán • Sử dụng dự đoán nhánh và phân tích dòng dữ liệu, một số bộ xử lý thi hành lệnh trước khi nó xuất hiện, giữ kết quả trong một vùng tạm thời, giữ cho bộ máy luôn hoạt động bận rộn. + 2.2 Cân bằng Hiệu suất Điều chỉnh kiến trúc và tổ chức để bù đắp cho sự chênh lệch giữa khả năng khác nhau của các thành phần. Ví dụ về kiến trúc bao gồm: Tăng số lượng bit được lấy ra tại 1 thời điểm bằng cách làm cho DRAMs “rộng hơn” thay vì “sâu hơn” và bằng cách sử dụng đường bus dữ liệu rộng. Thay đổi giao diện DRAM để nó hiệu quả hơn bằng cách thêm vào 1 bộ nhớ cache hoặc 1 cơ chế đệm khác trên chip DRAM Giảm tần suất truy cập bộ nhớ bằng cách kết hợp các cấu trúc bộ nhớ cache phức tạp và hiệu quả hơn giữa bộ xử lý và bộ nhớ chính Tăng băng thông kết nối giữa bộ xử lý và bộ nhớ bằng cách sử dụng các bus tốc độ cao và phân cấp bus để đệm và cơ cấu dòng dữ liệu Tốc độ dữ liệu của các thiết bị I/O điển hình Gigabit Ethernet Graphics display Hard disk Ethernet Optical disk Scanner Laser printer Floppy disk Modem Mouse Keyboard 101 102 103 104 105 106 107 108 109 Data Rate (bps) Figure 2.10 Typical I/O Device Data Rates + 2.3 Cải tiến kiến trúc và tổ chức Chip Tăng tốc độ phần cứng của bộ vi xử lý Cơ bản là do thu hẹp kích thước cổng logic Nhiều cổng hơn, đóng gói chặt chẽ hơn, tăng tốc độ đồng hồ Thời gian truyền tín hiệu giảm Tăng kích thước và tốc độ cache Dành một phần của chip vi xử lý Thời gian truy cập cache giảm đáng kể Thay đổi cấu trúc và tổ chức bộ vi xử lý Tốc độ thực hiện lệnh tăng mạnh Xử lý song song + Tốc độ đồng hồ và mật độ Logic Tiêu thụ điện năng Tăng khi mật độ cổng logic và tốc độ đồng hồ tăng Toả nhiệt Trễ RC (Resistance – điện trở & Capacitance – điện dung) Tốc độ dòng electrons chạy trên chip giới hạn bởi điện dung và điện trở (RC) của đường dây kim loại kết nối chúng Trễ tăng khi tích RC tăng Dây kết nối mảnh hơn, điện trở tăng Dây đặt gần nhau hơn, điện dung tăng Trễ bộ nhớ Tốc độ bộ nhớ thường chậm hơn tốc độ bộ xử lý Giải pháp Chú trọng hơn vào phương pháp tổ chức và kiến trúc + Xu hướng phát triển bộ xử lý 107 106 Transistors (Thousands) 105 Frequency (MHz) Power (W) 104 Cores 103 102 10 1 0.1 1970 1975 1980 1985 1990 1995 2000 2005 2010 Figure 2.11 Processor Trends 3. Chip đa lõi . Việc sử dụng nhiều bộ xử lý trên một chip cung cấp tiềm năng tăng hiệu suất cho máy mà không làm tăng tốc độ đồng hồ . Tăng gấp đôi số lượng bộ vi xử lý, tăng gấp đôi hiệu suất . Chiến lược: sử dụng hai bộ xử lý đơn giản trên 1 chip thay vì một bộ xử lý phức tạp . Với 2 bộ xử lý thì sẽ có bộ nhớ cache lớn hơn . Bộ nhớ cache lớn hơn sẽ cần phải chia làm hai hoặc ba cấp cache trên một chip + Đa lõi tích hợp (MIC) Đơn vị xử lý đồ hoạ (GPU) Đa lõi tích hợp (MIC) Đơn vị xử lý đồ hoạ (GPU) Sự nhảy vọt về hiệu suất Lõi được thiết kế để thi hành đặt ra thách thức trong song song các thao tác trên phát triển phần mềm để dữ liệu đồ hoạ khai thác hết tính năng GPU thường nằm trên card của xử lý đa lõi. đồ hoạ rời, nó được sử dụng Chiến lược MIC và đa lõi để mã hoá và giải mã đồ hoạ yêu cầu các bộ xử lý đa 2D và 3D cũng như xử lý năng phải gộp đồng nhất video trên một chip đơn Được sử dụng như bộ xử lý vector cho những ứng dụng yêu cầu tính toán lặp 4. Kiến trúc x86 Khái quát . Là kết quả sau nhiều thập kỉ nghiên cứu máy tính tập lệnh phức tạp (Complex instruction set computers - CISCs) . Kết hợp các nguyên tắc thiết kế phức tạp chỉ có ở các siêu máy tính hoặc hệ thống lớn . Một cách thiết kê bộ xử lý khác là máy tính tập lệnh rút gọn (Reduced instruction set computer - RISC) . Kiến trúc ARM được sử dụng rộng rãi trong các hệ thống nhúng và là một trong những hệ thống RISC mạnh nhất, thiết kết tối ưu nhất trên thị trường . Trên thị trường, Intel là nhà sản xuất số một về các vi xử lý cho các hệ thống không phải hệ nhúng. 8080 Vi xử lý đa năng đầu tiên máy 8-bit với đường dữ liệu tới bộ nhớ 8-bit Được dùng trên máy tính cá nhân đầu tiên (Altair) 8086 Máy 16-bit Sử dụng cache cho lệnh, hoặc hàng đợi Sự phát triển Hiện diện đầu tiên của kiến trúc x86 của x86 8088 Sử dụng+ cho máy tính cá nhân IBM đầu tiên 80286 16 Mb bộ nhớ thay vì chỉ 1Mb 80386 Máy 32 bit đầu tiên của Intel Bộ xử lý Intel đầu tiên hỗ trợ thao tác đa nhiệm 80486 Kĩ thuật cache và ống dẫn lệnh (pipeline) phức tạp hơn Tích hợp sẵn bộ xử lý toán học Sự phát triển của x86 - Pentium Pentium 4 Pentium III • Thêm các lệnh dấu Pentium II • Thêm vào phẩy động các lệnh và những Pentium • Kĩ thuật dấu phẩy cải tiến Pro MMX động để khác cho Pentium • Thiết kế hỗ trỡ các đa • Tăng tính đặc biết • Super- super- phần phương scalar scalar để xử lý mềm đồ tiện • Thực hiện video, hoạ 3D • Đổi tên audio và nhiều lệnh thanh ghi song song tích cực dữ liệu đồ hoạ • Dự đoán nhánh • Phân tích dòng dữ liệu • Thi hành lệnh theo suy đoán Sự phát triển của x86 (2) Core x86 thống lĩnh thị trường vi xử lý (trừ Vi xử lý Intel x86 đầu tiên hệ thống nhúng) có dual core – tức là thực hiện hai bộ xử lý trên một Kiến trúc tập lệnh tương thích với các phiên bản trước chip đơn. Core 2 Tổ chức và kỹ thuật thay đổi nhanh Mở rộng kiến trúc lên 64 bit Gần đây có thể có tới 10 bộ Khoảng 1 lệnh thêm mới mỗi xử lý trên 1 chip tháng 500 lệnh có sẵn 5. Khái niệm: Hệ thống “Sự kết hợp của phần cứng và phần mềm máy tính, có thể cùng với các thành phần khác, được thiết kế để thi hành một chức năng cụ thể. Trong Nhúng nhiều trường hợp, hệ thống nhúng là một phần của một hệ thống/sản phẩm lớn hơn, ví dụ như một hệ thống + chống bó cứng phanh trong ôtô.” Ví dụ về các hệ thống nhúng Market Embedded Device Ignition system Automotive Engine control Brake system Digital and analog televisions Set-top boxes (DVDs, VCRs, Cable boxes) Personal digital assistants (PDAs) Kitchen appliances (refrigerators, toasters, microwave ovens) Consumer electronics Automobiles Toys/games Telephones/cell phones/pagers Cameras Global positioning systems Robotics and controls systems for manufacturing Industrial control Sensors Infusion pumps Dialysis machines Medical Prosthetic devices Cardiac monitors Fax machine Photocopier Office automation Printers Monitors Scanners + Hệ thống nhúng Yêu cầu và ràng buộc Các mô hình tính toán khác nhau từ hệ thống sự kiện rời rạc đến hệ thống kết hợp hybrid Hệ thống từ nhỏ đến lớn, kéo theo nhiểu ràng buộc về giá thành Điều kiện môi trường và nhiều yêu cầu để khác nhau về bức xạ, tối ưu hoá và tái sử độ rung và độ ẩm. dụng khác nhau Không quá nghiêm Đặc tính ứng dụng khác ngặt với các yêu cầu và nhau dẫn đến tải tĩnh sự kết hợp các yêu cầu hay động, tốc độ nhanh chất lượng khác nhau hay chậm, tác vụ về như độ an toàn, tin cậy, tính toán hay giao diện, thời gian thực và độ tổ hợp and hay or linh hoạt. Độ bền ngắn hoặc dài + Tổ chức của hệ thống nhúng Software Auxiliary Systems FPGA/ Memory (power, ASIC cooling) Diagnostic Human Processor interface port A/D D/A conversion Conversion Electromechanical backup and safety Sensors Actuators External environment Figure 2.12 Possible Organization of an Embedded System + Acorn RISC Machine (ARM) Họ vi xử lý và vi điều khiển Được sử dụng rộng rãi trong RISC. PDA, các thiết bị cầm tay iPod, iPhone Thiết kế vi xử lý và kiến Kiến trúc bộ xử lý được sử dụng trúc đa lõi, cấp phép cho rộng rãi nhất các nhà sản xuất. Acorn đã sản xuất ARM1 & ARM2 Chip tốc độ cao, nhỏ gọn năm 1985 và ARM3 năm 1989 và tiết kiệm điện. Acorn, VLSI và Apple Computer thành lập ARM Ltd. Chủ yếu dùng trong hệ thống nhúng Family Notable Features Cache Typical MIPS @ MHz ARM1 32-bit RISC None ARM2 Multiply and swap None 7 MIPS @ 12 MHz instructions; + Integrated memory management unit, graphics and I/O Thông processor ARM3 First use of processor 4 KB unified 12 MIPS @ 25 MHz cache số ARM6 First to support 32-bit 4 KB unified 28 MIPS @ 33 MHz addresses; floating- ARM point unit ARM7 Integrated SoC 8 KB unified 60 MIPS @ 60 MHz ARM8 5-stage pipeline; static 8 KB unified 84 MIPS @ 72 MHz branch prediction ARM9 16 KB/16 KB 300 MIPS @ 300 MHz ARM9E Enhanced DSP 16 KB/16 KB 220 MIPS @ 200 instructions MHz ARM10E 6-stage pipeline 32 KB/32 KB ARM11 9-stage pipeline Variable 740 MIPS @ 665 MHz Cortex 13-stage superscalar Variable 2000 MIPS @ 1 GHz pipeline XScale Applications 32 KB/32 KB L1 1000 MIPS @ 1.25 processor; 7-stage 512 KB L2 GHz pipeline DSP = digital signal processor SoC = system on a chip Các hạng mục thiết kế ARM Thiết kế bộ xử lý ARM cần phải đáp ứng ba hạng mục sau: Bảo mật ứng dụng . Cards thông minh, SIM cards và các thiết bị thanh toán Nhúng thời gian thực Platforms ứng dụng . Thiết bị chạy trên hệ điều . Các hệ thống lưu trữ, bộ hành mở bao gồm Linux, Palm phận tự động và các ứng OS, Symbian OS, và Windows dụng mạng, công nghiệp... CE trong các ứng dụng không dây và ảnh số. + 6. ĐÁNH GIÁ HIỆU SUẤT MÁY + 6.1 Đồng hồ hệ thống 6.2 Chuẩn so sánh (Benchmark) Ví dụ: xét 1 câu lệnh ngôn ngữ lập trình bậc cao như sau: A = B + C /* giả sử tất cả giá trị nằm trong bộ nhớ chính*/ Với kiến trúc tập lệnh truyền thống, theo kiến trúc CISC (Complex instruction set computer -CISC), lệnh này có thể được biên dịch thành 1 lệnh sau trong bộ xử lý add mem(B), mem(C), mem (A) Trên một máy RISC điển hình, phần biên dịch sẽ như sau: load mem(B), reg(1); load mem(C), reg(2); add reg(1), reg(2), reg(3); store reg(3), mem (A) + Đặc tính mong muốn của chuẩn so sánh Viết bằng ngôn ngữ bậc cao, có thể chạy trên các thiết bị khác nhau Đại diện cho một kiểu lập trình riêng, ví dụ lập trình hệ thống, lập trình số học hoặc lập trình thương mại Có thể so sánh dễ dàng Được sử dụng rộng rãi + System Performance Evaluation Corporation (SPEC) Bộ tiêu chuẩn Một tập hợp các chương trình, được định nghĩa trong một ngôn ngữ bậc cao Kiểm thử một máy tính trong một ứng dụng cụ thể hoặc khu vực lập trình hệ thống SPEC Một tập đoàn công nghiệp Xác định và duy trì các bộ tiêu chuẩn nổi tiếng Các phép đo hiệu suất được sử dụng rộng rãi cho mục đích so sánh và nghiên cứu + Bộ tiêu chuẩn SPEC nổi tiếng nhất Bộ tiêu chuẩn công nghiệp cho các SPEC ứng dụng chuyên dụng bộ xử lý Thích hợp để đo hiệu suất cho các ứng dụng dành phần nhiều thời gian để tính toán hơn là I/O CPU2006 Bao gồm 17 chương trình dấu phẩy động được viết bằng C, C ++, và Fortran; 12 chương trình số nguyên viết bằng C và C ++ Chứa hơn 3 triệu dòng mã Thế hệ bộ vi xử lý thứ năm của SPEC + Gene Amdahl [AMDA67] Giải quyết sự tăng tốc của chương trình sử dụng nhiều bộ 6.3 Luật xử lý so với sử dụng 1 bộ xử lý Mô tả các vấn đề mà nền công Amdahl nghiệp phải đối mặt khi phát triển bộ xử lý đa lõi Phần mềm phải thích hợp với môi trường thi hành lệnh song song để tận dụng sức mạnh của xử lý song song. Có thể khái quát hoá để đánh giá và thiết kế các nâng cấp về kĩ thuật trong hệ thống máy tính + 6.4 Luật Little Có mối liên hệ cơ bản và đơn giản với nhiều ứng dụng Có thể áp dụng tới hầu hết các hệ thống thoả mãn điều kiện ổn định và không có rò rỉ Hệ thống hàng đợi Nếu máy chủ (server) đang rỗi, mọi đối tượng được xử lý ngay lập tức, nếu không thì các đối tượng đươc chuyển đến hàng đợi Có thể có một hàng đợi cho một server hoặc nhiều server, hay cũng có thể có nhiều hàng đợi với mỗi hàng đợi cung cấp cho nhiều server Số đối tượng trung bình trong một hàng đợi bằng tốc độ đến trung bình nhân với thời gian mà một đối tượng ở trong hệ thống. Mối quan hệ yêu cầu rất ít giả thiết Với tính đơn giản và tổng quát, hàng đợi là cực kì hữu dụng + Tổng kết Lịch sử phát triển và hiệu suất máy tính Chương 2 Đa lõi Máy tính thế hệ thứ nhất MICs Ống chân không GPGPUs Máy tính thế hệ thứ hai Sự phát triển của Intel x86 Transistor Hệ thống nhúng Máy tính thế hệ thứ ba Sự phát triển của ARM Mạch tích hợp Đánh giá hiệu suất máy Tốc độ đồng hồ và số lệnh trên Thiết kế hiệu suất giây Tốc độ vi xử lý Tiêu chuẩn đánh giá Cân bằng hiệu năng Luật Amdahl Kiến trúc và tổ chức chip Luật Little + Câu hỏi chương 2 1. Máy tính chương trình lưu trữ là gì? 2. Bốn thành phần chính của máy tính đa năng? 3. Ba yếu tố chính khi thiết kế hiệu suất của hệ thống máy tính là gì? 4. Giải thích luật Moore.
File đính kèm:
- bai_giang_kien_truc_may_tinh_chuong_2_lich_su_phat_trien_cua.pdf