Bài giảng Nhập môn khai phá dữ liệu - Chương 2: Công nghệ tri thức - Hà Quang Thụy

Nội dung

Nghịch lý năng suất của Công nghệ Thông tin

Các mô hình khai phá dữ liệu

Sơ bộ về khoa học dữ liệu

Công nghệ tri thức và kinh tế tri thức

Bài giảng Nhập môn khai phá dữ liệu - Chương 2: Công nghệ tri thức - Hà Quang Thụy trang 1

Trang 1

Bài giảng Nhập môn khai phá dữ liệu - Chương 2: Công nghệ tri thức - Hà Quang Thụy trang 2

Trang 2

Bài giảng Nhập môn khai phá dữ liệu - Chương 2: Công nghệ tri thức - Hà Quang Thụy trang 3

Trang 3

Bài giảng Nhập môn khai phá dữ liệu - Chương 2: Công nghệ tri thức - Hà Quang Thụy trang 4

Trang 4

Bài giảng Nhập môn khai phá dữ liệu - Chương 2: Công nghệ tri thức - Hà Quang Thụy trang 5

Trang 5

Bài giảng Nhập môn khai phá dữ liệu - Chương 2: Công nghệ tri thức - Hà Quang Thụy trang 6

Trang 6

Bài giảng Nhập môn khai phá dữ liệu - Chương 2: Công nghệ tri thức - Hà Quang Thụy trang 7

Trang 7

Bài giảng Nhập môn khai phá dữ liệu - Chương 2: Công nghệ tri thức - Hà Quang Thụy trang 8

Trang 8

Bài giảng Nhập môn khai phá dữ liệu - Chương 2: Công nghệ tri thức - Hà Quang Thụy trang 9

Trang 9

Bài giảng Nhập môn khai phá dữ liệu - Chương 2: Công nghệ tri thức - Hà Quang Thụy trang 10

Trang 10

Tải về để xem bản đầy đủ

pdf 77 trang xuanhieu 5140
Bạn đang xem 10 trang mẫu của tài liệu "Bài giảng Nhập môn khai phá dữ liệu - Chương 2: Công nghệ tri thức - Hà Quang Thụy", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài giảng Nhập môn khai phá dữ liệu - Chương 2: Công nghệ tri thức - Hà Quang Thụy

Bài giảng Nhập môn khai phá dữ liệu - Chương 2: Công nghệ tri thức - Hà Quang Thụy
huẩn bị dữ liệu chẳng hạn như xử lý dữ liệu mất tích và riêng tư);
 hoặc
 P5. Lựa chọn phương pháp và mô hình hóa (lựa chọn được các mô hình
 và phương pháp thích hợp để đạt được các mục tiêu trên);
 P05. Mô hình hóa chuyên sâu (áp dụng mô hình hóa chuyên sâu bằng
 cách sử dụng nhiều mô hình hiệu quả tiết lộ cốt lõi của vấn đề, hoặc
 dụng khai phá đa bước, khai phá kết hợp);
July 12, 2021
 Mô hình KPDL hướng ứng dụng
 P6. Phân tích và đánh giá kết quả chung ban đầu (phân tích /đánh giá
 các phát hiện ban đầu);
 P7. Là hoàn toàn hợp lý khi mỗi giai đoạn từ P1 có thể được lặp đi lặp lại
 thông qua phân tích ràng buộc và tương tác với các chuyên gia miền
 ứng dụng theo phương thức quay lui và xem xét;
 P07. Khai phá chuyên sâu về kết quả chung ban đầu khi áp dụng;
 P8. Đo lường và nâng cao khả năng hành động (đánh giá tính thú vị
 theo quan điểm cả về kỹ thuật và kinh doanh, và tăng cường hiệu
 suất bằng cách áp dụng phương pháp hiệu quả hơn).
 P9. Thực hiện qua lại giữa P7 và P8;
 P10. Hậu xử lý kết quả (hậu phân tích hoặc hậu khai phá dữ liệu các kết
 quả ban đầu);
 P11. Xem xét lại các giai đoạn từ P1 có thể được đòi hỏi;
 P12. Triển khai (triển khai các kết quả vào các ngành kinh doanh);
 P13. Cung cấp tri thức và báo cáo tổng hợp để ra quyết định thông minh
 (tổng hợp phát hiện cuối cùng thành báo cáo ra quyết định sẽ được
 chuyển giao cho người kinh doanh).
July 12, 2021
 Các pha dự án PTDL thương mại
July 12, 2021
Tổ chức hướng dữ liệu
 Bánh xe thông tin từ một góc nhìn tổ chức
 [Laursen11] Gert H. N. Laursen. Business Analytics for Sales and Marketing
 Managers: How to Compete in the Information Age. Wiley, 2011
12 bước đưa TTNT vào hoạt động CNTT
 https://www.gartner.com/ngw/eventassets/en/conferences/sym28/documents/gartner-
 symposium-us-cio-guide-ai-2018.pdf
4. Từ tri thức tổ chức tới kinh tế tri thức
 Tri thức
 ➢ Khái niệm
 ❖ Từ điển Compact Oxford English Dictionary
 ◼ sự hiểu biết tinh thông cùng với các kỹ năng mà con 
 người thu nhận được qua kinh nghiệm hoặc giáo dục 
 ◼ tổng hợp những gì mà con người biết rõ 
 ◼ nhận thức và hiểu biết tường minh về một sự việc hoặc 
 một hiện tượng mà thu nhận được nhờ kinh nghiệm
 ❖ Nội dung khái niệm còn phụ thuộc vào từng lĩnh vực: 
 ✓ Ở đây: Compact Oxford English Dictionary
 ✓ Khai phá dữ liệu: mẫu có độ hấp dẫn vượt qua ngưỡng
 ➢ Hình thức thu nhân tri thức: giáo dục, kinh nghiệm
 qua hoạt động thực tiễn
 vien-phai-tich-luy-cho-minh-cai-bat-bien-201709180717191.htm
Tri thức: Một phân loại
 ▪ tri thức hiện – tri thức ẩn (Explicit knowledge – Tacit knowledge), tri
 thức chủ quan – tri thức khách quan (Objective knowledge –
 Subjective knowledge), tri thức biết – tri thức hành động (Knowing
 that – Knowing how). Ví dụ tri thức ẩn  tri thức hiện: ngành CNPM
 ▪ "know what“: tri thức về sự vật, sự kiện, hiện tượng
 ▪ "know why“: tri thức về thế giới, xã hội và trí tuệ con người,
 ▪ "know who“: tri thức về ai và họ làm được gì,
 ▪ "know how“: tri thức về kỹ năng và kinh nghiệm thực tiễn.
 ▪ "know where“, "know when“: tri thức quan trọng cho một nền kinh tế
 mềm dẻo và động,
 Khía cạnh kinh tế của tri thức tổ chức
◼ Tổ chức là một thực thể tích hợp tri thức
 ▪ Môi trường văn hóa tổ chức và tính chất chuyên môn trình độ
 cao liên quan tới ngành nghề tạo nên một cộng đồng đơn nhất
 tổ chức thực hiện thu nhận và chuyển giao tri thức hướng tới
 mục tiêu tốt nhất hoặc hiệu quả nhất cho tổ chức.
◼ Tổ chức là một thực thể sáng tạo tri thức
 ▪ Một tập hợp mạng quan hệ trong tổ chức tạo điều kiện thuận lợi
 cho trao đổi và phát triển tri thức tổ chức. Vào năm 2000, Giám
 đốc điều hành tập đoàn HP Lew Platt lúc đó đưa ra nhận định
 "Nếu HP biết được những điều HP biết thì lợi nhuận của chúng
 tôi sẽ gấp ba lần" Nguyên văn, “If HP knew what HP knows, we
 would be three times profitable”.
◼ Tổ chức là thực thể bảo vệ tri thức
 ▪ Một mặt, tổ chức tạo điều kiện thuận lợi cho trao đổi và phát
 triển tri thức nội bộ, mặt khác, tổ chức cần có cơ chế bảo vệ tri
 thức tổ chức của mình.
 58
Cơ chế tích hợp tri thức doanh nghiệp
- Các quy tắc tương tác giữa các cá nhân tạo điều kiện
 chuyển hóa tri thức ẩn thành tri thức hiện
- Chuẩn hóa hoạt động mức doanh nghiệp qua quá
 trình tiến hành các bước tham gia của các chuyên gia
 vào sản phẩm
 ▪ Nên và chỉ nên sử dụng các quy trình chuẩn đối với các vấn
 đề quá phức tạp hoặc quan trọng và bất thường.
- Các thói quen được hình thành trong doanh nghiệp hỗ
 trợ sự tương tác linh hoạt trong doanh nghiệp
 ▪ Thói quen: một bộ phận quan trọng trong văn hóa doanh
 nghiệp
 ▪ “Tự phát” –> “tự giác”
 Cơ bản về công nghệ tri thức
 ◼ Khái niệm công nghệ tri thức
 ◼ Công nghệ tri thức là một quá trình bao gồm thu nhận và biểu 
 diễn tri thức, và xây dựng cơ chế suy luận và giải thích.
 ◼ Bốn bước thi hành
 ◼ thu nhận tri thức, biểu diễn tri thức, xây dựng một cơ chế suy 
 luận, và thiết kế các công cụ giải thích.
 ◼ Metaknowledge “siêu tri thức”
 ◼ Metaknowledge: tri thức về tri thức. Một số ví dụ: làm thế nào sử
 dụng tri thức trong tình huống cụ thể, làm thế nào xác định tri
 thức có liên quan, và khi nào tri thức là chưa đầy đủ.
 ◼ So sánh với metadata (dữ liệu về dữ liệu): dữ liệu mô tả file
 ◼ Metaknowledge: YKYN (you know that you know), DKYK, YKDK,
 DKDK (don’t know that you don’t know)
July 12, 2021 Bài toán phát hiẹn tri thức 60
Mô hình SECI chuyển hóa tri thức
 ▪ Xã hội hóa (Socialization): quá trình chia sẻ kinh nghiệm và do đó tạo ra tri thức
 ẩn (tri thức của cá nhân bao gồm nhận định, sự hiểu biết, niềm tin và trực giác,
 tri thức tiềm ẩn, cá nhân hóa sâu sắc và trình bày khuếch tán trong phạm vi tổ
 chức). Một cá nhân có thể tiếp thu tri thức ẩn của cá nhân khác mà không cần sử
 dụng ngôn ngữ. Bắt chước được coi là một phương tiện xã hội hóa.
 ◼ Ngoại hiên hóa
 (Externalization) là quá trình
 chuyển đổi tri ​​thức ẩn thành
 tri ​​thức hiện (tri ​​thức hình
 thức, dễ tiếp cận, tương đối
 dễ dàng lây truyền giữa các
 cá nhân và nhóm) bằng cách
 sử dụng phép ẩn dụ, tương
 tự hóa và các mô hình.
 ◼ Ngoại hiện hóa tri ​​thức ẩn
 là hoạt động quan trọng
 nhất liên quan đến việc tạo
 ra tri ​​thức, nhưng cũng là
 khó khăn nhất.
Mô hình SECI: Kết hợp và chủ quan hóa
 ◼ Kết hợp / trộn
 Combination/mixing) là quá
 trình tạo ra tri ​​thức hiện
 bằng cách kết hợp tri ​​thức
 hiện từ các nguồn khác
 nhau. Ví dụ, các cá nhân
 thay đổi và kết hợp tri ​​thức
 hiện của họ bằng cách
 chuyển đổi các cuộc họp
 qua điện thoại.
 ◼ Thông tin có trong
 CSDL có thể được xử
 lý để tạo tri ​​thức rõ
 mới (KDD)
 ▪ Chủ quan hóa (Internalization) là quá trình phát huy tri ​​thức hiện vào nhận biết
 tri ​​thức ẩn mới. Điều này tạo điều kiện thuận lợi nếu cá nhân có thể lại trải
 nghiệm những kinh nghiệm của những người khác, gián tiếp.
 Trong công ty sáng tạo tri ​​thức, mô hình chuyển đổi tri ​​thức SECI
 làm việc theo tương tác động, trong một xoắn ốc tri thức
Mô hình SECI doanh nghiệp: Giải thích
 Cơ bản về công nghệ tri thức
 ◼ Một số khái niệm
 ◼ Thu nhận tri thức là việc khai thác tri thức từ nguồn (chuyên gia)
 đã văn bản hóa và chưa văn bản hóa và chuyển nó vào máy tính.
 Sử dụng 3 kỹ thuật: quy nạp, lập luận dựa trên trường hợp, tính
 toán neuron.
 ◼ Biểu diễn tri thức liên quan đến việc tổ chức các tri thức trong các
 cơ sở tri thức.
 ◼ Tri thức văn bản hóa có trong sách vở, đĩa máy tính, báo cáo,
 phim Tri thức không văn bản hóa có trong tâm trí con người. Tri
 thức văn bản hóa là mục tiêu (dù có thể được diễn giải một cách
 chủ quan)
 ◼ Một số nguồn tri thức
 ◼ Chuyên gia, sách hướng dẫn, phim ảnh, sách, cơ sở dữ liệu,
 tập tin văn bản, hình ảnh, băng hình, cảm biến, và các bức
 ảnh chụp.
July 12, 2021 Bài toán phát hiẹn tri thức 64
 Quản lý tri thức trong tổ chức
 ◼ Tri thức tiến hóa qua bốn giai đoạn theo thời gian: khởi tạo, huy
 động, lan truyền (phổ biến), sản phẩm hóa (trở thành sản phẩm)
 ◼ Khi tri thức truy cập được càng nhiều người hơn - đầu tiên nội tại tổ
 chức, sau đó tới nhiều tổ chức, và cuối cùng cho công chúng nói
 chung - các công ty phải có chiến lược sử dụng khác nhau nhận
 được giá trị lớn nhất của nó.
July 12, 2021
 Vòng đời tri thức thức trong tổ chức
 ◼ CKC - Codified Knowledge Claim: Yêu cầu tri thức hệ thống hóa
 ◼ UKC - Unvalidated Knowledge Claim: Yêu cầu tri thức không hợp lệ
 ◼ VKC - Validated Knowledge Claim: Yêu cầu tri thức hợp lệ
 ◼ IK - Invalidated Knowledge: Tri thức hết hiệu lực
 ◼ IKC - Invalidated Knowledge Claim: Yêu cầu tri thức hết hiệu lực
 ◼ OK - Organizational Knowledge: Tri thức của tổ chức
July 12, 2021
 Chuyển đổi meta-knowledge
 ◼ Hầu hết kỹ thuật khai phá dữ liệu chuyển hóa DKYK → YKYK.
 ◼ Cựu giám đốc điều hành HP, Lew Platt đã từng nói, “Chỉ cần HP biết
 được những gì mà HP biết, chúng tôi sẽ có hiệu quả gấp ba lần“. ”If
 only HP knew what HP knows, we'd be three times more productive”.
July 12, 2021
 Hàm quản lý tri thức
 Hiệu quả của tổ chức là một hàm theo các hoạt động quản lý 
 tri thức [Liebowitz16]
July 12, 2021
Kinh tế tri thức
Khái niệm
 ➢ Knowledge Economy/Knowledge-Based Economy
 ➢ [WB06] nền kinh tế mà việc sử dụng tri thức là động lực chủ
 chốt cho tăng trưởng kinh tế. Trong nền kinh tế tri thức, tri
 thức được yêu cầu, được phát sinh, được phổ biến và được vận
 dụng một cách hiệu quả cho tăng trưởng kinh tế.
 ➢ [UN00] nền kinh tế mà các yếu tố then chốt cho sự phát triển
 là tri thức, năng lực trí tuệ, một thiết chế xã hội cho một hạ
 tầng thông tin hữu hiệu và truy nhập được.
 ➢ Hai định nghĩa trên là tương tự nhau: ở đây sử dụng định nghĩa
 [WB06].
Kinh tế tri thức: đặc trưng
Bốn cột trụ của một nền kinh tế tri thức
 ➢ Một thiết chế xã hội pháp quyền và khuyến khích kinh tế (An
 economic incentive and institutional regime)
 Cột trụ này bao gồm các chính sách và thể chế kinh tế tốt, khuyến
 khích phân phối hiệu quả tài nguyên, kích thích cách tân và thúc đẩy
 phát kiến, phổ biến và sử dụng các tri thức đang có.
 ➢ Một lực lượng lao động được giáo dục và lành nghề (An
 educated and skilled labor force)
 Cột trụ này bao gồm các yếu tố về năng lực tri thức của nguồn nhân
 lực trong nền kinh tế. Các thông số về giáo dục và sáng tạo được lựa
 chọn nhằm thể hiện tiềm năng nói trên. Xã hội học tập và hoạt động
 học tập suốt đời cũng là các yếu tố đảm bảo tăng cường tiềm năng tri
 thức của nền kinh tế.
Kinh tế tri thức: đặc trưng
Bốn cột trụ của một nền kinh tế tri thức
➢ Một hệ thống cách tân hướng tri thức hiệu quả (a effective
 innovation system)
 Nền kinh tế tri thức cần là một nền kinh tế cách tân hiệu quả của các
 tập đoàn, trung tâm nghiên cứu, trường đại học, các chuyên gia và các
 tổ chức khác , trong đó, tri thức khi mà đã trở nên lỗi thời - lạc hậu cần
 liên tục được thay thế bằng tri thức mới - tiến bộ phù hợp với trình độ
 phát triển của nền kinh tế tri thức. Trong nền kinh tế tri thức, hoạt động
 không ngừng cách tân tri thức, phát huy sáng kiến mang tính xã hội.
➢ Một hạ tầng thông tin hiện đại và đầy đủ (a modern and adequate
 information infrastructure) là phương tiện hiệu quả để truyền thông,
 phổ biến và xử lý thông tin và tri thức
 Hạ tầng thông tin hiện đại và đầy đủ đảm bảo hoạt động thu nhận,
 cách tân tri thức cũng như để đảm bảo xã hội học tập và hoạt động
 học tập suốt đời.
Kinh tế tri thức: đo lường
 ➢ Là một công việc khó khăn: Từ chính Khái niệm tri thức và nội
 dung 4 cột trụ [OEC96, RF99, CD05]
 ➢ [Ram08] nhận định “người ta ngày càng nhận thức rõ hơn rằng tri
 thức về tăng trưởng kinh tế không hoàn toàn rõ ràng như ta vẫn
 tưởng”.
 ➢ [OEC96] xác định 4 khó khăn nguyên tắc (trang sau)
 ➢ Thông qua hệ thống tiêu chí: Đầu ra của kinh tế tri thức
 ➢ Đang trong quá trình hình thành và cải tiến:
 ▪ Hệ thống tiêu chí
 ▪ Đo lường từng tiêu chí
 ▪ Tổng hợp các tiêu chí
Kinh tế tri thức: đo lường
 Bốn nguyên tắc [Oec96]
 ➢ Không có một công thức hoặc một cách làm ổn định để chuyển
 dịch các đầu vào của nguồn tạo tri thức thành đầu ra tri thức.
 tính phức tạp của quá trình nhận thức cho nên không thể có một công
 thức hay cách làm nói trên.
 hệ thống các tiêu chí thể hiện được tiềm năng tạo ra tri thức cho nền
 kinh tế ? công thức định lượng đúng tuyệt đối
 Ví dụ, đầu tư cho khoa học – công nghệ kinh tế tri thức
 ➢ Việc lên sơ đồ cho đầu vào của bộ tạo tri thức là rất khó khăn vì
 chưa có cách thức thống kê tri thức tương tự như cách thức
 thống kê quốc dân truyền thống.
 Việc chọn các tiêu chí trong hệ thống đánh giá kinh tế tri thức vẫn
 đang được nghiên cứu đề xuất, chẳng hạn hệ thống đo lường kinh tế
 tri thức của Ngân hàng thế giới (KAM) được đổi mới theo thời gian
Kinh tế tri thức: đo lường
 Bốn nguyên tắc [OEC96]
 ➢ Thiếu tri thức về một hệ thống định giá có tính phương pháp luận
 (hợp các phần tử tri thức thành thành phần bản chất duy nhất).
 Thành phần bản chất duy nhất được dùng để làm giá trị đo mức độ
 “tri thức” của một nền kinh tế.
 Chẳng hạn, hệ thống KAM, việc “đo” cho từng tiêu chí cũng như tổng
 hợp các giá trị đó thành giá trị “đo” mức độ kinh tế tri thức của một
 quốc gia vẫn chưa có tính phương pháp luận hoàn toàn.
 ➢ Chưa văn bản hóa được việc tạo tri thức mới mà không phải bổ
 sung mạng vào kho tri thức và sự lạc hậu của các phần tử trong
 kho tri thức.
Kinh tế tri thức: đo lường
 Các bài toán cần giải quyết [OEC96]
 ➢ Đo lường tri thức của đầu vào.
 ➢ Đo lường kho tri thức và tri thức trong kho.
 ➢ Đo lường tri thức của đầu ra
 ➢ Đo lường mạng tri thức
 ➢ Đo lường tri thức thông qua học tập
 Yogesh Malhotra [Mal03] trình bày hệ thống về mô hình đánh giá
 kinh tế tri thức của một quốc gia.
 - phân tích nội dung, điểm mạnh và điểm hạn chế của một số hệ
 thống đánh giá điển hình.
 - đề xuất một mô hình đánh giá kinh tế tri thức của một quốc gia
 - hệ thống đo lường kinh tế tri thức phổ biến: có KAM của WB
Đo lường kinh tế tri thức: KAM
KAM - Knowledge Assessment Methodology [CD05] 
 ➢ Đo lường điển hình KTTT
 ✓ Chi tiết hóa 4 cột trụ bằng hệ thống tiêu chí
 ✓ Đang được cải tiến
 ✓ 2005: 80 tiêu chí; 2008: 83 tiêu chí; 2009: 109 tiêu chí
 Đo lường kinh tế tri thức: KAM
Một số giải thích
 ➢ Tiêu đề Điều hành chính quyền được chuyển từ các tiêu đề
 tiếng Anh là Institutions (KAM-2005) và Governance (KAM-
 2008, KAM-2009)
 ➢ Hệ thống KAM chứa một số tiêu chí có nội dung liên quan trực
 tiếp tới kinh tế dịch vụ, chẳng hạn như các tiêu chí Employment
 in Services (%), Local availability of specialized research and
 training services,
 ➢ Cột trụ Hệ thống cách tân được thi hành trong các tập đoàn,
 trung tâm nghiên cứu, trường đại học, các chuyên gia và các tổ
 chức khác nhằm đảm bảo sự tiến hóa tri thức, chuyển đổi thành
 dòng tăng trưởng tri thức tổng thể, đồng hóa và làm phù hợp tri
 thức mới cho nhu cầu địa phương
 ➢ Cột trụ Hạ tầng thông tin hiện đại và đầy đủ đảm bảo hệ thống
 phương tiện hiệu quả để truyền thông, phổ biến và xử lý thông
 tin và tri thức

File đính kèm:

  • pdfbai_giang_nhap_mon_khai_pha_du_lieu_chuong_2_cong_nghe_tri_t.pdf