Bài giảng Nhập môn khai phá dữ liệu - Chương 2: Công nghệ tri thức - Hà Quang Thụy
Nội dung
◼ Nghịch lý năng suất của Công nghệ Thông tin
◼ Các mô hình khai phá dữ liệu
◼ Sơ bộ về khoa học dữ liệu
◼ Công nghệ tri thức và kinh tế tri thức
Trang 1
Trang 2
Trang 3
Trang 4
Trang 5
Trang 6
Trang 7
Trang 8
Trang 9
Trang 10
Tải về để xem bản đầy đủ
Bạn đang xem 10 trang mẫu của tài liệu "Bài giảng Nhập môn khai phá dữ liệu - Chương 2: Công nghệ tri thức - Hà Quang Thụy", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Bài giảng Nhập môn khai phá dữ liệu - Chương 2: Công nghệ tri thức - Hà Quang Thụy
huẩn bị dữ liệu chẳng hạn như xử lý dữ liệu mất tích và riêng tư); hoặc P5. Lựa chọn phương pháp và mô hình hóa (lựa chọn được các mô hình và phương pháp thích hợp để đạt được các mục tiêu trên); P05. Mô hình hóa chuyên sâu (áp dụng mô hình hóa chuyên sâu bằng cách sử dụng nhiều mô hình hiệu quả tiết lộ cốt lõi của vấn đề, hoặc dụng khai phá đa bước, khai phá kết hợp); July 12, 2021 Mô hình KPDL hướng ứng dụng P6. Phân tích và đánh giá kết quả chung ban đầu (phân tích /đánh giá các phát hiện ban đầu); P7. Là hoàn toàn hợp lý khi mỗi giai đoạn từ P1 có thể được lặp đi lặp lại thông qua phân tích ràng buộc và tương tác với các chuyên gia miền ứng dụng theo phương thức quay lui và xem xét; P07. Khai phá chuyên sâu về kết quả chung ban đầu khi áp dụng; P8. Đo lường và nâng cao khả năng hành động (đánh giá tính thú vị theo quan điểm cả về kỹ thuật và kinh doanh, và tăng cường hiệu suất bằng cách áp dụng phương pháp hiệu quả hơn). P9. Thực hiện qua lại giữa P7 và P8; P10. Hậu xử lý kết quả (hậu phân tích hoặc hậu khai phá dữ liệu các kết quả ban đầu); P11. Xem xét lại các giai đoạn từ P1 có thể được đòi hỏi; P12. Triển khai (triển khai các kết quả vào các ngành kinh doanh); P13. Cung cấp tri thức và báo cáo tổng hợp để ra quyết định thông minh (tổng hợp phát hiện cuối cùng thành báo cáo ra quyết định sẽ được chuyển giao cho người kinh doanh). July 12, 2021 Các pha dự án PTDL thương mại July 12, 2021 Tổ chức hướng dữ liệu Bánh xe thông tin từ một góc nhìn tổ chức [Laursen11] Gert H. N. Laursen. Business Analytics for Sales and Marketing Managers: How to Compete in the Information Age. Wiley, 2011 12 bước đưa TTNT vào hoạt động CNTT https://www.gartner.com/ngw/eventassets/en/conferences/sym28/documents/gartner- symposium-us-cio-guide-ai-2018.pdf 4. Từ tri thức tổ chức tới kinh tế tri thức Tri thức ➢ Khái niệm ❖ Từ điển Compact Oxford English Dictionary ◼ sự hiểu biết tinh thông cùng với các kỹ năng mà con người thu nhận được qua kinh nghiệm hoặc giáo dục ◼ tổng hợp những gì mà con người biết rõ ◼ nhận thức và hiểu biết tường minh về một sự việc hoặc một hiện tượng mà thu nhận được nhờ kinh nghiệm ❖ Nội dung khái niệm còn phụ thuộc vào từng lĩnh vực: ✓ Ở đây: Compact Oxford English Dictionary ✓ Khai phá dữ liệu: mẫu có độ hấp dẫn vượt qua ngưỡng ➢ Hình thức thu nhân tri thức: giáo dục, kinh nghiệm qua hoạt động thực tiễn vien-phai-tich-luy-cho-minh-cai-bat-bien-201709180717191.htm Tri thức: Một phân loại ▪ tri thức hiện – tri thức ẩn (Explicit knowledge – Tacit knowledge), tri thức chủ quan – tri thức khách quan (Objective knowledge – Subjective knowledge), tri thức biết – tri thức hành động (Knowing that – Knowing how). Ví dụ tri thức ẩn tri thức hiện: ngành CNPM ▪ "know what“: tri thức về sự vật, sự kiện, hiện tượng ▪ "know why“: tri thức về thế giới, xã hội và trí tuệ con người, ▪ "know who“: tri thức về ai và họ làm được gì, ▪ "know how“: tri thức về kỹ năng và kinh nghiệm thực tiễn. ▪ "know where“, "know when“: tri thức quan trọng cho một nền kinh tế mềm dẻo và động, Khía cạnh kinh tế của tri thức tổ chức ◼ Tổ chức là một thực thể tích hợp tri thức ▪ Môi trường văn hóa tổ chức và tính chất chuyên môn trình độ cao liên quan tới ngành nghề tạo nên một cộng đồng đơn nhất tổ chức thực hiện thu nhận và chuyển giao tri thức hướng tới mục tiêu tốt nhất hoặc hiệu quả nhất cho tổ chức. ◼ Tổ chức là một thực thể sáng tạo tri thức ▪ Một tập hợp mạng quan hệ trong tổ chức tạo điều kiện thuận lợi cho trao đổi và phát triển tri thức tổ chức. Vào năm 2000, Giám đốc điều hành tập đoàn HP Lew Platt lúc đó đưa ra nhận định "Nếu HP biết được những điều HP biết thì lợi nhuận của chúng tôi sẽ gấp ba lần" Nguyên văn, “If HP knew what HP knows, we would be three times profitable”. ◼ Tổ chức là thực thể bảo vệ tri thức ▪ Một mặt, tổ chức tạo điều kiện thuận lợi cho trao đổi và phát triển tri thức nội bộ, mặt khác, tổ chức cần có cơ chế bảo vệ tri thức tổ chức của mình. 58 Cơ chế tích hợp tri thức doanh nghiệp - Các quy tắc tương tác giữa các cá nhân tạo điều kiện chuyển hóa tri thức ẩn thành tri thức hiện - Chuẩn hóa hoạt động mức doanh nghiệp qua quá trình tiến hành các bước tham gia của các chuyên gia vào sản phẩm ▪ Nên và chỉ nên sử dụng các quy trình chuẩn đối với các vấn đề quá phức tạp hoặc quan trọng và bất thường. - Các thói quen được hình thành trong doanh nghiệp hỗ trợ sự tương tác linh hoạt trong doanh nghiệp ▪ Thói quen: một bộ phận quan trọng trong văn hóa doanh nghiệp ▪ “Tự phát” –> “tự giác” Cơ bản về công nghệ tri thức ◼ Khái niệm công nghệ tri thức ◼ Công nghệ tri thức là một quá trình bao gồm thu nhận và biểu diễn tri thức, và xây dựng cơ chế suy luận và giải thích. ◼ Bốn bước thi hành ◼ thu nhận tri thức, biểu diễn tri thức, xây dựng một cơ chế suy luận, và thiết kế các công cụ giải thích. ◼ Metaknowledge “siêu tri thức” ◼ Metaknowledge: tri thức về tri thức. Một số ví dụ: làm thế nào sử dụng tri thức trong tình huống cụ thể, làm thế nào xác định tri thức có liên quan, và khi nào tri thức là chưa đầy đủ. ◼ So sánh với metadata (dữ liệu về dữ liệu): dữ liệu mô tả file ◼ Metaknowledge: YKYN (you know that you know), DKYK, YKDK, DKDK (don’t know that you don’t know) July 12, 2021 Bài toán phát hiẹn tri thức 60 Mô hình SECI chuyển hóa tri thức ▪ Xã hội hóa (Socialization): quá trình chia sẻ kinh nghiệm và do đó tạo ra tri thức ẩn (tri thức của cá nhân bao gồm nhận định, sự hiểu biết, niềm tin và trực giác, tri thức tiềm ẩn, cá nhân hóa sâu sắc và trình bày khuếch tán trong phạm vi tổ chức). Một cá nhân có thể tiếp thu tri thức ẩn của cá nhân khác mà không cần sử dụng ngôn ngữ. Bắt chước được coi là một phương tiện xã hội hóa. ◼ Ngoại hiên hóa (Externalization) là quá trình chuyển đổi tri thức ẩn thành tri thức hiện (tri thức hình thức, dễ tiếp cận, tương đối dễ dàng lây truyền giữa các cá nhân và nhóm) bằng cách sử dụng phép ẩn dụ, tương tự hóa và các mô hình. ◼ Ngoại hiện hóa tri thức ẩn là hoạt động quan trọng nhất liên quan đến việc tạo ra tri thức, nhưng cũng là khó khăn nhất. Mô hình SECI: Kết hợp và chủ quan hóa ◼ Kết hợp / trộn Combination/mixing) là quá trình tạo ra tri thức hiện bằng cách kết hợp tri thức hiện từ các nguồn khác nhau. Ví dụ, các cá nhân thay đổi và kết hợp tri thức hiện của họ bằng cách chuyển đổi các cuộc họp qua điện thoại. ◼ Thông tin có trong CSDL có thể được xử lý để tạo tri thức rõ mới (KDD) ▪ Chủ quan hóa (Internalization) là quá trình phát huy tri thức hiện vào nhận biết tri thức ẩn mới. Điều này tạo điều kiện thuận lợi nếu cá nhân có thể lại trải nghiệm những kinh nghiệm của những người khác, gián tiếp. Trong công ty sáng tạo tri thức, mô hình chuyển đổi tri thức SECI làm việc theo tương tác động, trong một xoắn ốc tri thức Mô hình SECI doanh nghiệp: Giải thích Cơ bản về công nghệ tri thức ◼ Một số khái niệm ◼ Thu nhận tri thức là việc khai thác tri thức từ nguồn (chuyên gia) đã văn bản hóa và chưa văn bản hóa và chuyển nó vào máy tính. Sử dụng 3 kỹ thuật: quy nạp, lập luận dựa trên trường hợp, tính toán neuron. ◼ Biểu diễn tri thức liên quan đến việc tổ chức các tri thức trong các cơ sở tri thức. ◼ Tri thức văn bản hóa có trong sách vở, đĩa máy tính, báo cáo, phim Tri thức không văn bản hóa có trong tâm trí con người. Tri thức văn bản hóa là mục tiêu (dù có thể được diễn giải một cách chủ quan) ◼ Một số nguồn tri thức ◼ Chuyên gia, sách hướng dẫn, phim ảnh, sách, cơ sở dữ liệu, tập tin văn bản, hình ảnh, băng hình, cảm biến, và các bức ảnh chụp. July 12, 2021 Bài toán phát hiẹn tri thức 64 Quản lý tri thức trong tổ chức ◼ Tri thức tiến hóa qua bốn giai đoạn theo thời gian: khởi tạo, huy động, lan truyền (phổ biến), sản phẩm hóa (trở thành sản phẩm) ◼ Khi tri thức truy cập được càng nhiều người hơn - đầu tiên nội tại tổ chức, sau đó tới nhiều tổ chức, và cuối cùng cho công chúng nói chung - các công ty phải có chiến lược sử dụng khác nhau nhận được giá trị lớn nhất của nó. July 12, 2021 Vòng đời tri thức thức trong tổ chức ◼ CKC - Codified Knowledge Claim: Yêu cầu tri thức hệ thống hóa ◼ UKC - Unvalidated Knowledge Claim: Yêu cầu tri thức không hợp lệ ◼ VKC - Validated Knowledge Claim: Yêu cầu tri thức hợp lệ ◼ IK - Invalidated Knowledge: Tri thức hết hiệu lực ◼ IKC - Invalidated Knowledge Claim: Yêu cầu tri thức hết hiệu lực ◼ OK - Organizational Knowledge: Tri thức của tổ chức July 12, 2021 Chuyển đổi meta-knowledge ◼ Hầu hết kỹ thuật khai phá dữ liệu chuyển hóa DKYK → YKYK. ◼ Cựu giám đốc điều hành HP, Lew Platt đã từng nói, “Chỉ cần HP biết được những gì mà HP biết, chúng tôi sẽ có hiệu quả gấp ba lần“. ”If only HP knew what HP knows, we'd be three times more productive”. July 12, 2021 Hàm quản lý tri thức Hiệu quả của tổ chức là một hàm theo các hoạt động quản lý tri thức [Liebowitz16] July 12, 2021 Kinh tế tri thức Khái niệm ➢ Knowledge Economy/Knowledge-Based Economy ➢ [WB06] nền kinh tế mà việc sử dụng tri thức là động lực chủ chốt cho tăng trưởng kinh tế. Trong nền kinh tế tri thức, tri thức được yêu cầu, được phát sinh, được phổ biến và được vận dụng một cách hiệu quả cho tăng trưởng kinh tế. ➢ [UN00] nền kinh tế mà các yếu tố then chốt cho sự phát triển là tri thức, năng lực trí tuệ, một thiết chế xã hội cho một hạ tầng thông tin hữu hiệu và truy nhập được. ➢ Hai định nghĩa trên là tương tự nhau: ở đây sử dụng định nghĩa [WB06]. Kinh tế tri thức: đặc trưng Bốn cột trụ của một nền kinh tế tri thức ➢ Một thiết chế xã hội pháp quyền và khuyến khích kinh tế (An economic incentive and institutional regime) Cột trụ này bao gồm các chính sách và thể chế kinh tế tốt, khuyến khích phân phối hiệu quả tài nguyên, kích thích cách tân và thúc đẩy phát kiến, phổ biến và sử dụng các tri thức đang có. ➢ Một lực lượng lao động được giáo dục và lành nghề (An educated and skilled labor force) Cột trụ này bao gồm các yếu tố về năng lực tri thức của nguồn nhân lực trong nền kinh tế. Các thông số về giáo dục và sáng tạo được lựa chọn nhằm thể hiện tiềm năng nói trên. Xã hội học tập và hoạt động học tập suốt đời cũng là các yếu tố đảm bảo tăng cường tiềm năng tri thức của nền kinh tế. Kinh tế tri thức: đặc trưng Bốn cột trụ của một nền kinh tế tri thức ➢ Một hệ thống cách tân hướng tri thức hiệu quả (a effective innovation system) Nền kinh tế tri thức cần là một nền kinh tế cách tân hiệu quả của các tập đoàn, trung tâm nghiên cứu, trường đại học, các chuyên gia và các tổ chức khác , trong đó, tri thức khi mà đã trở nên lỗi thời - lạc hậu cần liên tục được thay thế bằng tri thức mới - tiến bộ phù hợp với trình độ phát triển của nền kinh tế tri thức. Trong nền kinh tế tri thức, hoạt động không ngừng cách tân tri thức, phát huy sáng kiến mang tính xã hội. ➢ Một hạ tầng thông tin hiện đại và đầy đủ (a modern and adequate information infrastructure) là phương tiện hiệu quả để truyền thông, phổ biến và xử lý thông tin và tri thức Hạ tầng thông tin hiện đại và đầy đủ đảm bảo hoạt động thu nhận, cách tân tri thức cũng như để đảm bảo xã hội học tập và hoạt động học tập suốt đời. Kinh tế tri thức: đo lường ➢ Là một công việc khó khăn: Từ chính Khái niệm tri thức và nội dung 4 cột trụ [OEC96, RF99, CD05] ➢ [Ram08] nhận định “người ta ngày càng nhận thức rõ hơn rằng tri thức về tăng trưởng kinh tế không hoàn toàn rõ ràng như ta vẫn tưởng”. ➢ [OEC96] xác định 4 khó khăn nguyên tắc (trang sau) ➢ Thông qua hệ thống tiêu chí: Đầu ra của kinh tế tri thức ➢ Đang trong quá trình hình thành và cải tiến: ▪ Hệ thống tiêu chí ▪ Đo lường từng tiêu chí ▪ Tổng hợp các tiêu chí Kinh tế tri thức: đo lường Bốn nguyên tắc [Oec96] ➢ Không có một công thức hoặc một cách làm ổn định để chuyển dịch các đầu vào của nguồn tạo tri thức thành đầu ra tri thức. tính phức tạp của quá trình nhận thức cho nên không thể có một công thức hay cách làm nói trên. hệ thống các tiêu chí thể hiện được tiềm năng tạo ra tri thức cho nền kinh tế ? công thức định lượng đúng tuyệt đối Ví dụ, đầu tư cho khoa học – công nghệ kinh tế tri thức ➢ Việc lên sơ đồ cho đầu vào của bộ tạo tri thức là rất khó khăn vì chưa có cách thức thống kê tri thức tương tự như cách thức thống kê quốc dân truyền thống. Việc chọn các tiêu chí trong hệ thống đánh giá kinh tế tri thức vẫn đang được nghiên cứu đề xuất, chẳng hạn hệ thống đo lường kinh tế tri thức của Ngân hàng thế giới (KAM) được đổi mới theo thời gian Kinh tế tri thức: đo lường Bốn nguyên tắc [OEC96] ➢ Thiếu tri thức về một hệ thống định giá có tính phương pháp luận (hợp các phần tử tri thức thành thành phần bản chất duy nhất). Thành phần bản chất duy nhất được dùng để làm giá trị đo mức độ “tri thức” của một nền kinh tế. Chẳng hạn, hệ thống KAM, việc “đo” cho từng tiêu chí cũng như tổng hợp các giá trị đó thành giá trị “đo” mức độ kinh tế tri thức của một quốc gia vẫn chưa có tính phương pháp luận hoàn toàn. ➢ Chưa văn bản hóa được việc tạo tri thức mới mà không phải bổ sung mạng vào kho tri thức và sự lạc hậu của các phần tử trong kho tri thức. Kinh tế tri thức: đo lường Các bài toán cần giải quyết [OEC96] ➢ Đo lường tri thức của đầu vào. ➢ Đo lường kho tri thức và tri thức trong kho. ➢ Đo lường tri thức của đầu ra ➢ Đo lường mạng tri thức ➢ Đo lường tri thức thông qua học tập Yogesh Malhotra [Mal03] trình bày hệ thống về mô hình đánh giá kinh tế tri thức của một quốc gia. - phân tích nội dung, điểm mạnh và điểm hạn chế của một số hệ thống đánh giá điển hình. - đề xuất một mô hình đánh giá kinh tế tri thức của một quốc gia - hệ thống đo lường kinh tế tri thức phổ biến: có KAM của WB Đo lường kinh tế tri thức: KAM KAM - Knowledge Assessment Methodology [CD05] ➢ Đo lường điển hình KTTT ✓ Chi tiết hóa 4 cột trụ bằng hệ thống tiêu chí ✓ Đang được cải tiến ✓ 2005: 80 tiêu chí; 2008: 83 tiêu chí; 2009: 109 tiêu chí Đo lường kinh tế tri thức: KAM Một số giải thích ➢ Tiêu đề Điều hành chính quyền được chuyển từ các tiêu đề tiếng Anh là Institutions (KAM-2005) và Governance (KAM- 2008, KAM-2009) ➢ Hệ thống KAM chứa một số tiêu chí có nội dung liên quan trực tiếp tới kinh tế dịch vụ, chẳng hạn như các tiêu chí Employment in Services (%), Local availability of specialized research and training services, ➢ Cột trụ Hệ thống cách tân được thi hành trong các tập đoàn, trung tâm nghiên cứu, trường đại học, các chuyên gia và các tổ chức khác nhằm đảm bảo sự tiến hóa tri thức, chuyển đổi thành dòng tăng trưởng tri thức tổng thể, đồng hóa và làm phù hợp tri thức mới cho nhu cầu địa phương ➢ Cột trụ Hạ tầng thông tin hiện đại và đầy đủ đảm bảo hệ thống phương tiện hiệu quả để truyền thông, phổ biến và xử lý thông tin và tri thức
File đính kèm:
- bai_giang_nhap_mon_khai_pha_du_lieu_chuong_2_cong_nghe_tri_t.pdf