Tập bài giảng Cơ sơ dữ liệu phân tán (Phần 1)

Với việc phân bố ngày càng rộng rãi của các công ty, xí nghiệp, dữ liệu bài toán là

rất lớn và không tập trung đƣợc. Các cơ sở dữ liệu (CSDL) thuộc thế hệ một và hai

không giải quyết đƣợc các bài toán trong môi trƣờng mới không tập trung mà phân

tán, song song với các dữ liệu và hệ thống không thuần nhất, thế hệ thứ ba của hệ quản

trị CSDL ra đời vào những năm 80 trong đó có CSDL phân tán để đáp ứng những nhu

cầu mới.

Ngày nay, CSDL phân tán đã trở thành một lĩnh vực quan trọng của xử lý thông tin

và tầm quan trọng của nó ngày càng tăng nhanh. Có hai lý do về mặt công nghệ và về

mặt tổ chức để đi theo hƣớng này:

- Các CSDL phân tán khắc phục nhiều thiếu sót của các CSDL tập trung

(centralized database).

- Thích hợp một cách tự nhiên với các cấu trúc không tập trung (decentralized

structure) của nhiều tổ chức (organization).

1.1. Các khái niệm cơ bản

Nguyên lý các hệ cơ sở dữ liệu phân tán đƣợc xây dựng dựa trên sự hợp nhất của

hai hƣớng tiếp cận đối với quá trình xử lý dữ liệu, đó là lý thuyết các hệ cơ sở dữ liệu

và công nghệ mạng máy tính.

Một trong những động lực thúc đẩy sự phát triển nhanh việc sử dụng các hệ CSDL

là nhu cầu tích hợp các loại dữ liệu, cung cấp đa dạng các loại hình dịch vụ và các dịch

vụ đa phƣơng tiện cho ngƣời sử dụng. Mặt khác, kết nối máy tính thành mạng với mục

tiêu chia sẻ tài nguyên, khai thác có hiệu quả các tài nguyên thông tin, nâng cao khả

năng tích hợp và trao đổi các loại dữ liệu giữa các thành phần trên mạng.

Nhu cầu thu thập, lƣu trữ xử lý và trao đổi thông tin ngày càng tăng, các hệ thống

xử lý tập trung đã bộc lộ những nhƣợc điểm sau:

- Tăng khả năng lƣu trữ thông tin là khó khăn, bởi bị giới hạn tối đa của thiết bị

nhớ.

- Độ sẵn sàng phục vụ của CSDL không cao khi số ngƣời sử dụng tăng.

- Khả năng tính toán của các máy tính đơn lẻ đang dần tới giới hạn vật lý.

- Mô hình tổ chức lƣu trữ, xử lý dữ liệu tập trung không phù hợp cho những tổ

chức kinh tế, xã hội có hoạt động rộng lớn, đa quốc gia.

Những nhƣợc điểm này đã đƣợc khắc phục khá nhiều trong hệ thống phân tán.

Những sản phẩm của các hệ thống phân tán đã xuất hiện nhiều trên thị trƣờng và từng

bƣớc chứng minh tính ƣu việt của nó hơn hẳn các hệ thống tập trung truyền thống. Các

hệ thống phân tán sẽ thay thế dần các hệ thống tập trung.

Download

Trang 1

Trang 2

Trang 3

Trang 4

Trang 5

Trang 6

Trang 7

Trang 8

Trang 9

Trang 10

Tải về để xem bản đầy đủ

182 trang xuanhieu 18400

Download

Bạn đang xem 10 trang mẫu của tài liệu "Tập bài giảng Cơ sơ dữ liệu phân tán (Phần 1)", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Tập bài giảng Cơ sơ dữ liệu phân tán (Phần 1)

mỗi kiểu thao tác có một vị từ hạn chế thêm khả năng truy nhập đến đối tƣợng. Tùy
chọn này đƣợc cung cấp với các đối tƣợng là các quan hệ cơ sở, không dành cho các
khung nhìn.
Ví dụ, một thao tác đƣợc phép cho cặp có thể là SELECT *
FROM NV WHERE CV=‟Phân tích TKHT‟, cho phép Nam chỉ đƣợc phép truy nhập
đến các bộ của nhân viên có chức vụ là Phân tích TKHT.
Bảng sau đây là ví dụ mẫu về ma trận cấp quyền, trong đó đối tƣợng là các quan
hệ NV và HS hoặc là các thuộc tính TENNV.
NV TENNV HS
Nam UPDATE UPDATE UPDATE
Trung SELECT SELECT SELECT
Vân NONE SELECT SELECT * FROM HS WHERE NV=„Quản lý‟
Tập bài giảng Cơ sở dữ liệu phân tán
169
Ma trận cấp quyền có thể đƣợc lƣu trữ theo ba cách: theo cột, theo hàng hoặc theo
phần tử. Khi ma trận đƣợc lƣu theo hàng, mỗi chủ thể đƣợc liên kết với một danh sách
các đối tƣợng đƣợc phép truy nhập cùng với các quyền truy nhập tƣơng ứng. Cách
tiếp cận này cho phép duy trì các cấp quyền một cách hiệu quả, vì tất cả các quyền
của một ngƣời sử dụng khi truy nhập vào hệ thống đều đƣợc lƣu trữ cùng nhau trong
hồ sơ cá nhân (Profile) của ngƣời sử dụng.
Tuy nhiên, việc thao tác trên các quyền truy nhập (ví dụ cho phép mọi ngƣời truy
nhập đến đối tƣợng) sẽ không hiệu quả vì phải truy nhập đến tất cả các hồ sơ cá nhân.
Nếu ma trận đƣợc lƣu theo cột, mỗi đối tƣợng đƣợc liên kết với một danh sách ngƣời
sử dụng đƣợc phép truy nhập. Ƣu và nhƣợc điểm cũng nhƣ lƣu theo hàng.
Ƣu điểm của hai cách tiếp cận trên đƣợc tổ hợp trong cách tiếp cận thứ ba, trong
đó ma trận đƣợc lƣu theo phần tử, nghĩa là theo quan hệ (chủ thể, đối tƣợng, quyền).
Quan hệ này có thể có chỉ mục trên cả chủ thể và đối tƣợng, qua đó cho phép truy
nhập nhanh đến các quyền của mỗi chủ thể và đối tƣợng.
2) Kiểm soát cấp quyền phân tán
Các vấn đề kiểm soát cấp quyền trong môi trƣờng phân tán bao gồm: cấp quyền
cho ngƣời sử dụng ở xa, quản lý các quy tắc cấp quyền phân tán và việc xử lý
khung nhìn và nhóm ngƣời sử dụng.
Cấp quyền cho ngƣời sử dụng ở xa nhằm ngăn chặn truy nhập từ xa trái phép,
nghĩa là từ một vị trí không nằm trong hệ quản trị CSDL phân tán. Ngƣời sử dụng
cũng cần phải đƣợc nhận diện và xác nhận tại vị trí đƣợc truy nhập. Có hai giải pháp
cho vấn đề này:
- Thông tin xác nhận ngƣời sử dụng bao gồm tên truy nhập và mật khẩu đƣợc
nhân bản tại tất cả các vị trí. Các chƣơng trình cục bộ, đƣợc khởi hoạt từ một vị trí ở
xa cũng phải chỉ rõ tên và mật khẩu của ngƣời sử dụng.
- Tất cả các vị trí trong hệ thống phân tán phải nhận diện và xác nhận nhau tƣơng
tự nhƣ ngƣời sử dụng. Các vị trí giao tiếp với nhau bằng tên và mật khẩu.
Giải pháp (1) có chi phí cao hơn tính theo công việc quản lý thƣ mục nếu việc đƣa
thêm một ngƣời sử dụng mới vào là một thao tán phân tán. Tuy nhiên, ngƣời sử dụng
có thể truy nhập CSDL phân tán từ bất kỳ một vị trí nào.
Giải pháp (2) là cần thiết khi thông tin ngƣời sử dụng không đƣợc nhân bản. Tuy
vậy, nó cũng có thể sử dụng cấp quyền từ xa có hiệu quả. Nếu tên và mật khẩu của
ngƣời sử dụng không đƣợc nhân bản, nhƣng phải đƣợc lƣu tại vị trí ngƣời sử dụng
truy nhập vào hệ thống.
Các quy tắc cấp quyền phân tán cũng nhƣ các quy tắc cấp quyền trong các hệ tập
trung. Các định nghĩa khung nhìn phải đƣợc lƣu trữ. Có thể nhân bản hoàn toàn tại
mỗi vị trí hoặc lƣu trữ tại các vị trí của các đối tƣợng cần truy xuất. Ƣu điểm của
Tập bài giảng Cơ sở dữ liệu phân tán
170
phƣơng pháp tiếp cận nhân bản hoàn toàn là cấp quyền có thể đƣợc xử lý bằng kỹ
thuật hiệu chỉnh truy vấn. Tuy nhiên việc quản lý thƣ mục sẽ tốn kém. Giải pháp lƣu
trữ tại các vị trí của các đối tƣợng cần truy xuất tốt hơn trong trƣờng hợp tính chất
cục bộ của tham chiếu rất cao.Tuy nhiên việc cấp quyền phân tán không thể kiểm
soát đƣợc vào thời điểm biên dịch.
Khung nhìn có thể đƣợc coi mhƣ các đối tƣợng qua cơ chế cấp quyền. Khung
nhìn đƣợc cấu tạo bởi các đối tƣợng cơ sở khác. Vì vậy khi trao quyền truy xuất
đến một khung nhìn đƣợc dịch thành trao quyền truy xuất đến các đối tƣợng cơ sở.
Nếu định nghĩa khung nhìn và các quy tắc cấp quyền đƣợc nhân bản hoàn toàn, thì
việc phiên dịch khá đơn giản và đƣợc thực hiện tại chỗ. Phức tạp hơn khi định nghĩa
khung nhìn và các đối tƣợng cơ sở của nó đƣợc lƣu riêng thì phiên dịch sẽ là một thao
tác hoàn toàn phân tán. cấp quyền đƣợc trao trên khung nhìn phụ thuộc vào quyền truy
xuất của chủ nhân khung nhìn trên các đối tƣợng cơ sở. giải pháp ghi nhận thông tin
liên kết tại các vị trí của mỗi đối tƣợng cơ sở.
Nhóm ngƣời sử dụng nghĩa là cấp quyền truy xuất chung cho nhiều ngƣời, với
mục đích làm đơn giản hoá công việc quản lý cơ sở dữ liệu. Trong các hệ quản trị
cơ sở dữ liệu tập trung, khái niệm mọi ngƣời sử dụng có thể đồng nhất với nhóm
ngƣời sử dụng. Trong môi trƣờng phân tán, mhóm ngƣời sử dụng biểu thị cho tất cả
ngƣời sử dụng tại một vị trí cụ thể, đƣợc biểu thị public@site_s, là nhóm đặc biệt,
đƣợc định nghĩa bởi lệnh sau:.
DEFINE GROUP AS
Vì trong môi trƣờng phân tán, các chủ thể, các đối tƣợng phân tán tại nhiều vị trí
khác nhau và quyền truy xuất thông tin đến một đối tƣợng có thẩuto cho nhiều
nhóm phân tán khác nhau. Vì vậy vấn đề quản lý nhóm trong môi trƣờng phân tán có
một số vấn đề cần giải quyết. Nếu thông tin của nhóm và các quy tắc cấp quyền đƣợc
nhân bản hoàn toàn tại tất cả các vị trí, thì việc duy trì quyền truy xuất tƣơng tự nhƣ
trong các hệ thống tập trung. Tuy nhiên việc duy trì các bản sao là tốn kém. Việc kiểm
soát phi tập trung, tức là duy trì sự hoạt động tự trị vị trí sẽ khó khăn và phức tạp hơn
rất nhiều.
Nhân bản hoàn toàn cho các thông tin cấp quyền có ƣu điểm là kiểm soát cấp
quyên đơn giản hơn và có thể thực hiện vào lúc biên dịch. Tuy nhiên, chi phí cho việc
quản lý phân tán sẽ quá cao, nếu có rất nhiều vị trí trong hệ thống.
3.7.3. Kiểm soát tính toàn vẹn ngữ nghĩa
Một vấn đề quan trọng và khó khăn cho một hệ CSDL là bảo đảm đƣợc tính nhất
quán cơ sở dữ liệu (Databasse Consistency). Một trạng thái CSDL đƣợc gọi là nhất
quán nếu nó thỏa một tập các ràng buộc, đƣợc gọi là ràng buộc toàn vẹn ngữ nghĩa
(Semantic Integrity Constrsint). Đảm bảo tính nhất quán của CSDL, kiểm soát toàn
Tập bài giảng Cơ sở dữ liệu phân tán
171
vẹn ngữ nghĩa bằng cách loại bỏ hoặc hoá giải các trình cập nhật làm cho CSDL không
nhất quán. CSDL đã cập nhật nghĩa là đã thỏa tập các ràng buộc toàn vẹn.
Có hai loại ràng buộc toàn vẹn: ràng buộc cấu trúc ( Structural Constraint) và ràng
buộc hành vi (Behavioral Constraint). Ràng buộc cấu trúc mô tả những đặc tính ngữ
nghĩa cơ bản của mô hình. Ví dụ nhƣ ràng buộc khóa trong mô hình quan hệ, hoặc các
liên kết một -nhiều giữa các đối tƣợng trong mô hình mạng. Ngƣợc lại, ràng buộc hành
vi mô tả mối liên kết giữa các đối tƣợng, nhƣ khái niệm phụ thuộc hàm trong mô hình
quan hệ.
1) Kiểm soát toàn vẹn ngữ nghĩa tập trung
Một tiểu hệ thống kiểm soát toàn vẹn ngữ nghĩa có hai thành phần chính: một
ngôn ngữ cho phép diễn tả và thao tác các phán đoán toàn vẹn, và một định chế chịu
trách nhiệm thực hiện các hành động cụ thể nhằm ép buộc tính toàn ven khi có cập
nhật.
a) Các loại ràng buộc: Bằng một ngôn ngữ cấp cao, ngƣời quản trị cơ sở dữ
liệu có thể thiết lập đƣợc các ràng buộc toàn vẹn, khi tạo quan hệ hoặc khi quan hệ
đã có dữ liệu, có chung một cú pháp. Ngôn ngữ này cho phép mô tả, ghi nhận hoặc
loại bỏ ràng buộc toàn vẹn. Trong các hệ CSDL quan hệ, ràng buộc toàn vẹn đƣợc
định nghĩa nhƣ là các phán đoán. Một phán đoán (Assertion) là một biểu thức đặc biệt
đƣợc mô tả bằng phép tính quan hệ bộ, trong đó mỗi biến đƣợc lƣợng từ hóa với mọi
(∀) hoặc tồn tại (∃). Vì vậy, một phán đoán có thể đƣợc xem nhƣ là một lƣợng từ
hóa câu truy vấn, mang giá trị đúng hoặc sai cho mỗi bộ trong tích Đề các của các
quan hệ đƣợc xác định bởi các biến bộ. Có ba loại ràng buộc toàn vẹn: ràng buộc
tiền định, ràng buộc tiền dịch hoặc ràng buộc tổng quát.
b) Ép buộc thực thi ràng buộc: Ép buộc thực thi ràng buộc toàn vẹn nghĩa là thực
hiện việc loại bỏ những chƣơng trình cập nhật vi phạm một số ràng buộc nào đó.
Một ràng buộc bị vi phạm do các hành động cập nhật hoặc do các phán đoán ràng
buộc bị sai. Có hai phƣơng pháp cơ bản cho phép loại bỏ các trình cập nhật phát sinh
mâu thuẫn.
Phƣơng pháp phát hiện mâu thuẫn (không nhất quán): Một thao tác cập nhật u
đƣợc thi hành sẽ biến đổi CSDL từ trạng thái D sang trạng thái Du..Thuật toán ép buộc
phải khẳng định rằng mọi ràng buộc liên quan vẫn đúng trong Du bằng cách áp
dụng các ràng buộc này để kiểm tra. Nếu trạng thái Du không nhất quán, hệ quản trị
CSDL sẽ chuyển sang một trạng thái Du‟ khác bằng cách hiệu chỉnh lại Du hoặc phải
khôi phục lại trạng thái D. Vì những kiểm tra này đƣợc áp dụng sau khi trạng thái
của CSDL đã thay đổi nên đƣợc gọi là kiểm tra sau (Posttest). Phƣơng pháp này
Tập bài giảng Cơ sở dữ liệu phân tán
172
sẽ không hiệu quả nếu hệ thống phản hồi lại rất nhiều thao tác khi ràng buộc bị vi
phạm.
Phƣơng pháp ngăn chặn mâu thuẫn: Một thao tác chỉ đƣợc thực hiện nếu nó
chuyển CSDL sang một trạng thái nhất quán khác. Các bộ cần cập nhật đã có sẵn
(trong trƣờng hợp chèn) hoặc phải truy nhập trong CSDL (trƣờng hợp xóa hoặc hiệu
chỉnh). Thuật toán ép buộc xác nhận rằng tất cả các ràng buộc có liên đới đều đúng
sau khi cập nhật các bộ. Nói chung, nó đƣợc thực hiện bằng cách áp dụng các kiểm
tra có đƣợc từ các ràng buộc cho các bộ. Nhƣ vậy, các kiểm tra đƣợc áp dụng trƣớc
khi trạng thái của CSDL bị thay đổi, nên gọi là các kiểm tra trƣớc (Pretest). Phƣơng
pháp ngăn chặn này hiệu quả hơn phƣơng pháp phát hiện vì không bao giờ phải hồi lại
các thao tác cập nhật do ràng buộc bị vi phạm.
Thuật toán hiệu chỉnh truy vấn là một ví dụ về phƣơng pháp ngăn chặn, có hiệu
quả đặc biệt trong việc ép buộc các ràng buộc miền biến thiên. Nó đƣa thêm lƣợng từ
hóa phán đoán vào lƣợng từ hóa truy vấn bằng toán tử AND, vì thể câu truy vấn đƣợc
hiệu chỉnh có thể đƣợc ép buộc toàn vẹn.
2) Kiểm soát toàn vẹn ngữ nghĩa phân tán
Các thuật toán đảm bảo tính toàn vẹn ngữ nghĩa của các CSDL phân tán, đƣợc mở
rộng từ các phƣơng pháp đơn giản trong phần kiểm soát toàn vẹn ngữ nghĩa tập
trung. Giả thiết các thuật toán có tính đến yếu tố tự trị vị trí, nghĩa là mỗi vị trí có thể
xử lý các câu truy vấn cục bộ và thực hiện việc kiểm soát dữ liệu nhƣ một hệ quản trị
CSDL tập trung. Giả thiết này làm đơn giản việc mô tả phƣơng pháp. Hai vấn đề
chính của thiết kế một tiểu hệ thống kiểm soát toàn vẹn trong một hệ quả trị CSDL
phân tán, đó là vấn đề định nghĩa và lƣu trữ các phán đoán và vấn đề ép buộc thi hành
các phán đoán này..
Định nghĩa các phán đoán toàn vẹn phân tán: Giả sử một phán đoán toàn vẹn
đƣợc diễn tả bằng phép tính quan hệ bộ. Mỗi phán đoán đƣợc coi là một lƣợng từ
hóa truy vấn, trong đó nó nhận giá trị đúng hoặc sai với mỗi bộ trong tích Đề các của
các quan hệ đƣợc xác định bằng các biến bộ. Các phán đoán có thể liên quan đến dữ
liệu lƣu trên nhiều vị trí khác nhau. Vì vậy chọn vị trí lƣu trữ phán đoán sao cho
giảm thiểu chi phí kiểm tra toàn vẹn. Một chiến lƣợc phán đoán toàn vẹn chia ra ba
lớp:
Phán đoán riêng: là các phán đoán đơn biến đơn quan hệ. Chỉ đề cập đến các bộ
đƣợc cập nhật, độc lập với phần còn lại của CSDL. Ràng buộc miền giá trị của ví dụ
“Ngân sách của một dự án trong khoảng 500000 đến 1000000” là một phán đoán riêng.
Phán đoán hướng tập hợp: Bao gồm các ràng buộc đa biến đơn quan hệ nhƣ phụ
thuộc hàm (mã số nhân viên xác định tên nhân viên) và đa biến đa quan hệ nhƣ các
ràng buộc khóa ngoại.
Tập bài giảng Cơ sở dữ liệu phân tán
173
Phán đoán có các hàm gộp: Đòi hỏi phải đƣợc xử lý đặc biệt do chi phí ƣớc lƣợng
hàm gộp.
Định nghĩa một phán đoán toàn vẹn có thể đƣợc bắt đầu tại một vị trí có lƣu các
quan hệ trong phán đoán. Quan hệ có thể bị phân mảnh, một vị từ phân mảnh là một
trƣờng hợp đặc biệt của phán đoán thuộc lớp 1. Các mảnh khác nhau của một quan hệ
có thể có trên nhiều vị trí khác nhau. Vì vậy, định nghĩa một phán đoán toàn vẹn sẽ là
một thao tác phân tán và đƣợc thực hiện qua hai bƣớc. Bƣớc đầu tiên biến đổi các
phán đoán ở cấp cao thành các phán đoán biên dịch. Bƣớc tiếp theo là lƣu trữ các phán
đoán này tùy theo lớp phán đoán. Các phán đoán thuộc lớp 3 đƣợc xử lý giống nhƣ
các phán đoán thuộc lớp 1 hoặc 2, tùy thuộc vào đặc tính của chúng là riêng hay theo
tập hợp.
Phán đoán riêng: Định nghĩa phán đoán đƣợc gửi đến tất cả vị trí lƣu trữ mảnh của
quan hệ có mặt trong phán đoán. Phán đoán phải tƣơng thích với dữ liệu của quan
hệ tại mỗi vị trí. Tính tƣơng thích có thể đƣợc kiểm tra ở hai cấp: cấp vị từ và cấp
dữ liệu.
Trƣớc tiên, tƣơng thích vị từ đƣợc xác nhận bằng cách so sánh vị từ phán đoán với
vị từ mảnh. Một phán đoán C đƣợc coi là không tƣơng thích với vị từ mảnh p nếu “C
đúng” dẫn đến “p sai”, và ngƣợc lại thì đƣợc coi là tƣơng thích. Nếu không tƣơng
thích tại một vị trí, định nghĩa phán đoán phải bị loại bỏ ở mức toàn cục vì các bộ của
mảnh đó không thỏa mãn ràng buộc toàn vẹn này. Nếu có tƣơng thích vị từ, phán
đoán sẽ đƣợc kiểm tra ứng với thể hiện của mảnh. Nếu thể hiện đó không thỏa mãn
phán đoán thì nó cũng bị loại bỏ ở mức toàn cục. Nếu tƣơng thích, phán đoán sẽ đƣợc
lƣu lại tại mỗi vị trí. Việc kiểm tra tính tƣơng thích đƣợc thực hiện cho các phán đoán
biên dịch với kiểu cập nhật là “chèn” (các bộ trong các mảnh coi nhƣ là “đƣợc chèn
vào”).
Phán đoán hướng tập hợp: Phán đoán hƣớng tập hợp thuộc loại đa quan hệ, nghĩa
là có các vị từ kết nối. Tuy nhiên mỗi phán đoán biên dịch chỉ đƣợc liên kết với một
quan hệ. Vì vậy định nghĩa phán đoán có thể đƣợc gửi đến tất cả các vị trí chứa các
mảnh đƣợc các biến này tham chiếu. Việc kiểm tra tính tƣơng thích bao gồm các
mảnh của quan hệ đƣợc sử dụng trong vị từ nối. Tƣơng thích vị từ sẽ không có tác
dụng vì không thể suy một vị từ mảnh P sai nếu phán đoán C (dựa trên vị từ kết nối)
là đúng. Vì vậy, cần phải kiểm tra C theo dữ liệu, đòi hỏi phải nối mỗi mảnh của
quan hệ R với tất cả các mảnh của quan hệ S, là hai quan hệ có trong vị từ kết nối. Nhƣ
vậy chi phí sẽ rất cao nhƣ các phép kết nối. Cần phải tối ƣu hóa bằng cách xử lý truy
vấn phân tán. Ba tình huống theo mức chi phí có thể xảy ra:
Tập bài giảng Cơ sở dữ liệu phân tán
174
- Các mảnh của R đƣợc dẫn xuất từ các mảnh của S dựa vào một kết nối nửa trên
thuộc tính đƣợc dùng trong vị từ kết nối. Trong trƣờng hợp này kiểm tra tƣơng thích
có chi phí thấp vì bộ của S đối sánh đƣợc với một bộ của R sẽ ở cùng một vị trí.
- S đƣợc phân mảnh trên thuộc tính kết nối. Mỗi bộ của R phải đƣợc so sánh với
tối đa một mảnh của S, vì giá trị thuộc tính nối của bộ thuộc R có thể đƣợc dùng để
tìm vị trí mảnh tƣơng ứng của S.
- S không đƣợc phân mảnh trên thuộc tính kết nối. Mỗi bộ của R phải đƣợc so
sánh với tất cả các bộ của R đều đƣợc đảm bảo tƣơng thích thì phán đoán sẽ đƣợc lƣu
lại tại mỗi vị trí.

File đính kèm:

tap_bai_giang_co_so_du_lieu_phan_tan_phan_1.pdf