Tập bài giảng Cơ sơ dữ liệu phân tán (Phần 1)

Với việc phân bố ngày càng rộng rãi của các công ty, xí nghiệp, dữ liệu bài toán là

rất lớn và không tập trung đƣợc. Các cơ sở dữ liệu (CSDL) thuộc thế hệ một và hai

không giải quyết đƣợc các bài toán trong môi trƣờng mới không tập trung mà phân

tán, song song với các dữ liệu và hệ thống không thuần nhất, thế hệ thứ ba của hệ quản

trị CSDL ra đời vào những năm 80 trong đó có CSDL phân tán để đáp ứng những nhu

cầu mới.

Ngày nay, CSDL phân tán đã trở thành một lĩnh vực quan trọng của xử lý thông tin

và tầm quan trọng của nó ngày càng tăng nhanh. Có hai lý do về mặt công nghệ và về

mặt tổ chức để đi theo hƣớng này:

- Các CSDL phân tán khắc phục nhiều thiếu sót của các CSDL tập trung

(centralized database).

- Thích hợp một cách tự nhiên với các cấu trúc không tập trung (decentralized

structure) của nhiều tổ chức (organization).

1.1. Các khái niệm cơ bản

Nguyên lý các hệ cơ sở dữ liệu phân tán đƣợc xây dựng dựa trên sự hợp nhất của

hai hƣớng tiếp cận đối với quá trình xử lý dữ liệu, đó là lý thuyết các hệ cơ sở dữ liệu

và công nghệ mạng máy tính.

Một trong những động lực thúc đẩy sự phát triển nhanh việc sử dụng các hệ CSDL

là nhu cầu tích hợp các loại dữ liệu, cung cấp đa dạng các loại hình dịch vụ và các dịch

vụ đa phƣơng tiện cho ngƣời sử dụng. Mặt khác, kết nối máy tính thành mạng với mục

tiêu chia sẻ tài nguyên, khai thác có hiệu quả các tài nguyên thông tin, nâng cao khả

năng tích hợp và trao đổi các loại dữ liệu giữa các thành phần trên mạng.

Nhu cầu thu thập, lƣu trữ xử lý và trao đổi thông tin ngày càng tăng, các hệ thống

xử lý tập trung đã bộc lộ những nhƣợc điểm sau:

- Tăng khả năng lƣu trữ thông tin là khó khăn, bởi bị giới hạn tối đa của thiết bị

nhớ.

- Độ sẵn sàng phục vụ của CSDL không cao khi số ngƣời sử dụng tăng.

- Khả năng tính toán của các máy tính đơn lẻ đang dần tới giới hạn vật lý.

- Mô hình tổ chức lƣu trữ, xử lý dữ liệu tập trung không phù hợp cho những tổ

chức kinh tế, xã hội có hoạt động rộng lớn, đa quốc gia.

Những nhƣợc điểm này đã đƣợc khắc phục khá nhiều trong hệ thống phân tán.

Những sản phẩm của các hệ thống phân tán đã xuất hiện nhiều trên thị trƣờng và từng

bƣớc chứng minh tính ƣu việt của nó hơn hẳn các hệ thống tập trung truyền thống. Các

hệ thống phân tán sẽ thay thế dần các hệ thống tập trung.

Tập bài giảng Cơ sơ dữ liệu phân tán (Phần 1) trang 1

Trang 1

Tập bài giảng Cơ sơ dữ liệu phân tán (Phần 1) trang 2

Trang 2

Tập bài giảng Cơ sơ dữ liệu phân tán (Phần 1) trang 3

Trang 3

Tập bài giảng Cơ sơ dữ liệu phân tán (Phần 1) trang 4

Trang 4

Tập bài giảng Cơ sơ dữ liệu phân tán (Phần 1) trang 5

Trang 5

Tập bài giảng Cơ sơ dữ liệu phân tán (Phần 1) trang 6

Trang 6

Tập bài giảng Cơ sơ dữ liệu phân tán (Phần 1) trang 7

Trang 7

Tập bài giảng Cơ sơ dữ liệu phân tán (Phần 1) trang 8

Trang 8

Tập bài giảng Cơ sơ dữ liệu phân tán (Phần 1) trang 9

Trang 9

Tập bài giảng Cơ sơ dữ liệu phân tán (Phần 1) trang 10

Trang 10

Tải về để xem bản đầy đủ

pdf 182 trang xuanhieu 9400
Bạn đang xem 10 trang mẫu của tài liệu "Tập bài giảng Cơ sơ dữ liệu phân tán (Phần 1)", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Tập bài giảng Cơ sơ dữ liệu phân tán (Phần 1)

Tập bài giảng Cơ sơ dữ liệu phân tán (Phần 1)
mỗi kiểu thao tác có một vị từ hạn chế thêm khả năng truy nhập đến đối tƣợng. Tùy 
chọn này đƣợc cung cấp với các đối tƣợng là các quan hệ cơ sở, không dành cho các 
khung nhìn. 
Ví dụ, một thao tác đƣợc phép cho cặp có thể là SELECT * 
FROM NV WHERE CV=‟Phân tích TKHT‟, cho phép Nam chỉ đƣợc phép truy nhập 
đến các bộ của nhân viên có chức vụ là Phân tích TKHT. 
Bảng sau đây là ví dụ mẫu về ma trận cấp quyền, trong đó đối tƣợng là các quan 
hệ NV và HS hoặc là các thuộc tính TENNV. 
 NV TENNV HS 
Nam UPDATE UPDATE UPDATE 
Trung SELECT SELECT SELECT 
Vân NONE SELECT SELECT * FROM HS WHERE NV=„Quản lý‟ 
Tập bài giảng Cơ sở dữ liệu phân tán 
 169 
Ma trận cấp quyền có thể đƣợc lƣu trữ theo ba cách: theo cột, theo hàng hoặc theo 
phần tử. Khi ma trận đƣợc lƣu theo hàng, mỗi chủ thể đƣợc liên kết với một danh sách 
các đối tƣợng đƣợc phép truy nhập cùng với các quyền truy nhập tƣơng ứng. Cách 
tiếp cận này cho phép duy trì các cấp quyền một cách hiệu quả, vì tất cả các quyền 
của một ngƣời sử dụng khi truy nhập vào hệ thống đều đƣợc lƣu trữ cùng nhau trong 
hồ sơ cá nhân (Profile) của ngƣời sử dụng. 
Tuy nhiên, việc thao tác trên các quyền truy nhập (ví dụ cho phép mọi ngƣời truy 
nhập đến đối tƣợng) sẽ không hiệu quả vì phải truy nhập đến tất cả các hồ sơ cá nhân. 
Nếu ma trận đƣợc lƣu theo cột, mỗi đối tƣợng đƣợc liên kết với một danh sách ngƣời 
sử dụng đƣợc phép truy nhập. Ƣu và nhƣợc điểm cũng nhƣ lƣu theo hàng. 
Ƣu điểm của hai cách tiếp cận trên đƣợc tổ hợp trong cách tiếp cận thứ ba, trong 
đó ma trận đƣợc lƣu theo phần tử, nghĩa là theo quan hệ (chủ thể, đối tƣợng, quyền). 
Quan hệ này có thể có chỉ mục trên cả chủ thể và đối tƣợng, qua đó cho phép truy 
nhập nhanh đến các quyền của mỗi chủ thể và đối tƣợng. 
2) Kiểm soát cấp quyền phân tán 
Các vấn đề kiểm soát cấp quyền trong môi trƣờng phân tán bao gồm: cấp quyền 
cho ngƣời sử dụng ở xa, quản lý các quy tắc cấp quyền phân tán và việc xử lý 
khung nhìn và nhóm ngƣời sử dụng. 
Cấp quyền cho ngƣời sử dụng ở xa nhằm ngăn chặn truy nhập từ xa trái phép, 
nghĩa là từ một vị trí không nằm trong hệ quản trị CSDL phân tán. Ngƣời sử dụng 
cũng cần phải đƣợc nhận diện và xác nhận tại vị trí đƣợc truy nhập. Có hai giải pháp 
cho vấn đề này: 
- Thông tin xác nhận ngƣời sử dụng bao gồm tên truy nhập và mật khẩu đƣợc 
nhân bản tại tất cả các vị trí. Các chƣơng trình cục bộ, đƣợc khởi hoạt từ một vị trí ở 
xa cũng phải chỉ rõ tên và mật khẩu của ngƣời sử dụng. 
- Tất cả các vị trí trong hệ thống phân tán phải nhận diện và xác nhận nhau tƣơng 
tự nhƣ ngƣời sử dụng. Các vị trí giao tiếp với nhau bằng tên và mật khẩu. 
Giải pháp (1) có chi phí cao hơn tính theo công việc quản lý thƣ mục nếu việc đƣa 
thêm một ngƣời sử dụng mới vào là một thao tán phân tán. Tuy nhiên, ngƣời sử dụng 
có thể truy nhập CSDL phân tán từ bất kỳ một vị trí nào. 
Giải pháp (2) là cần thiết khi thông tin ngƣời sử dụng không đƣợc nhân bản. Tuy 
vậy, nó cũng có thể sử dụng cấp quyền từ xa có hiệu quả. Nếu tên và mật khẩu của 
ngƣời sử dụng không đƣợc nhân bản, nhƣng phải đƣợc lƣu tại vị trí ngƣời sử dụng 
truy nhập vào hệ thống. 
Các quy tắc cấp quyền phân tán cũng nhƣ các quy tắc cấp quyền trong các hệ tập 
trung. Các định nghĩa khung nhìn phải đƣợc lƣu trữ. Có thể nhân bản hoàn toàn tại 
mỗi vị trí hoặc lƣu trữ tại các vị trí của các đối tƣợng cần truy xuất. Ƣu điểm của 
Tập bài giảng Cơ sở dữ liệu phân tán 
170 
phƣơng pháp tiếp cận nhân bản hoàn toàn là cấp quyền có thể đƣợc xử lý bằng kỹ 
thuật hiệu chỉnh truy vấn. Tuy nhiên việc quản lý thƣ mục sẽ tốn kém. Giải pháp lƣu 
trữ tại các vị trí của các đối tƣợng cần truy xuất tốt hơn trong trƣờng hợp tính chất 
cục bộ của tham chiếu rất cao.Tuy nhiên việc cấp quyền phân tán không thể kiểm 
soát đƣợc vào thời điểm biên dịch. 
Khung nhìn có thể đƣợc coi mhƣ các đối tƣợng qua cơ chế cấp quyền. Khung 
nhìn đƣợc cấu tạo bởi các đối tƣợng cơ sở khác. Vì vậy khi trao quyền truy xuất 
đến một khung nhìn đƣợc dịch thành trao quyền truy xuất đến các đối tƣợng cơ sở. 
Nếu định nghĩa khung nhìn và các quy tắc cấp quyền đƣợc nhân bản hoàn toàn, thì 
việc phiên dịch khá đơn giản và đƣợc thực hiện tại chỗ. Phức tạp hơn khi định nghĩa 
khung nhìn và các đối tƣợng cơ sở của nó đƣợc lƣu riêng thì phiên dịch sẽ là một thao 
tác hoàn toàn phân tán. cấp quyền đƣợc trao trên khung nhìn phụ thuộc vào quyền truy 
xuất của chủ nhân khung nhìn trên các đối tƣợng cơ sở. giải pháp ghi nhận thông tin 
liên kết tại các vị trí của mỗi đối tƣợng cơ sở. 
Nhóm ngƣời sử dụng nghĩa là cấp quyền truy xuất chung cho nhiều ngƣời, với 
mục đích làm đơn giản hoá công việc quản lý cơ sở dữ liệu. Trong các hệ quản trị 
cơ sở dữ liệu tập trung, khái niệm mọi ngƣời sử dụng có thể đồng nhất với nhóm 
ngƣời sử dụng. Trong môi trƣờng phân tán, mhóm ngƣời sử dụng biểu thị cho tất cả 
ngƣời sử dụng tại một vị trí cụ thể, đƣợc biểu thị public@site_s, là nhóm đặc biệt, 
đƣợc định nghĩa bởi lệnh sau:. 
DEFINE GROUP AS 
Vì trong môi trƣờng phân tán, các chủ thể, các đối tƣợng phân tán tại nhiều vị trí 
khác nhau và quyền truy xuất thông tin đến một đối tƣợng có thẩuto cho nhiều 
nhóm phân tán khác nhau. Vì vậy vấn đề quản lý nhóm trong môi trƣờng phân tán có 
một số vấn đề cần giải quyết. Nếu thông tin của nhóm và các quy tắc cấp quyền đƣợc 
nhân bản hoàn toàn tại tất cả các vị trí, thì việc duy trì quyền truy xuất tƣơng tự nhƣ 
trong các hệ thống tập trung. Tuy nhiên việc duy trì các bản sao là tốn kém. Việc kiểm 
soát phi tập trung, tức là duy trì sự hoạt động tự trị vị trí sẽ khó khăn và phức tạp hơn 
rất nhiều. 
Nhân bản hoàn toàn cho các thông tin cấp quyền có ƣu điểm là kiểm soát cấp 
quyên đơn giản hơn và có thể thực hiện vào lúc biên dịch. Tuy nhiên, chi phí cho việc 
quản lý phân tán sẽ quá cao, nếu có rất nhiều vị trí trong hệ thống. 
3.7.3. Kiểm soát tính toàn vẹn ngữ nghĩa 
Một vấn đề quan trọng và khó khăn cho một hệ CSDL là bảo đảm đƣợc tính nhất 
quán cơ sở dữ liệu (Databasse Consistency). Một trạng thái CSDL đƣợc gọi là nhất 
quán nếu nó thỏa một tập các ràng buộc, đƣợc gọi là ràng buộc toàn vẹn ngữ nghĩa 
(Semantic Integrity Constrsint). Đảm bảo tính nhất quán của CSDL, kiểm soát toàn 
Tập bài giảng Cơ sở dữ liệu phân tán 
 171 
vẹn ngữ nghĩa bằng cách loại bỏ hoặc hoá giải các trình cập nhật làm cho CSDL không 
nhất quán. CSDL đã cập nhật nghĩa là đã thỏa tập các ràng buộc toàn vẹn. 
Có hai loại ràng buộc toàn vẹn: ràng buộc cấu trúc ( Structural Constraint) và ràng 
buộc hành vi (Behavioral Constraint). Ràng buộc cấu trúc mô tả những đặc tính ngữ 
nghĩa cơ bản của mô hình. Ví dụ nhƣ ràng buộc khóa trong mô hình quan hệ, hoặc các 
liên kết một -nhiều giữa các đối tƣợng trong mô hình mạng. Ngƣợc lại, ràng buộc hành 
vi mô tả mối liên kết giữa các đối tƣợng, nhƣ khái niệm phụ thuộc hàm trong mô hình 
quan hệ. 
1) Kiểm soát toàn vẹn ngữ nghĩa tập trung 
Một tiểu hệ thống kiểm soát toàn vẹn ngữ nghĩa có hai thành phần chính: một 
ngôn ngữ cho phép diễn tả và thao tác các phán đoán toàn vẹn, và một định chế chịu 
trách nhiệm thực hiện các hành động cụ thể nhằm ép buộc tính toàn ven khi có cập 
nhật. 
a) Các loại ràng buộc: Bằng một ngôn ngữ cấp cao, ngƣời quản trị cơ sở dữ 
liệu có thể thiết lập đƣợc các ràng buộc toàn vẹn, khi tạo quan hệ hoặc khi quan hệ 
đã có dữ liệu, có chung một cú pháp. Ngôn ngữ này cho phép mô tả, ghi nhận hoặc 
loại bỏ ràng buộc toàn vẹn. Trong các hệ CSDL quan hệ, ràng buộc toàn vẹn đƣợc 
định nghĩa nhƣ là các phán đoán. Một phán đoán (Assertion) là một biểu thức đặc biệt 
đƣợc mô tả bằng phép tính quan hệ bộ, trong đó mỗi biến đƣợc lƣợng từ hóa với mọi 
(∀) hoặc tồn tại (∃). Vì vậy, một phán đoán có thể đƣợc xem nhƣ là một lƣợng từ 
hóa câu truy vấn, mang giá trị đúng hoặc sai cho mỗi bộ trong tích Đề các của các 
quan hệ đƣợc xác định bởi các biến bộ. Có ba loại ràng buộc toàn vẹn: ràng buộc 
tiền định, ràng buộc tiền dịch hoặc ràng buộc tổng quát. 
b) Ép buộc thực thi ràng buộc: Ép buộc thực thi ràng buộc toàn vẹn nghĩa là thực 
hiện việc loại bỏ những chƣơng trình cập nhật vi phạm một số ràng buộc nào đó. 
Một ràng buộc bị vi phạm do các hành động cập nhật hoặc do các phán đoán ràng 
buộc bị sai. Có hai phƣơng pháp cơ bản cho phép loại bỏ các trình cập nhật phát sinh 
mâu thuẫn. 
Phƣơng pháp phát hiện mâu thuẫn (không nhất quán): Một thao tác cập nhật u 
đƣợc thi hành sẽ biến đổi CSDL từ trạng thái D sang trạng thái Du..Thuật toán ép buộc 
phải khẳng định rằng mọi ràng buộc liên quan vẫn đúng trong Du bằng cách áp 
dụng các ràng buộc này để kiểm tra. Nếu trạng thái Du không nhất quán, hệ quản trị 
CSDL sẽ chuyển sang một trạng thái Du‟ khác bằng cách hiệu chỉnh lại Du hoặc phải 
khôi phục lại trạng thái D. Vì những kiểm tra này đƣợc áp dụng sau khi trạng thái 
của CSDL đã thay đổi nên đƣợc gọi là kiểm tra sau (Posttest). Phƣơng pháp này 
Tập bài giảng Cơ sở dữ liệu phân tán 
172 
sẽ không hiệu quả nếu hệ thống phản hồi lại rất nhiều thao tác khi ràng buộc bị vi 
phạm. 
Phƣơng pháp ngăn chặn mâu thuẫn: Một thao tác chỉ đƣợc thực hiện nếu nó 
chuyển CSDL sang một trạng thái nhất quán khác. Các bộ cần cập nhật đã có sẵn 
(trong trƣờng hợp chèn) hoặc phải truy nhập trong CSDL (trƣờng hợp xóa hoặc hiệu 
chỉnh). Thuật toán ép buộc xác nhận rằng tất cả các ràng buộc có liên đới đều đúng 
sau khi cập nhật các bộ. Nói chung, nó đƣợc thực hiện bằng cách áp dụng các kiểm 
tra có đƣợc từ các ràng buộc cho các bộ. Nhƣ vậy, các kiểm tra đƣợc áp dụng trƣớc 
khi trạng thái của CSDL bị thay đổi, nên gọi là các kiểm tra trƣớc (Pretest). Phƣơng 
pháp ngăn chặn này hiệu quả hơn phƣơng pháp phát hiện vì không bao giờ phải hồi lại 
các thao tác cập nhật do ràng buộc bị vi phạm. 
Thuật toán hiệu chỉnh truy vấn là một ví dụ về phƣơng pháp ngăn chặn, có hiệu 
quả đặc biệt trong việc ép buộc các ràng buộc miền biến thiên. Nó đƣa thêm lƣợng từ 
hóa phán đoán vào lƣợng từ hóa truy vấn bằng toán tử AND, vì thể câu truy vấn đƣợc 
hiệu chỉnh có thể đƣợc ép buộc toàn vẹn. 
2) Kiểm soát toàn vẹn ngữ nghĩa phân tán 
Các thuật toán đảm bảo tính toàn vẹn ngữ nghĩa của các CSDL phân tán, đƣợc mở 
rộng từ các phƣơng pháp đơn giản trong phần kiểm soát toàn vẹn ngữ nghĩa tập 
trung. Giả thiết các thuật toán có tính đến yếu tố tự trị vị trí, nghĩa là mỗi vị trí có thể 
xử lý các câu truy vấn cục bộ và thực hiện việc kiểm soát dữ liệu nhƣ một hệ quản trị 
CSDL tập trung. Giả thiết này làm đơn giản việc mô tả phƣơng pháp. Hai vấn đề 
chính của thiết kế một tiểu hệ thống kiểm soát toàn vẹn trong một hệ quả trị CSDL 
phân tán, đó là vấn đề định nghĩa và lƣu trữ các phán đoán và vấn đề ép buộc thi hành 
các phán đoán này.. 
Định nghĩa các phán đoán toàn vẹn phân tán: Giả sử một phán đoán toàn vẹn 
đƣợc diễn tả bằng phép tính quan hệ bộ. Mỗi phán đoán đƣợc coi là một lƣợng từ 
hóa truy vấn, trong đó nó nhận giá trị đúng hoặc sai với mỗi bộ trong tích Đề các của 
các quan hệ đƣợc xác định bằng các biến bộ. Các phán đoán có thể liên quan đến dữ 
liệu lƣu trên nhiều vị trí khác nhau. Vì vậy chọn vị trí lƣu trữ phán đoán sao cho 
giảm thiểu chi phí kiểm tra toàn vẹn. Một chiến lƣợc phán đoán toàn vẹn chia ra ba 
lớp: 
Phán đoán riêng: là các phán đoán đơn biến đơn quan hệ. Chỉ đề cập đến các bộ 
đƣợc cập nhật, độc lập với phần còn lại của CSDL. Ràng buộc miền giá trị của ví dụ 
“Ngân sách của một dự án trong khoảng 500000 đến 1000000” là một phán đoán riêng. 
Phán đoán hướng tập hợp: Bao gồm các ràng buộc đa biến đơn quan hệ nhƣ phụ 
thuộc hàm (mã số nhân viên xác định tên nhân viên) và đa biến đa quan hệ nhƣ các 
ràng buộc khóa ngoại. 
Tập bài giảng Cơ sở dữ liệu phân tán 
 173 
Phán đoán có các hàm gộp: Đòi hỏi phải đƣợc xử lý đặc biệt do chi phí ƣớc lƣợng 
hàm gộp. 
Định nghĩa một phán đoán toàn vẹn có thể đƣợc bắt đầu tại một vị trí có lƣu các 
quan hệ trong phán đoán. Quan hệ có thể bị phân mảnh, một vị từ phân mảnh là một 
trƣờng hợp đặc biệt của phán đoán thuộc lớp 1. Các mảnh khác nhau của một quan hệ 
có thể có trên nhiều vị trí khác nhau. Vì vậy, định nghĩa một phán đoán toàn vẹn sẽ là 
một thao tác phân tán và đƣợc thực hiện qua hai bƣớc. Bƣớc đầu tiên biến đổi các 
phán đoán ở cấp cao thành các phán đoán biên dịch. Bƣớc tiếp theo là lƣu trữ các phán 
đoán này tùy theo lớp phán đoán. Các phán đoán thuộc lớp 3 đƣợc xử lý giống nhƣ 
các phán đoán thuộc lớp 1 hoặc 2, tùy thuộc vào đặc tính của chúng là riêng hay theo 
tập hợp. 
Phán đoán riêng: Định nghĩa phán đoán đƣợc gửi đến tất cả vị trí lƣu trữ mảnh của 
quan hệ có mặt trong phán đoán. Phán đoán phải tƣơng thích với dữ liệu của quan 
hệ tại mỗi vị trí. Tính tƣơng thích có thể đƣợc kiểm tra ở hai cấp: cấp vị từ và cấp 
dữ liệu. 
Trƣớc tiên, tƣơng thích vị từ đƣợc xác nhận bằng cách so sánh vị từ phán đoán với 
vị từ mảnh. Một phán đoán C đƣợc coi là không tƣơng thích với vị từ mảnh p nếu “C 
đúng” dẫn đến “p sai”, và ngƣợc lại thì đƣợc coi là tƣơng thích. Nếu không tƣơng 
thích tại một vị trí, định nghĩa phán đoán phải bị loại bỏ ở mức toàn cục vì các bộ của 
mảnh đó không thỏa mãn ràng buộc toàn vẹn này. Nếu có tƣơng thích vị từ, phán 
đoán sẽ đƣợc kiểm tra ứng với thể hiện của mảnh. Nếu thể hiện đó không thỏa mãn 
phán đoán thì nó cũng bị loại bỏ ở mức toàn cục. Nếu tƣơng thích, phán đoán sẽ đƣợc 
lƣu lại tại mỗi vị trí. Việc kiểm tra tính tƣơng thích đƣợc thực hiện cho các phán đoán 
biên dịch với kiểu cập nhật là “chèn” (các bộ trong các mảnh coi nhƣ là “đƣợc chèn 
vào”). 
Phán đoán hướng tập hợp: Phán đoán hƣớng tập hợp thuộc loại đa quan hệ, nghĩa 
là có các vị từ kết nối. Tuy nhiên mỗi phán đoán biên dịch chỉ đƣợc liên kết với một 
quan hệ. Vì vậy định nghĩa phán đoán có thể đƣợc gửi đến tất cả các vị trí chứa các 
mảnh đƣợc các biến này tham chiếu. Việc kiểm tra tính tƣơng thích bao gồm các 
mảnh của quan hệ đƣợc sử dụng trong vị từ nối. Tƣơng thích vị từ sẽ không có tác 
dụng vì không thể suy một vị từ mảnh P sai nếu phán đoán C (dựa trên vị từ kết nối) 
là đúng. Vì vậy, cần phải kiểm tra C theo dữ liệu, đòi hỏi phải nối mỗi mảnh của 
quan hệ R với tất cả các mảnh của quan hệ S, là hai quan hệ có trong vị từ kết nối. Nhƣ 
vậy chi phí sẽ rất cao nhƣ các phép kết nối. Cần phải tối ƣu hóa bằng cách xử lý truy 
vấn phân tán. Ba tình huống theo mức chi phí có thể xảy ra: 
Tập bài giảng Cơ sở dữ liệu phân tán 
174 
- Các mảnh của R đƣợc dẫn xuất từ các mảnh của S dựa vào một kết nối nửa trên 
thuộc tính đƣợc dùng trong vị từ kết nối. Trong trƣờng hợp này kiểm tra tƣơng thích 
có chi phí thấp vì bộ của S đối sánh đƣợc với một bộ của R sẽ ở cùng một vị trí. 
- S đƣợc phân mảnh trên thuộc tính kết nối. Mỗi bộ của R phải đƣợc so sánh với 
tối đa một mảnh của S, vì giá trị thuộc tính nối của bộ thuộc R có thể đƣợc dùng để 
tìm vị trí mảnh tƣơng ứng của S. 
- S không đƣợc phân mảnh trên thuộc tính kết nối. Mỗi bộ của R phải đƣợc so 
sánh với tất cả các bộ của R đều đƣợc đảm bảo tƣơng thích thì phán đoán sẽ đƣợc lƣu 
lại tại mỗi vị trí. 

File đính kèm:

  • pdftap_bai_giang_co_so_du_lieu_phan_tan_phan_1.pdf