Học SQL Server 2000
Data Integrity and Advanced Query Technique
Nói đến Data Integrity là ta nói đến tính toàn vẹn của một database hay nói một
cách khác là data chứa trong database phải chính xác và đáng tin cậy. Nếu data
chứa trong database không chính xác ta nói database mất tính toàn vẹn (lost
data integrity). Trong bài này chúng ta sẽ bàn qua các phương pháp để giữ cho
database được toàn vẹn.
tới lần backup gần nhất mà thôi. HỌC SQL SERVER 2000 28 Như vậy khi restore database ta có thể chọn option WITH RECOVERY để roll back các transaction chưa được commited và database có thể hoạt động bình thường nhưng ta không thể restore thêm backup file nào nữa, thường option này được chọn khi restore file backup cuối cùng trong chuỗi backup. Nếu chọn option WITH NORECOVERY các transaction chưa được commited sẽ không được roll back do đó SQL Server sẽ không cho phép ta sử dụng database nhưng ta có thể tiếp tục restore các file backup kế tiếp, thường option này được chọn khi sau đó ta còn phải restore các file backup khác. Không lẽ chỉ có thể chọn một trong hai option trên mà thôi hay sao? Không hoàn toàn như vậy ta có thể chọn một option trung lập hơn là option WITH STANDBY (tức là option 3 "Leave database read-only and able to restore additional transaction logs" trong Enterprise Manager). Với option này ta sẽ có luôn đặc tính của hai option trên : các incomplete transaction sẽ được roll back để đảm bảo database consistent và có thể sử dụng được nhưng chỉ dưới dạng Read-only mà thôi, đồng thời sau đó ta có thể tiếp tục restore các file backup còn lại (SQL Server sẽ log các transaction được roll back trong undo log file và khi ta restore backup file kế tiếp SQL Server sẽ trả lại trạng thái no recovery từ những gì ghi trên undo file). Người ta dùng option này khi muốn restore database trở lại một thời điểm nào đó (a point in time) nhưng không rõ là đó có phải là thời điểm mà họ muốn không, cho nên họ sẽ restore từng backup file ở dạng Standby và kiểm chứng một số data xem đó có phải là thời điểm mà họ muốn restore hay không (chẳng hạn như trước khi bị delete hay trước khi một transaction nào đó được thực thi) trước khi chuyển sang Recovery option. Backup Database Trong phần này chúng ta sẽ bàn về cách backup database. Nhưng trước hết chúng ta hãy làm quen với một số thuật ngữ dùng trong quá trình backup và restore. Có những từ ta sẽ để nguyên tiếng Anh mà không dịch. Thuật Ngữ Giải Thích Backup Quá trình copy toàn bộ hay một phần của database, transaction log, file hay file group hình thành một backup set. Backup set được chứa trên backup media (tape or disk) bằng cách sử dụng một backup device (tape drive name hay physical filename) Backup Device Một file vật lý (như C:\SQLBackups\Full.bak) hay tape drive cụ thể (như \\.\Tape0) dùng để record một backup vào một backup media. Backup File File chứa một backup set Backup Media Disk hay tape được sử dụng để chứa một backup set. Backup media có thể chứa nhiều backup sets (ví dụ như từ nhiều SQL Server 2000 backups và từ nhiều Windows 2000 backups). Backup Set Một bộ backup từ một lần backup đơn được chứa trên backup media. HỌC SQL SERVER 2000 29 Chúng ta có thể tạo một backup device cố định (permanent) hay tạo ra một backup file mới cho mỗi lần backup. Thông thường chúng ta sẽ tạo một backup device cố định để có thể dùng đi dùng lại đặc biệt cho việc tự động hóa công việc backup. Ðể tạo một backup device dùng Enterprise Manager bạn chọn Management->Backup rồi Right-click->New Backup Device. Ngoài ra bạn có thể dùng sp_addumpdevice system stored procedure như ví dụ sau: USE Master Go Sp_addumpdevice 'disk' , 'FullBackupDevice' , 'E:\SQLBackups\Full.bak' Ðể backup database bạn có thể dùng Backup Wizard hoặc click lên trên database muốn backup sau đó Right-click->All Tasks->Backup Database... sẽ hiện ra window như hình vẽ sau: Sau đó dựa tùy theo yêu cầu của database mà chọn các option thích hợp. Ta có thể schedule cho SQL Server backup định kỳ. HỌC SQL SERVER 2000 30 Restore Database Trước khi restore database ta phải xác định được thứ tự file cần restore. Các thông tin này được SQL Server chứa trong msdb database và sẽ cho ta biết backup device nào, ai backup vào thời điểm nào. Sau đó ta tiến hành restore. Ðể restore bạn Right-click->All Tasks->Restore database... sẽ thấy window như hình vẽ sau: Nếu bạn restore từ một instance khác của SQL Server hay từ một server khác bạn có chọn From device option và chọn backup device (file backup) tương ứng . Lưu ý nếu bạn muốn overwrite database có sẵn với data được backup bạn có thể chọn option Force restore over existing database như hình vẽ sau: HỌC SQL SERVER 2000 31 Bạn có thể chọn leave database operational hay nonoperational tùy theo trường hợp như đã giải thích ở trên. Tóm lại trong bài này chúng ta đã tìm hiểu một chút lý thuyết về backup và restore database trong SQL Server. Ðể có thể hiểu rõ hơn bạn cần phải thực tập hay làm thử để có thêm kinh nghiệm. Trong bài sau chúng ta sẽ bàn về đề tài Data Integrity nghĩa là làm sao để đảm bảo data chứa trong database là đáng tin cậy và không bị "lũng lỗ" như cách nói bình dân mà tôi thường hay dùng. Data Integrity and Advanced Query Technique Nói đến Data Integrity là ta nói đến tính toàn vẹn của một database hay nói một cách khác là data chứa trong database phải chính xác và đáng tin cậy. Nếu data chứa trong database không chính xác ta nói database mất tính toàn vẹn (lost data integrity). Trong bài này chúng ta sẽ bàn qua các phương pháp để giữ cho database được toàn vẹn. HỌC SQL SERVER 2000 32 Các Phương Pháp Ðảm Bảo Data Integrity SQL Server dùng một số cách để đảm bảo Data Integrity. Một số cách như Triggers hay Index sẽ được bàn đến trong các bài sau tuy nhiên trong phạm vi bài này chúng ta cũng nói sơ qua các cách trên. • Data Type : Data type cũng có thể đảm bảo tính toàn vẹn của data ví dụ bạn khai báo data type của một cột là Integer thì bạn không thể đưa giá trị thuộc dạng String vào được. • Not Null Definitions : Null là một loại giá trị đặc biệt, nó không tương đương với zero, blank hay empty string " " mà có nghĩa là không biết (unknown) hay chưa được định nghĩa (undefined). Khi thiết kế database ta nên luôn cẩn thận trong việc cho phép một cột được Null hay Not Null vì việc chứa Null data có thể làm cho một số ứng dụng vốn không xửa lý null data kỹ lưỡng bị "té". • Default Definitions : Nếu một cột được cho một giá trị default thì khi bạn không đưa vào một giá trị cụ thể nào thì SQL Server sẽ dùng giá trị mặc định này. Bạn phải dùng Default đối với Not Null definition. • Identity Properties : Data thuộc dạng ID sẽ đảm bảo tính duy nhất của data trong table. • Constraints : Ðây sẽ là phần mà ta đào sâu trong bài này. Constraint tạm dịch là những ràng buộc mà ta dùng để đảm bảo tính toàn vẹn của data. Constraints là những quy luật mà ta áp đặt lên một cột để đảm bảo tính chính xác của dữ liệu được nhập vào. • Rules : Ðây là một object mang tính backward-compatible chủ yếu để tương thích với các version trước đây của SQL Server. Rules tương đương với CHECK Constraint trong SQL Server 2000 nhưng người ta có xu hướng sử dụng CHECK Constraint vì nó chính xác hơn và có thể đặt nhiều Constraints lên một cột trong khi đó chỉ có một rule cho một cột mà thôi. Chú ý rule là một object riêng và sau đó liên kết với một cột nào đó của table trong khi CHECK constraint là một thuộc tính của table nên có thể được tạo ra với lệnh CREATE TABLE. • Triggers : Một loại stored procedure đặc biệt được thực thi một cách tự động khi một table được Update, Insert, hay Delete. Ví dụ ta muốn khi một món hàng được bán ra thì tổng số hàng hóa trong kho phải được giảm xuống (-1) chẳng hạn khi đó ta có thể dùng trigger để đảm bảo chuyện đó. Triggers sẽ được bàn kỹ trong các bài sau. • Indexes : sẽ được bàn đến trong bài nói về Indexes. HỌC SQL SERVER 2000 33 Constraints Constraints là những thuộc tính (property) mà ta áp đặt lên một table hay một cột để tránh việc lưu dữ liệu không chính xác vào database (invalid data). Thật ra NOT NULL hay DEFAULT cũng được xem là một dạng constraint nhưng chúng ta không bao gồm hai loại này ở đây mà chỉ trình bày 4 loại constraints là Primary Key Constraint, Unique Constraint, Foreign Key Constraint và Check Constraint. Primary Key Constraint: Một table thường có một hay nhiều cột có giá trị mang tính duy nhất để xác định một hàng bất kỳ trong table. Ta thường gọi là Primary Key và được tạo ra khi ta Create hay Alter một table với Primary Key Constraint. Một table chỉ có thể có một Primary Key constraint. Có thể có nhiều cột tham gia vào việc tạo nên một Primary Key, các cột này không thể chứa Null và giá trị trong các cột thành viên có thể trùng nhau nhưng giá trị của tất cả các cột tạo nên Primary Key phải mang tính duy nhất. Khi một Primary Key được tạo ra một Unique Index sẽ được tự động tạo ra để duy trì tính duy nhất. Nếu trong table đó chưa có Clustered Index thì một Unique + Clustered Index sẽ được tạo ra. Có thể tạo ra Primary Key Constraints như sau: CREATE TABLE Table1 (Col1 INT PRIMARY KEY, Col2 VARCHAR(30) ) hay CREATE TABLE Table1 (Col1 INT, Col2 VARCHAR(30), CONSTRAINT table_pk PRIMARY KEY (Col1) ) Unique Constraint Bạn có thể tạo Unique Constraint để đảm bảo giá trị của một cột nào đó không bị trùng lập. Tuy Unique Constraint và Primary Key Constraint đều đảm bảo tính duy nhất nhưng bạn nên dùng Unique Constraint trong những trường hợp sau: HỌC SQL SERVER 2000 34 • Nếu một cột (hay một sự kết hợp giữa nhiều cột) không phải là primary key. Nên nhớ chỉ có một Primary Key Constraint trong một table trong khi ta có thể có nhiều Unique Constraint trên một table. • Nếu một cột cho phép chứa Null. Unique constraint có thể áp đặt lên một cột chứa giá trị Null trong khi primary key constraint thì không. Cách tạo ra Unique Constraint cũng tương tự như Primary Key Constraint chỉ việc thay chữ Primary Key thành Unique. SQL Server sẽ tự động tạo ra một non- clustered unique index khi ta tạo một Unique Constraint. Foreign Key Constraint Foreign Key là một cột hay một sự kết hợp của nhiều cột được sử dụng để áp đặt mối liên kết data giữa hai table. Foreign key của một table sẽ giữ giá trị của Primary key của một table khác và chúng ta có thể tạo ra nhiều Foreign key trong một table. Foreign key có thể reference (tham chiếu) vào Primary Key hay cột có Unique Constraints. Foreign key có thể chứa Null. Mặc dù mục đích chính của Foreign Key Constraint là để kiểm soát data chứa trong table có Foreign key (tức table con) nhưng thực chất nó cũng kiểm soát luôn cả data trong table chứa Primary key (tức table cha). Ví dụ nếu ta delete data trong table cha thì data trong table con trở nên "mồ côi" (orphan) vì không thể reference ngược về table cha. Do đó Foreign Key constraint sẽ đảm bảo điều đó không xảy ra. Nếu bạn muốn delete data trong table cha thì trước hết bạn phải drop hay disable Foreign key trong table con trước. Có thể tạo ra Foreign Key Constraints như sau: CREATE TABLE Table1 (Col1 INT PRIMARY KEY, Col2 INT REFERENCES Employees(EmployeeID) ) hay CREATE TABLE Table1 (Col1 INT PRIMARY KEY, Col2 INT, CONSTRAINT col2_fk FOREIGN KEY (Col2) REFERENCES Employees (EmployeeID) ) Ðôi khi chúng ta cũng cần Disable Foreign Key Constraint trong trường hợp: HỌC SQL SERVER 2000 35 • Insert hay Update: Nếu data insert vào sẽ vi phạm những ràng buộc có sẵn (violate constraint) hay constraint của ta chỉ muốn áp dụng cho data hiện thời mà thôi chứ không phải data sẽ insert. • Tiến hành quá trình replicate. Nếu không disable Foreign Key Constraint khi replicate data thì có thể cản trở quá trình copy data từ source table tới destination table một cách không cần thiết. Check Constraint Check Constraint dùng để giới hạn hay kiểm soát giá trị được phép insert vào một cột. Check Constraint giống Foreign Key Constraint ở chỗ nó kiểm soát giá trị đưa vào một cột nhưng khác ở chỗ Foreign Key Constraint dựa trên giá trị ở table cha để cho phép một giá trị được chấp nhận hay không trong khi Check Constraint dựa trên một biểu thức logic (logic expression) để kiểm tra xem một giá trị có hợp lệ không. Ví dụ ta có thể áp đặt một Check Constraint lên cột salary để chỉ chấp nhận tiền lương từ $15000 đến $100000/năm. Ta có thể tạo ra nhiều Check Constraint trên một cột. Ngoài ra ta có thể tạo một Check Constraint trên nhiều cột bằng cách tạo ra Check Constraint ở mức table (table level). Có thể tạo ra Check Constraint như sau: CREATE TABLE Table1 (Col1 INT PRIMARY KEY, Col2 INT CONSTRAINT limit_amount CHECK (Col2 BETWEEN 0 AND 1000), Col3 VARCHAR(30) ) Trong ví dụ này ta giới hạn giá trị chấp nhận được của cột Col2 từ 0 đến 1000. Ví dụ sau sẽ tạo ra một Check Constraint giống như trên nhưng ở table level: CREATE TABLE Table1 (Col1 INT PRIMARY KEY, Col2 INT, Col3 VARCHAR(30), CONSTRAINT limit_amount CHECK (Col2 BETWEEN 0 AND 1000) ) Tương tự như Foreign Key Constraint đôi khi ta cũng cần disable Check Constraint trong trường hợp Insert hay Update mà việc kiểm soát tính hợp lệ của data không áp dụng cho data hiện tại. Trường hợp thứ hai là replication. Muốn xem hay tạo ra Constraint bằng Enterprise Manager thì làm như sau: HỌC SQL SERVER 2000 36 Click lên trên một table nào đó và chọn Design Table-> Click vào icon bên phải "Manage Constraints..." Advanced Query Techniques Trong phần này chúng ta sẽ đào sâu một số câu lệnh nâng cao như SELECT, INSERT... Có thể nói hầu như ai cũng biết qua câu lệnh căn bản kiểu như "SELECT * FROM TABLENAME WHERE..." nhưng có thể có nhiều người không biết đến những tính chất nâng cao của nó. Cú pháp đầy đủ của một câu lệnh SELECT rất phức tạp tuy nhiên ở đây chỉ trình bày những nét chính của lệnh này mà thôi: SELECT select_list [ INTO new_table ] FROM table_source [ WHERE search_condition ] [ GROUP BY group_by_expression ] [ HAVING search_condition ] [ ORDER BY order_expression [ ASC | DESC ] ] Chúng ta sẽ lần lượt nghiên cứu từng clause (mệnh đề) trong câu lệnh này. SELECT Clause Sau keyword (từ khóa) SELECT ta sẽ có một danh sách các cột mà ta muốn select được cách nhau bằng dấu ",". Có 3 Keywords cần nhấn mạnh trong phần SELECT. • Distinct : Khi có keyword này vào thì sẽ cho kết quả các cột không trùng nhau. Ví dụ trong Orders table của Norwind database (database mẫu di kèm với SQL Server) chứa giá trị trùng lập (duplicate value) trong cột ShipCity. Nếu ta muốn select một danh sách ShipCity trong đó mỗi city chỉ xuất hiện một lần trong kết quả nhận được ta dùng như sau: SELECT DISTINCT ShipCity, ShipRegion FROM Orders ORDER BY ShipCity • Top n : Nếu ta muốn select n hàng đầu tiên mà thôi ta có thể dùng Top keyword. Nếu có thêm ORDER BY thì kết quả sẽ được order trước sau đó mới select. Chúng ta cũng có thể select số hàng HỌC SQL SERVER 2000 37 dựa trên phần trăm bằng cách thêm Keyword Percent vào. Ví dụ sau sẽ select 10 hàng đầu tiên theo thứ tự: SELECT DISTINCT TOP 10 ShipCity, ShipRegion FROM Orders ORDER BY ShipCity • As : Ðôi khi chúng ta muốn cho SELECT statement dễ đọc hơn một chút ta có thể dùng một alias (tức là từ thay thế hay từ viết tắt) với keyword As hay không có keyword As: table_name As table_alias hay table_name table_alias. Ví dụ: USE pubs SELECT p.pub_id, p.pub_name AS PubName FROM publishers AS p Ngoài ra trong Select list ta có thể select dưới dạng một expression như sau: SELECT FirstName + ' ' + LastName AS "Employee Name", IDENTITYCOL AS "Employee ID", HomePhone, Region FROM Northwind.dbo.Employees ORDER BY LastName, FirstName ASC Trong ví dụ trên ta select cột "Employee Name" là sản phẩm ghép lại của cột FirstName và LastName được cách nhau bằng một khoảng trắng. Một giá trị thuộc loại identity để làm cột "Employee ID". Kết quả sẽ được sắp theo thứ tự từ nhỏ tới lớn (ASC) (còn DESC là từ lớn tới nhỏ) trong đó cột LastName được sắp trước rồi mới tới cột FirstName. The INTO Clause INTO Clause cho phép ta select data từ một hay nhiều table sau đó kết quả sẽ được insert vào một table mới. Table này được tạo ra do kết quả của câu lệnh SELECT INTO. Ví dụ: SELECT FirstName, LastName INTO EmployeeNames FROM Employers Câu lệnh tên sẽ tạo ra một table mới có tên là EmployeeNames với 2 cột là FirstName và LastName sau đó kết quả select được từ table Employers sẽ được insert vào table mới này. Nếu table EmployeeNames tồn tại SQL Server sẽ báo lỗi. Câu lệnh này thường hay được sử dụng để select một lượng data lớn từ nhiều table khác nhau vào một table mới (thường dùng cho mục đích tạm thời (temporary table)) mà khỏi phải thực thi câu lệnh Insert nhiều lần. HỌC SQL SERVER 2000 38 Một cách khác cũng select data từ một hay nhiều table và insert vào một table khác là dùng "Insert Into...Select...". Nhưng câu lệnh này không tạo ra một table mới. Nghĩa là ta table đó phải tồn tại trước. Ví dụ: INSERT INTO EmployeeNames SELECT FirstName, LastName FROM Employers Chú ý là không có chữ "Value" trong câu Insert này. The GROUP BY and HAVING Clauses GROUP BY dùng để tạo ra các giá trị tổng (aggregate values) cho từng hàng trong kết quả select được. Chỉ có một hàng cho từng giá trị riêng biệt (distinct) của từng cột. Các cột được select đều phải nằm trong GROUP BY Clause. Hãy xem ví dụ phức tạp sau: SELECT OrdD1.OrderID AS OrderID, SUM(OrdD1.Quantity) AS "Units Sold", SUM(OrdD1.UnitPrice * OrdD1.Quantity) AS Revenue FROM [Order Details] AS OrdD1 WHERE OrdD1.OrderID in (SELECT DISTINCT OrdD2.OrderID FROM [Order Details] AS OrdD2 WHERE OrdD2.UnitPrice > $100) GROUP BY OrdD1.OrderID HAVING SUM(OrdD1.Quantity) > 100 Trong ví dụ trên đầu tiên ta select những order riêng biệt (distinct) từ Order Details table với giá > 100. Sau đó tiếp tục select OrderID, "Units Sold", Revenue từ kết quả trên trong đó "Units Sold" và Revenue là những aggregate columns (cho giá trị tổng một cột của những hàng có cùng OrderID). HAVING Clause đóng vai trò như một filter dùng để lọc lại các giá trị cần select mà thôi. HAVING Clause thường đi chung với GROUP BY mặc dù có thể xuất hiện riêng lẻ. UNION Uninon keyword có nhiệm vụ ghép nối kết quả của 2 hay nhiều queries lại thành một kết quả. Ví dụ: Giả sử có table1(ColumnA varchar(10), ColumnB int) và table2(ColumnC varchar(10), ColumnD int). Ta muốn select data từ table1 và ghép với data từ table2 để tạo thành một kết quả duy nhất ta làm như sau: SELECT * FROM Table1 UNION ALL SELECT * FROM Table2 HỌC SQL SERVER 2000 39 Nếu không có keyword ALL thì những hàng giống nhau từ 2 table sẽ chỉ xuất hiện một lần trong kết quả. Còn khi dùng ALL thì các hàng trong 2 table đều có trong kết quả bất chấp việc lập lại. Khi Dùng Union phải chú ý hai chuyện: số cột select ở 2 queries phải bằng nhau và data type của các cột tương ứng phải compatible (tương thích). Using JOINS Trong phần này chúng ta sẽ tìm hiểu về các loại Join trong SQL Server. Bằng cách sử dụng JOIN bạn có thể select data từ nhiều table dựa trên mối quan hệ logic giữa các table (logical relationships). Có thể tóm tắt các loại Join thông dụng bằng các hình sau: Thứ tự từ trái sang phải: Inner Join, Left Outer Join, Right Outer Join, Full Outer Join Inner Joins Dùng Inner Join để select data từ 2 hay nhiều tables trong đó giá trị của các cột được join phải xuất hiện ở cả 2 tables tức là phần gạch chéo trên hình. Ví dụ: SELECT t.Title, p.Pub_name FROM Publishers AS p INNER JOIN Titles AS t ON p.Pub_id = t.Pub_id ORDER BY Title ASC Left Outer Joins Dùng Left Outer Join để select data từ 2 hay nhiều tables trong đó tất cả cột bên table thứ nhất và không tồn tại bên table thứ hai sẽ được select cộng với các giá trị của các cột được inner join. Số cột select được sẽ bằng với số cột của table thứ nhất. Tức là phần tô màu đỏ trên hình. Ví dụ: USE Pubs SELECT a.Au_fname, a.Au_lnam
File đính kèm:
- HOC SQL SERVER 2000.pdf