第四章
一、數(shù)據(jù)庫基本概念(一)信息、數(shù)據(jù)與數(shù)據(jù)處理
1.信息(information)
信息是現(xiàn)實世界事物的存在方式或運動狀態(tài)的反映。
2.數(shù)據(jù)(data)
數(shù)據(jù)是描述現(xiàn)實世界的符號記錄,是指用物理符號記錄下來的可以鑒別的信息。
3.信息與數(shù)據(jù)的關聯(lián)
數(shù)據(jù)是信息的符號表示,或稱載體;信息是數(shù)據(jù)的內涵,是數(shù)據(jù)的語義解釋。
4.信息處理
人們將原始信息表示成數(shù)據(jù)稱為源數(shù)據(jù),然后對這些源數(shù)據(jù)進行匯集、存儲、綜合、推導,從這些原始的、雜亂的、難以理解的數(shù)據(jù)中抽取或推導出新的數(shù)據(jù),這些新的數(shù)據(jù)稱為結果,結果數(shù)據(jù)對某些特定的人們來說是有價值的、有意義的,表示了新的信息,可以作為某種決策的依據(jù)或用于新的推導。這一過程通常稱為數(shù)據(jù)處理或信息處理。
(二)數(shù)據(jù)管理技術的發(fā)展與數(shù)據(jù)庫技術的產(chǎn)生
數(shù)據(jù)管理技術是指對數(shù)據(jù)的分類、組織、編碼、存儲、檢索和維護的技術。數(shù)據(jù)管理技術的發(fā)展經(jīng)歷了如下3個階段:
1.人工管理階段
人工管理數(shù)據(jù)的特點是:
(1)數(shù)據(jù)不保存。
(2)數(shù)據(jù)無專門軟件進行管理。
(3)數(shù)據(jù)不共享。
(4)數(shù)據(jù)不具有獨立性。
2.文件系統(tǒng)階段
該階段的數(shù)據(jù)管理具有如下特點:
(1)數(shù)據(jù)可以長期保存。
(2)由文件系統(tǒng)管理數(shù)據(jù)。文件系統(tǒng)管理數(shù)據(jù)存在如下缺點:
(1)數(shù)據(jù)共享性差,數(shù)據(jù)冗余度大。
(2)數(shù)據(jù)獨立性差。
3.數(shù)據(jù)庫系統(tǒng)階段
與人工管理和文件系統(tǒng)階段相比較,數(shù)據(jù)庫系統(tǒng)階段具有如下的特點:
(1)數(shù)據(jù)結構化
(2)數(shù)據(jù)共享性高、冗余度小、易擴充
(3)數(shù)據(jù)獨立性高
(4)統(tǒng)一的數(shù)據(jù)管理和控制數(shù)據(jù)庫管理系統(tǒng)必須提供以下幾個方面的數(shù)據(jù)控制和保護功能:
(1)數(shù)據(jù)的安全性(security)保護。
(2)數(shù)據(jù)的完整性(integrity)控制。
(3)數(shù)據(jù)庫恢復(recovery)。
(4)并發(fā)(concurrency)控制。
(5)事務(transaction)支持。
(三)數(shù)據(jù)庫、數(shù)據(jù)庫管理系統(tǒng)、數(shù)據(jù)庫系統(tǒng)
數(shù)據(jù)庫、數(shù)據(jù)庫管理系統(tǒng)和數(shù)據(jù)庫系統(tǒng)是與數(shù)據(jù)庫技術密切相關的3個基本概念。
1.數(shù)據(jù)庫(DB,DataBase)
數(shù)據(jù)庫是長期儲存在計算機內、有組織的、可共享的數(shù)據(jù)集合。數(shù)據(jù)庫中的數(shù)據(jù)按一定的數(shù)據(jù)模型組織、描述和儲存,具有較小的冗余度,較高的數(shù)據(jù)獨立性和易擴展性,并可為一定范圍內的各種用戶共享。
2.數(shù)據(jù)庫管理系統(tǒng)(DBMS,DataBase Management System)
數(shù)據(jù)庫管理系統(tǒng)是位于用戶與操作系統(tǒng)之間的一個數(shù)據(jù)管理軟件,它的基本功能包括以下幾個方面:
(1)數(shù)據(jù)定義功能
(2)數(shù)據(jù)操縱功能
(3)數(shù)據(jù)庫的運行管理
(4)數(shù)據(jù)庫的建立和維護功能3.數(shù)據(jù)庫系統(tǒng)(DBS,DataBase System)數(shù)據(jù)庫系統(tǒng)是指在計算機系統(tǒng)中引入數(shù)據(jù)庫后的系統(tǒng)構成,一般由數(shù)據(jù)庫、操作系統(tǒng)、數(shù)據(jù)庫管理系統(tǒng)(及其工具)、應用系統(tǒng)、數(shù)據(jù)庫管理員和用戶構成。
(1)數(shù)據(jù)庫系統(tǒng)中的計算機硬件平臺:①要有足夠大的內存,存放操作系統(tǒng)、DBMS的核心模塊、數(shù)據(jù)緩沖區(qū)和應用程序。②有足夠大的磁盤等直接存取設備存放數(shù)據(jù)庫,有足夠的磁帶(或微機軟盤)做數(shù)據(jù)備份。③要求系統(tǒng)有較高的通信能力,以提高數(shù)據(jù)傳送率。
(2)數(shù)據(jù)庫系統(tǒng)中的計算機軟件:①DBMS為數(shù)據(jù)庫的建立、使用和維護配置的軟件。②支持DBMS運行的操作系統(tǒng)(OS)。③具有與數(shù)據(jù)庫接口的高級語言及其編譯系統(tǒng),便于開發(fā)應用程序。④以DBMS為核心的應用開發(fā)工具。⑤為特定應用環(huán)境開發(fā)的數(shù)據(jù)庫應用系統(tǒng)。
(3)人員:數(shù)據(jù)庫管理員、系統(tǒng)分析員和數(shù)據(jù)庫設計人員、應用程序員和最終用戶。①數(shù)據(jù)庫管理員具體的職責包括:(a)決定數(shù)據(jù)庫中的信息內容和結構。(b)決定數(shù)據(jù)庫的存儲結構和存取策略。(c)定義數(shù)據(jù)的安全性要求和完整性約束條件。(d)監(jiān)控數(shù)據(jù)庫的使用和運行。(e)數(shù)據(jù)庫的性能改進。(f)定期對數(shù)據(jù)庫進行重組和重構,以提高系統(tǒng)的性能。②系統(tǒng)分析員和數(shù)據(jù)庫分析人員:系統(tǒng)分析員負責應用系統(tǒng)的需求分析和規(guī)范說明。數(shù)據(jù)庫設計人員負責數(shù)據(jù)庫中數(shù)據(jù)的確定、數(shù)據(jù)庫各級模式的設計。③應用程序員:應用程序員負責設計和編寫應用系統(tǒng)的程序模塊,并進行調試和安裝。④用戶:這里用戶是指最終用戶(End User)他們通過應用系統(tǒng)的用戶接口使用數(shù)據(jù)庫。
(四)數(shù)據(jù)庫技術的研究領域1.數(shù)據(jù)庫管理系統(tǒng)軟件的研制
研制的目標是提高系統(tǒng)的可用性、可靠性、可伸縮性,提高系統(tǒng)性能和提高用戶的生產(chǎn)率。
2.數(shù)據(jù)庫設計
主要任務是在DBMS的支持下,按照應用的要求,為某一部門或組織設計一個結構合理、使用方便、效率較高的數(shù)據(jù)庫及其應用系統(tǒng)。
3.數(shù)據(jù)庫理論
數(shù)據(jù)庫理論的研究主要集中于關系的規(guī)范化理論、關系數(shù)據(jù)理論等。
二、數(shù)據(jù)模型(一)數(shù)據(jù)模型的概念
數(shù)據(jù)模型是數(shù)據(jù)庫系統(tǒng)的數(shù)學形式框架,是用來描述數(shù)據(jù)的一組概念和定義,包括描述數(shù)據(jù)、數(shù)據(jù)操作、數(shù)據(jù)定義以及數(shù)據(jù)一致性概念的工具,即:①數(shù)據(jù)的靜態(tài)特征,它包括對數(shù)據(jù)結構和數(shù)據(jù)間聯(lián)系的描述。②數(shù)據(jù)的動態(tài)特征,一組定義在數(shù)據(jù)上的操作包括操作的含義、操作符、運算規(guī)則及其語言等。③數(shù)據(jù)的完整性約束,這是一組規(guī)則,數(shù)據(jù)庫中的數(shù)據(jù)必須滿足這組規(guī)則。根據(jù)模型應用的不同目的,可以將這些模型劃分為兩類。第一類模型是概念模型,也稱信息模型,它是按用戶的觀點對數(shù)據(jù)和信息建模。另一類模型是結構模型,主要包括網(wǎng)狀模型、層次模型、關系模型和面向對象模型等,它是按計算機系統(tǒng)的觀點對數(shù)據(jù)建模。
一、數(shù)據(jù)庫基本概念(一)信息、數(shù)據(jù)與數(shù)據(jù)處理
1.信息(information)
信息是現(xiàn)實世界事物的存在方式或運動狀態(tài)的反映。
2.數(shù)據(jù)(data)
數(shù)據(jù)是描述現(xiàn)實世界的符號記錄,是指用物理符號記錄下來的可以鑒別的信息。
3.信息與數(shù)據(jù)的關聯(lián)
數(shù)據(jù)是信息的符號表示,或稱載體;信息是數(shù)據(jù)的內涵,是數(shù)據(jù)的語義解釋。
4.信息處理
人們將原始信息表示成數(shù)據(jù)稱為源數(shù)據(jù),然后對這些源數(shù)據(jù)進行匯集、存儲、綜合、推導,從這些原始的、雜亂的、難以理解的數(shù)據(jù)中抽取或推導出新的數(shù)據(jù),這些新的數(shù)據(jù)稱為結果,結果數(shù)據(jù)對某些特定的人們來說是有價值的、有意義的,表示了新的信息,可以作為某種決策的依據(jù)或用于新的推導。這一過程通常稱為數(shù)據(jù)處理或信息處理。
(二)數(shù)據(jù)管理技術的發(fā)展與數(shù)據(jù)庫技術的產(chǎn)生
數(shù)據(jù)管理技術是指對數(shù)據(jù)的分類、組織、編碼、存儲、檢索和維護的技術。數(shù)據(jù)管理技術的發(fā)展經(jīng)歷了如下3個階段:
1.人工管理階段
人工管理數(shù)據(jù)的特點是:
(1)數(shù)據(jù)不保存。
(2)數(shù)據(jù)無專門軟件進行管理。
(3)數(shù)據(jù)不共享。
(4)數(shù)據(jù)不具有獨立性。
2.文件系統(tǒng)階段
該階段的數(shù)據(jù)管理具有如下特點:
(1)數(shù)據(jù)可以長期保存。
(2)由文件系統(tǒng)管理數(shù)據(jù)。文件系統(tǒng)管理數(shù)據(jù)存在如下缺點:
(1)數(shù)據(jù)共享性差,數(shù)據(jù)冗余度大。
(2)數(shù)據(jù)獨立性差。
3.數(shù)據(jù)庫系統(tǒng)階段
與人工管理和文件系統(tǒng)階段相比較,數(shù)據(jù)庫系統(tǒng)階段具有如下的特點:
(1)數(shù)據(jù)結構化
(2)數(shù)據(jù)共享性高、冗余度小、易擴充
(3)數(shù)據(jù)獨立性高
(4)統(tǒng)一的數(shù)據(jù)管理和控制數(shù)據(jù)庫管理系統(tǒng)必須提供以下幾個方面的數(shù)據(jù)控制和保護功能:
(1)數(shù)據(jù)的安全性(security)保護。
(2)數(shù)據(jù)的完整性(integrity)控制。
(3)數(shù)據(jù)庫恢復(recovery)。
(4)并發(fā)(concurrency)控制。
(5)事務(transaction)支持。
(三)數(shù)據(jù)庫、數(shù)據(jù)庫管理系統(tǒng)、數(shù)據(jù)庫系統(tǒng)
數(shù)據(jù)庫、數(shù)據(jù)庫管理系統(tǒng)和數(shù)據(jù)庫系統(tǒng)是與數(shù)據(jù)庫技術密切相關的3個基本概念。
1.數(shù)據(jù)庫(DB,DataBase)
數(shù)據(jù)庫是長期儲存在計算機內、有組織的、可共享的數(shù)據(jù)集合。數(shù)據(jù)庫中的數(shù)據(jù)按一定的數(shù)據(jù)模型組織、描述和儲存,具有較小的冗余度,較高的數(shù)據(jù)獨立性和易擴展性,并可為一定范圍內的各種用戶共享。
2.數(shù)據(jù)庫管理系統(tǒng)(DBMS,DataBase Management System)
數(shù)據(jù)庫管理系統(tǒng)是位于用戶與操作系統(tǒng)之間的一個數(shù)據(jù)管理軟件,它的基本功能包括以下幾個方面:
(1)數(shù)據(jù)定義功能
(2)數(shù)據(jù)操縱功能
(3)數(shù)據(jù)庫的運行管理
(4)數(shù)據(jù)庫的建立和維護功能3.數(shù)據(jù)庫系統(tǒng)(DBS,DataBase System)數(shù)據(jù)庫系統(tǒng)是指在計算機系統(tǒng)中引入數(shù)據(jù)庫后的系統(tǒng)構成,一般由數(shù)據(jù)庫、操作系統(tǒng)、數(shù)據(jù)庫管理系統(tǒng)(及其工具)、應用系統(tǒng)、數(shù)據(jù)庫管理員和用戶構成。
(1)數(shù)據(jù)庫系統(tǒng)中的計算機硬件平臺:①要有足夠大的內存,存放操作系統(tǒng)、DBMS的核心模塊、數(shù)據(jù)緩沖區(qū)和應用程序。②有足夠大的磁盤等直接存取設備存放數(shù)據(jù)庫,有足夠的磁帶(或微機軟盤)做數(shù)據(jù)備份。③要求系統(tǒng)有較高的通信能力,以提高數(shù)據(jù)傳送率。
(2)數(shù)據(jù)庫系統(tǒng)中的計算機軟件:①DBMS為數(shù)據(jù)庫的建立、使用和維護配置的軟件。②支持DBMS運行的操作系統(tǒng)(OS)。③具有與數(shù)據(jù)庫接口的高級語言及其編譯系統(tǒng),便于開發(fā)應用程序。④以DBMS為核心的應用開發(fā)工具。⑤為特定應用環(huán)境開發(fā)的數(shù)據(jù)庫應用系統(tǒng)。
(3)人員:數(shù)據(jù)庫管理員、系統(tǒng)分析員和數(shù)據(jù)庫設計人員、應用程序員和最終用戶。①數(shù)據(jù)庫管理員具體的職責包括:(a)決定數(shù)據(jù)庫中的信息內容和結構。(b)決定數(shù)據(jù)庫的存儲結構和存取策略。(c)定義數(shù)據(jù)的安全性要求和完整性約束條件。(d)監(jiān)控數(shù)據(jù)庫的使用和運行。(e)數(shù)據(jù)庫的性能改進。(f)定期對數(shù)據(jù)庫進行重組和重構,以提高系統(tǒng)的性能。②系統(tǒng)分析員和數(shù)據(jù)庫分析人員:系統(tǒng)分析員負責應用系統(tǒng)的需求分析和規(guī)范說明。數(shù)據(jù)庫設計人員負責數(shù)據(jù)庫中數(shù)據(jù)的確定、數(shù)據(jù)庫各級模式的設計。③應用程序員:應用程序員負責設計和編寫應用系統(tǒng)的程序模塊,并進行調試和安裝。④用戶:這里用戶是指最終用戶(End User)他們通過應用系統(tǒng)的用戶接口使用數(shù)據(jù)庫。
(四)數(shù)據(jù)庫技術的研究領域1.數(shù)據(jù)庫管理系統(tǒng)軟件的研制
研制的目標是提高系統(tǒng)的可用性、可靠性、可伸縮性,提高系統(tǒng)性能和提高用戶的生產(chǎn)率。
2.數(shù)據(jù)庫設計
主要任務是在DBMS的支持下,按照應用的要求,為某一部門或組織設計一個結構合理、使用方便、效率較高的數(shù)據(jù)庫及其應用系統(tǒng)。
3.數(shù)據(jù)庫理論
數(shù)據(jù)庫理論的研究主要集中于關系的規(guī)范化理論、關系數(shù)據(jù)理論等。
二、數(shù)據(jù)模型(一)數(shù)據(jù)模型的概念
數(shù)據(jù)模型是數(shù)據(jù)庫系統(tǒng)的數(shù)學形式框架,是用來描述數(shù)據(jù)的一組概念和定義,包括描述數(shù)據(jù)、數(shù)據(jù)操作、數(shù)據(jù)定義以及數(shù)據(jù)一致性概念的工具,即:①數(shù)據(jù)的靜態(tài)特征,它包括對數(shù)據(jù)結構和數(shù)據(jù)間聯(lián)系的描述。②數(shù)據(jù)的動態(tài)特征,一組定義在數(shù)據(jù)上的操作包括操作的含義、操作符、運算規(guī)則及其語言等。③數(shù)據(jù)的完整性約束,這是一組規(guī)則,數(shù)據(jù)庫中的數(shù)據(jù)必須滿足這組規(guī)則。根據(jù)模型應用的不同目的,可以將這些模型劃分為兩類。第一類模型是概念模型,也稱信息模型,它是按用戶的觀點對數(shù)據(jù)和信息建模。另一類模型是結構模型,主要包括網(wǎng)狀模型、層次模型、關系模型和面向對象模型等,它是按計算機系統(tǒng)的觀點對數(shù)據(jù)建模。

