數據結構研究成果_軟體開發所取得的成就有哪些

㈠軟體開發所取得的成就有哪些

面向對象(Object Oriented,OO)是當前計算機界關心的重點，它是90年代軟體開發方法的主流。面向對象的概念和應用已超越了程序設計和軟體開發，擴展到很寬的范圍。如資料庫系統、互動式界面、應用結構、應用平台、分布式系統、網路管理結構、CAD技術、人工智慧等領域。

談到面向對象，這方面的文章非常多。但是，明確地給出對象的定義或說明對象的定義的非常少——至少我現在還沒有發現。其初，「面向對象」是專指在程序設計中採用封裝、繼承、抽象等設計方法。可是，這個定義顯然不能再適合現在情況。面向對象的思想已經涉及到軟體開發的各個方面。如，面向對象的分析（OOA，Object Oriented Analysis），面向對象的設計（OOD，Object Oriented Design）、以及我們經常說的面向對象的編程實現（OOP，Object Oriented Programming）。許多有關面向對象的文章都只是講述在面向對象的開發中所需要注意的問題或所採用的比較好的設計方法。看這些文章只有真正懂得什麼是對象，什麼是面向對象，才能最大程度地對自己有所裨益。這一點，恐怕對初學者甚至是從事相關工作多年的人員也會對它們的概念模糊不清。

面向對象是當前計算機界關心的重點，它是90年代軟體開發方法的主流。面向對象的概念和應用已超越了程序設計和軟體開發，擴展到很寬的范圍。如資料庫系統、互動式界面、應用結構、應用平台、分布式系統、網路管理結構、CAD技術、人工智慧等領域。

一、傳統開發方法存在問題

1.軟體重用性差
重用性是指同一事物不經修改或稍加修改就可多次重復使用的性質。軟體重用性是軟體工程追求的目標之一。

2.軟體可維護性差
軟體工程強調軟體的可維護性，強調文檔資料的重要性，規定最終的軟體產品應該由完整、一致的配置成分組成。在軟體開發過程中，始終強調軟體的可讀性、可修改性和可測試性是軟體的重要的質量指標。實踐證明，用傳統方法開發出來的軟體，維護時其費用和成本仍然很高，其原因是可修改性差，維護困難，導致可維護性差。

3.開發出的軟體不能滿足用戶需要
用傳統的結構化方法開發大型軟體系統涉及各種不同領域的知識，在開發需求模糊或需求動態變化的系統時，所開發出的軟體系統往往不能真正滿足用戶的需要。

用結構化方法開發的軟體，其穩定性、可修改性和可重用性都比較差，這是因為結構化方法的本質是功能分解，從代表目標系統整體功能的單個處理著手，自頂向下不斷把復雜的處理分解為子處理，這樣一層一層的分解下去，直到僅剩下若干個容易實現的子處理功能為止，然後用相應的工具來描述各個最低層的處理。因此，結構化方法是圍繞實現處理功能的「過程」來構造系統的。然而，用戶需求的變化大部分是針對功能的，因此，這種變化對於基於過程的設計來說是災難性的。用這種方法設計出來的系統結構常常是不穩定的，用戶需求的變化往往造成系統結構的較大變化，從而需要花費很大代價才能實現這種變化。

二、面向對象的基本概念

(1)對象。
對象是人們要進行研究的任何事物，從最簡單的整數到復雜的飛機等均可看作對象，它不僅能表示具體的事物，還能表示抽象的規則、計劃或事件。

(2)對象的狀態和行為。
對象具有狀態，一個對象用數據值來描述它的狀態。
對象還有操作，用於改變對象的狀態，對象及其操作就是對象的行為。
對象實現了數據和操作的結合，使數據和操作封裝於對象的統一體中

(3)類。
具有相同或相似性質的對象的抽象就是類。因此，對象的抽象是類，類的具體化就是對象，也可以說類的實例是對象。
類具有屬性，它是對象的狀態的抽象，用數據結構來描述類的屬性。
類具有操作，它是對象的行為的抽象，用操作名和實現該操作的方法來描述。

(4)類的結構。
在客觀世界中有若干類，這些類之間有一定的結構關系。通常有兩種主要的結構關系，即一般--具體結構關系，整體--部分結構關系。

①一般——具體結構稱為分類結構，也可以說是「或」關系，或者是「is a」關系。
②整體——部分結構稱為組裝結構，它們之間的關系是一種「與」關系，或者是「has a」關系。

(5)消息和方法。
對象之間進行通信的結構叫做消息。在對象的操作中，當一個消息發送給某個對象時，消息包含接收對象去執行某種操作的信息。發送一條消息至少要包括說明接受消息的對象名、發送給該對象的消息名（即對象名、方法名）。一般還要對參數加以說明，參數可以是認識該消息的對象所知道的變數名，或者是所有對象都知道的全局變數名。

類中操作的實現過程叫做方法，一個方法有方法名、參數、方法體。消息傳遞如圖10-1所示。

二、面向對象的特徵

(1)對象唯一性。
每個對象都有自身唯一的標識，通過這種標識，可找到相應的對象。在對象的整個生命期中，它的標識都不改變，不同的對象不能有相同的標識。

(2)分類性。
分類性是指將具有一致的數據結構(屬性)和行為(操作)的對象抽象成類。一個類就是這樣一種抽象，它反映了與應用有關的重要性質，而忽略其他一些無關內容。任何類的劃分都是主觀的，但必須與具體的應用有關。

(3)繼承性。
繼承性是子類自動共享父類數據結構和方法的機制，這是類之間的一種關系。在定義和實現一個類的時候，可以在一個已經存在的類的基礎之上來進行，把這個已經存在的類所定義的內容作為自己的內容，並加入若干新的內容。

繼承性是面向對象程序設計語言不同於其它語言的最重要的特點，是其他語言所沒有的。

在類層次中，子類只繼承一個父類的數據結構和方法，則稱為單重繼承。
在類層次中，子類繼承了多個父類的數據結構和方法，則稱為多重繼承。
在軟體開發中，類的繼承性使所建立的軟體具有開放性、可擴充性，這是信息組織與分類的行之有效的方法，它簡化了對象、類的創建工作量，增加了代碼的可重性。
採用繼承性，提供了類的規范的等級結構。通過類的繼承關系，使公共的特性能夠共享，提高了軟體的重用性。

(4)多態性(多形性)
多態性使指相同的操作或函數、過程可作用於多種類型的對象上並獲得不同的結果。不同的對象，收到同一消息可以產生不同的結果，這種現象稱為多態性。
多態性允許每個對象以適合自身的方式去響應共同的消息。
多態性增強了軟體的靈活性和重用性。

三、面向對象的要素

(1)抽象。
抽象是指強調實體的本質、內在的屬性。在系統開發中，抽象指的是在決定如何實現對象之前的對象的意義和行為。使用抽象可以盡可能避免過早考慮一些細節。

類實現了對象的數據（即狀態）和行為的抽象。

(2)封裝性（信息隱藏）。
封裝性是保證軟體部件具有優良的模塊性的基礎。
面向對象的類是封裝良好的模塊，類定義將其說明（用戶可見的外部介面）與實現（用戶不可見的內部實現）顯式地分開，其內部實現按其具體定義的作用域提供保護。
對象是封裝的最基本單位。封裝防止了程序相互依賴性而帶來的變動影響。面向對象的封裝比傳統語言的封裝更為清晰、更為有力。

(3)共享性
面向對象技術在不同級別上促進了共享
同一類中的共享。同一類中的對象有著相同數據結構。這些對象之間是結構、行為特徵的共享關系。
在同一應用中共享。在同一應用的類層次結構中，存在繼承關系的各相似子類中，存在數據結構和行為的繼承，使各相似子類共享共同的結構和行為。使用繼承來實現代碼的共享，這也是面向對象的主要優點之一。
在不同應用中共享。面向對象不僅允許在同一應用中共享信息，而且為未來目標的可重用設計准備了條件。通過類庫這種機制和結構來實現不同應用中的信息共享。

4.強調對象結構而不是程序結構

四、面向對象的開發方法

目前，面向對象開發方法的研究已日趨成熟，國際上已有不少面向對象產品出現。面向對象開發方法有Coad方法、Booch方法和OMT方法等。

1.Booch方法

Booch最先描述了面向對象的軟體開發方法的基礎問題，指出面向對象開發是一種根本不同於傳統的功能分解的設計方法。面向對象的軟體分解更接近人對客觀事務的理解，而功能分解只通過問題空間的轉換來獲得。

2.Coad方法

Coad方法是1989年Coad和Yourdon提出的面向對象開發方法。該方法的主要優點是通過多年來大系統開發的經驗與面向對象概念的有機結合，在對象、結構、屬性和操作的認定方面，提出了一套系統的原則。該方法完成了從需求角度進一步進行類和類層次結構的認定。盡管Coad方法沒有引入類和類層次結構的術語，但事實上已經在分類結構、屬性、操作、消息關聯等概念中體現了類和類層次結構的特徵。

3.OMT方法

OMT方法是1991年由James Rumbaugh等5人提出來的，其經典著作為「面向對象的建模與設計」。

該方法是一種新興的面向對象的開發方法，開發工作的基礎是對真實世界的對象建模，然後圍繞這些對象使用分析模型來進行獨立於語言的設計，面向對象的建模和設計促進了對需求的理解，有利於開發得更清晰、更容易維護的軟體系統。該方法為大多數應用領域的軟體開發提供了一種實際的、高效的保證，努力尋求一種問題求解的實際方法。

4.UML(Unified Modeling Language)語言

軟體工程領域在1995年～1997年取得了前所未有的進展，其成果超過軟體工程領域過去15年的成就總和，其中最重要的成果之一就是統一建模語言（UML)的出現。UML將是面向對象技術領域內佔主導地位的標准建模語言。
UML不僅統一了Booch方法、OMT方法、OOSE方法的表示方法，而且對其作了進一步的發展，最終統一為大眾接受的標准建模語言。UML是一種定義良好、易於表達、功能強大且普遍適用的建模語言。它融入了軟體工程領域的新思想、新方法和新技術。它的作用域不限於支持面向對象的分析與設計，還支持從需求分析開始的軟體開發全過程。

五、面向對象的模型

·對象模型

對象模型表示了靜態的、結構化的系統數據性質，描述了系統的靜態結構，它是從客觀世界實體的對象關系角度來描述，表現了對象的相互關系。該模型主要關心系統中對象的結構、屬性和操作，它是分析階段三個模型的核心，是其他兩個模型的框架。

1.對象和類

(1) 對象。
對象建模的目的就是描述對象。

(2) 類。
通過將對象抽象成類，我們可以使問題抽象化，抽象增強了模型的歸納能力。

(3) 屬性。
屬性指的是類中對象所具有的性質（數據值）。

(4) 操作和方法。

操作是類中對象所使用的一種功能或變換。類中的各對象可以共享操作，每個操作都有一個目標對象作為其隱含參數。
方法是類的操作的實現步驟。

2.關聯和鏈
關聯是建立類之間關系的一種手段，而鏈則是建立對象之間關系的一種手段。

(1) 關聯和鏈的含義。
鏈表示對象間的物理與概念聯結，關聯表示類之間的一種關系，鏈是關聯的實例，關聯是鏈的抽象。

(2) 角色。
角色說明類在關聯中的作用，它位於關聯的端點。

(3) 受限關聯。
受限關聯由兩個類及一個限定片語成，限定詞是一種特定的屬性，用來有效的減少關聯的重數，限定詞在關聯的終端對象集中說明。
限定提高了語義的精確性，增強了查詢能力，在現實世界中，常常出現限定詞。

(4) 關聯的多重性。
關聯的多重性是指類中有多少個對象與關聯的類的一個對象相關。重數常描述為「一」或「多」。
圖10-8表示了各種關聯的重數。小實心圓表示「多個」，從零到多。小空心圓表示零或一。沒有符號表示的是一對一關聯。

3.類的層次結構
(1) 聚集關系。
聚集是一種「整體－部分」關系。在這種關系中，有整體類和部分類之分。聚集最重要的性質是傳遞性，也具有逆對稱性。

聚集可以有不同層次，可以把不同分類聚集起來得到一顆簡單的聚集樹，聚集樹是一種簡單表示，比畫很多線來將部分類聯系起來簡單得多，對象模型應該容易地反映各級層次，圖10-10表示一個關於微機的多極聚集。

(2)一般化關系。
一般化關系是在保留對象差異的同時共享對象相似性的一種高度抽象方式。它是「一般---具體」的關系。一般化類稱為你類，具體類又能稱為子類，各子類繼承了交類的性質，而各子類的一些共同性質和操作又歸納到你類中。因此，一般化關系和繼承是同時存在的。一般化關系的符號表示是在類關聯的連線上加一個小三角形，如圖10-11

4.對象模型
(1)模板。模板是類、關聯、一般化結構的邏輯組成。
(2)對象模型。

對象模型是由一個或若干個模板組成。模板將模型分為若干個便於管理的子塊，在整個對象模型和類及關聯的構造塊之間，模板提供了一種集成的中間單元，模板中的類名及關聯名是唯一的。

·動態模型

動態模型是與時間和變化有關的系統性質。該模型描述了系統的控制結構，它表示了瞬間的、行為化的系統控制
性質，它關心的是系統的控制，操作的執行順序，它表示從對象的事件和狀態的角度出發，表現了對象的相互行為。
該模型描述的系統屬性是觸發事件、事件序列、狀態、事件與狀態的組織。使用狀態圖作為描述工具。它涉及到事件、狀態、操作等重要概念。
1.事件
事件是指定時刻發生的某件事。

2.狀態
狀態是對象屬性值的抽象。對象的屬性值按照影響對象顯著行為的性質將其歸並到一個狀態中去。狀態指明了對象
對輸入事件的響應。

3.狀態圖

狀態圖是一個標準的計算機概念，他是有限自動機的圖形表示，這里把狀態圖作為建立動態模型的圖形工具。
狀態圖反映了狀態與事件的關系。當接收一事件時，下一狀態就取決於當前狀態和所接收的該事件，由該事件引起的狀態變化稱為轉換。
狀態圖是一種圖，用結點表示狀態，結點用圓圈表示；圓圈內有狀態名，用箭頭連線表示狀態的轉換，上面標記事件名，箭頭方向表示轉換的方向。

·功能模型

功能模型描述了系統的所有計算。功能模型指出發生了什麼，動態模型確定什麼時候發生，而對象模型確定發生的客體。功能模型表明一個計算如何從輸入值得到輸出值，它不考慮計算的次序。功能模型由多張數據流圖組成。數據流圖用來表示從源對象到目標對象的數據值的流向，它不包含控制信息，控制信息在動態模型中表示，同時數據流圖也不表示對象中值的組織，值的組織在對象模型中表示。圖10-15給出了一個窗口系統的圖標顯示的數據流圖。

數據流圖中包含有處理、數據流、動作對象和數據存儲對象。

1.處理
數據流圖中的處理用來改變數據值。最低層處理是純粹的函數，一張完整的數據流圖是一個高層處理。

2.數據流
數據流圖中的數據流將對象的輸出與處理、處理與對象的輸入、處理與處理聯系起來。在一個計算機中，用數據流來表示一中間數據值，數據流不能改變數據值。

3.動作對象
動作對象是一種主動對象，它通過生成或者使用數據值來驅動數據流圖。

4.數據存儲對象
數據流圖中的數據存儲是被動對象，它用來存儲數據。它與動作對象不一樣，數據存儲本身不產生任何操作，它只響應存儲和訪問的要求。

六、面向對象的分析

面向對象分析的目的是對客觀世界的系統進行建模。本節以上面介紹的模型概念為基礎，結合「銀行網路系統」的具體實例來構造客觀世界問題的准確、嚴密的分析模型。
分析模型有三種用途：用來明確問題需求；為用戶和開發人員提供明確需求；為用戶和開發人員提供一個協商的基礎，作為後繼的設計和實現的框架。

（一）面向對象的分析

系統分析的第一步是：陳述需求。分析者必須同用戶一塊工作來提煉需求，因為這樣才表示了用戶的真實意圖，其中涉及對需求的分析及查找丟失的信息。下面以「銀行網路系統」為例，用面向對象方法進行開發。
銀行網路系統問題陳述：設計支持銀行網路的軟體，銀行網路包括人工出納站和分行共享的自動出納機。每個分理處用分理處計算機來保存各自的帳戶，處理各自的事務；各自分理處的出納站與分理處計算機通信，出納站錄入帳戶和事務數據；自動出納機與分行計算機通信，分行計算機與撥款分理處結帳，自動出納機與用戶介面接受現金卡，與分行計算機通信完成事務，發放現金，列印收據；系統需要記錄保管和安全措施；系統必須正確處理同一帳戶的並發訪問；每個分處理為自己的計算機准備軟體，銀行網路費用根據顧客和現金卡的數目分攤給各分理處。
圖10－18給出銀行網路系統的示意圖。

（二）建立對象模型

首先標識和關聯，因為它們影響了整體結構和解決問題的方法，其次是增加屬性，進一步描述類和關聯的基本網路，使用繼承合並和組織類，最後操作增加到類中去作為構造動態模型和功能模型的副產品。

1.確定類

構造對象模型的第一步是標出來自問題域的相關的對象類，對象包括物理實體和概念。所有類在應用中都必須有意義，在問題陳述中，並非所有類都是明顯給出的。有些是隱含在問題域或一般知識中的。

按圖10-19所示的過程確定類

查找問題陳述中的所有名詞，產生如下的暫定類。
軟體銀行網路出納員自動出納機分行
分處理分處理計算機帳戶事務出納站
事務數據分行計算機現金卡用戶現金
收據系統顧客費用帳戶數據
訪問安全措施記錄保管

根據下列標准，去掉不必要的類和不正確的類。
（1）冗餘類：若兩個類表述了同一個信息，保留最富有描述能力的類。如"用戶"和"顧客"就是重復的描述，因為"顧客"最富有描述性，因此保留它。
（2）不相乾的類：除掉與問題沒有關系或根本無關的類。例如，攤派費用超出了銀行網路的范圍。
（3）模糊類：類必須是確定的，有些暫定類邊界定義模糊或范圍太廣，如"記錄保管"就模糊類，它是"事務"中的一部分。
（4）屬性：某些名詞描述的是其他對象的屬性，則從暫定類中刪除。如果某一性質的獨立性很重要，就應該把他歸屬到類，而不把它作為屬性。
（5）操作：如果問題陳述中的名詞有動作含義，則描述的操作就不是類。但是具有自身性質而且需要獨立存在的操作應該描述成類。如我們只構造電話模型，"撥號"就是動態模型的一部分而不是類，但在電話撥號系統中，"撥號"是一個重要的類，它日期、時間、受話地點等屬性。

在銀行網路系統中，模糊類是"系統"、"安全措施"、"記錄保管"、"銀行網路"等。屬於屬性的有："帳戶數據"、"收據"、"現金"、"事務數據"。屬於實現的如："訪問"、"軟體"等。這些均應除去。

2.准備數據字典

為所有建模實體准備一個數據字典。准確描述各個類的精確含義，描述當前問題中的類的范圍，包括對類的成員、用法方面的假設或限制。

3.確定關聯

兩個或多個類之間的相互依賴就是關聯。一種依賴表示一種關聯，可用各種方式來實現關聯，但在分析模型中應刪除實現的考慮，以便設計時更為靈活。關聯常用描述性動詞或動詞片語來表示，其中有物理位置的表示、傳導的動作、通信、所有者關系、條件的滿足等。從問題陳述中抽取所有可能的關聯表述，把它們記下來，但不要過早去細化這些表述。

下面是銀行網路系統中所有可能的關聯，大多數是直接抽取問題中的動詞片語而得到的。在陳述中，有些動詞片語表述的關聯是不明顯的。最後，還有一些關聯與客觀世界或人的假設有關，必須同用戶一起核實這種關聯，因為這種關聯在問題陳述中找不到。

銀行網路問題陳述中的關聯：
·銀行網路包括出納站和自動出納機；
·分行共享自動出納機；
·分理處提供分理處計算機；
·分理處計算機保存帳戶；
·分理處計算機處理帳戶支付事務；
·分理處擁有出納站；
·出納站與分理處計算機通信；
·出納員為帳戶錄入事務；
·自動出納機接受現金卡；
·自動出納機與用戶介面；
·自動出納機發放現金；
·自動出納機列印收據；
·系統處理並發訪問；
·分理處提供軟體；
·費用分攤給分理處。
隱含的動詞片語：
·分行由分理處組成；
·分理處擁有帳戶；
·分行擁有分行計算機；
·系統提供記錄保管；
·系統提供安全；
·顧客有現金卡。
基於問題域知識的關聯：
·分理處僱傭出納員；
·現金卡訪問帳戶。

使用下列標准去掉不必要和不正確的關聯：

（1）若某個類已被刪除，那麼與它有關的關聯也必須刪除或者用其它類來重新表述。在例中，我們刪除了"銀行網路"，相關的關聯也要刪除。
（2）不相乾的關聯或實現階段的關聯：刪除所有問題域之外的關聯或涉及實現結構中的關聯。如"系統處理並發訪問"就是一種實現的概念。
（3）動作：關聯應該描述應用域的結構性質而不是瞬時事件，因此應刪除"自動出納機接受現金卡"，"自動出納機與用戶介面"等。
（4）派生關聯：省略那些可以用其他關聯來定義的關聯。因為這種關聯是冗餘的。銀行網路系統的初步對象圖如圖10-20所示。其中含有關聯。

4.確定屬性

屬性是個體對象的性質,屬性通常用修飾性的名詞片語來表示.形容詞常常表示具體的可枚舉的屬性值,屬性不可能在問題陳述中完全表述出來,必須藉助於應用域的知識及對客觀世界的知識才可以找到它們。只考慮與具體應用直接相關的屬性，不要考慮那些超出問題范圍的屬性。首先找出重要屬性，避免那些只用於實現的屬性，要為各個屬性取有意義的名字。按下列標准刪除不必要的和不正確的屬性：

（1）對象：若實體的獨立存在比它的值重要，那麼這個實體不是屬性而是對象。如在郵政目錄中，"城市"是一個屬性，然而在人口普查中，"城市"則被看作是對象。在具體應用中，具有自身性質的實體一定是對象。
（2）定詞：若屬性值取決於某種具體上下文，則可考慮把該屬性重新表述為一個限定詞。
（3）名稱：名稱常常作為限定詞而不是對象的屬性，當名稱不依賴於上下文關系時，名稱即為一個對象屬性，尤其是它不惟一時。
（4）標識符：在考慮對象模糊性時，引入對象標識符表示，在對象模型中不列出這些對象標識符，它是隱含在對象模型中，只列出存在於應用域的屬性。
（5）內部值：若屬性描述了對外不透明的對象的內部狀態，則應從對象模型中刪除該屬性。
（6）細化：忽略那些不可能對大多數操作有影響的屬性。

5.使用繼承來細化類

使用繼承來共享公共機構，以次來組織類，可以用兩種方式來進行。
（1）自底向上通過把現有類的共同性質一般化為父類，尋找具有相似的屬性，關系或操作的類來發現繼承。例如"遠程事務"和"出納事務"是類似的，可以一般化為"事務"。有些一般化結構常常是基於客觀世界邊界的現有分類，只要可能，盡量使用現有概念。對稱性常有助於發現某些丟失的類。
（2）自頂向下將現有的類細化為更具體的子類。具體化常常可以從應用域中明顯看出來。應用域中各枚舉字情況是最常見的具體化的來源。例如：菜單，可以有固定菜單，頂部菜單，彈出菜單，下拉菜單等，這就可以把菜單類具體細化為各種具體菜單的子類。當同一關聯名出現多次且意義也相同時，應盡量具體化為相關聯的類，例如"事務"從"出納站"和"自動出納機"進入，則"錄入站"就是"出納站"和"自動出納站"的一般化。在類層次中，可以為具體的類分配屬性和關聯。各屬性和都應分配給最一般的適合的類，有時也加上一些修正。

應用域中各枚舉情況是最常見的具體化的來源。

6.完善對象模型

對象建模不可能一次就能保證模型是完全正確的，軟體開發的整個過程就是一個不斷完善的過程。模型的不同組成部分多半是在不同的階段完成的，如果發現模型的缺陷，就必須返回到前期階段去修改，有些細化工作是在動態模型和功能模型完成之後才開始進行的。
（1）幾種可能丟失對象的情況及解決辦法：
·同一類中存在毫無關系的屬性和操作，則分解這個類，使各部分相互關聯；
·一般化體系不清楚，則可能分離扮演兩種角色的類
·存在無目標類的操作，則找出並加上失去目標的類；
·存在名稱及目的相同的冗餘關聯，則通過一般化創建丟失的父類，把關聯組織在一起。

（2）查找多餘的類。
類中缺少屬性，操作和關聯，則可刪

㈡基於安卓的音樂播放器論文中用到了哪些數據結構

把畢業論文分為專題型、論辯型、綜述型和綜合型四大類：
1．專題型論文。這是分析前人研究成果的基礎上，以直接論述的形式發表見解，從正面提出某學科中某一學術問題的一種論文。如本書第十二章例文中的《淺析領導者突出工作重點的方法與藝術》一文，從正面論述了突出重點的工作方法的意義、方法和原則，它表明了作者對突出工作重點方法的肯定和理解。
2．論辯型論文。這是針對他人在某學科中某一學術問題的見解，憑借充分的論據，著重揭露其不足或錯誤之處，通過論辯形式來發表見解的一種論文。如《家庭聯產承包責任制改變了農村集體所有制性質嗎?》一文，是針對「家庭聯產承包責任制改變了農村集體所有制性質」的觀點，進行了有理有據的駁斥和分析，以論辯的形式闡發了「家庭聯產承包責任制並沒有改變農村集體所有制」的觀點。另外，針對幾種不同意見或社會普遍流行的錯誤看法，以正面理由加以辯駁的論文，也屬於論辯型論文。
3．綜述型論文。這是在歸納、總結前人或今人對某學科中某一學術問題已有研究成果的基礎上，加以介紹或評論，從而發表自己見解的一種論文。
4．綜合型論文。這是一種將綜述型和論辯型兩種形式有機結合起來寫成的一種論文。如《關於中國民族關系史上的幾個問題》一文既介紹了研究民族關系史的現狀，又提出了幾個值得研究的問題。因此，它是一篇綜合型的論文。

㈢現在的網路爬蟲的研究成果和存在的問題有哪些

網路爬蟲是Spider（或Robots、Crawler）等詞的意譯，是一種高效的信息抓取工具，它集成了搜索引擎技術，並通過技術手段進行優化，用以從互聯網搜索、抓取並保存任何通過HTML（超文本標記語言）進行標准化的網頁信息。

其作用機理是：發送請求給互聯網特定站點，在建立連接後與該站點交互，獲取HTML格式的信息，隨後轉移到下一個站點，並重復以上流程。通過這種自動化的工作機制，將目標數據保存在本地數據中，以供使用。網路爬蟲在訪問一個超文本鏈接時，可以從HTML標簽中自動獲取指向其他網頁的地址信息，因而可以自動實現高效、標准化的信息獲取。

隨著互聯網在人類經濟社會中的應用日益廣泛，其所涵蓋的信息規模呈指數增長，信息的形式和分布具有多樣化、全球化特徵，傳統搜索引擎技術已經無法滿足日益精細化、專業化的信息獲取和加工需求，正面臨著巨大的挑戰。網路爬蟲自誕生以來，就發展迅猛，並成為信息技術領域的主要研究熱點。當前，主流的網路爬蟲搜索策略有如下幾種。

>>>>
深度優先搜索策略

早期的爬蟲開發採用較多的搜索策略是以深度優先的，即在一個HTML文件中，挑選其中一個超鏈接標簽進行深度搜索，直至遍歷這條超鏈接到最底層時，由邏輯運算判斷本層搜索結束，隨後退出本層循環，返回上層循環並開始搜索其他的超鏈接標簽，直至初始文件內的超鏈接被遍歷。

深度優先搜索策略的優點是可以將一個Web站點的所有信息全部搜索，對嵌套較深的文檔集尤其適用；而缺點是在數據結構日益復雜的情況下，站點的縱向層級會無限增加且不同層級之間會出現交叉引用，會發生無限循環的情況，只有強行關閉程序才能退出遍歷，而得到的信息由於大量的重復和冗餘，質量很難保證。

>>>>
寬度優先搜索策略

與深度優先搜索策略相對應的是寬度優先搜索策略，其作用機理是從頂層向底層開始循環，先就一級頁面中的所有超鏈接進行搜索，完成一級頁面遍歷後再開始二級頁面的搜索循環，直到底層為止。當某一層中的所有超鏈接都被選擇過，才會基於該層信息檢索過程中所獲得的下一級超鏈接（並將其作為種子）開始新的一輪檢索，優先處理淺層的鏈接。

這種模式的一個優點是：無論搜索對象的縱向結構層級有多麼復雜，都會極大程度上避免死循環；另一個優勢則在於，它擁有特定的演算法，可以找到兩個HTML文件間最短的路徑。一般來講，我們期望爬蟲所具有的大多數功能目前均可以採用寬度優先搜索策略較容易的實現，所以它被認為是最優的。

但其缺點是：由於大量時間被耗費，寬度優先搜索策略則不太適用於要遍歷特定站點和HTML文件深層嵌套的情況。

>>>>
聚焦搜索策略

與深度優先和寬度優先不同，聚焦搜索策略是根據「匹配優先原則」對數據源進行訪問，基於特定的匹配演算法，主動選擇與需求主題相關的數據文檔，並限定優先順序，據以指導後續的數據抓取。

這類聚焦爬蟲針對所訪問任何頁面中的超鏈接都會判定一個優先順序評分，根據評分情況將該鏈接插入循環隊列，此策略能夠幫助爬蟲優先跟蹤潛在匹配程度更高的頁面，直至獲取足夠數量和質量的目標信息。不難看出，聚焦爬蟲搜索策略主要在於優先順序評分模型的設計，亦即如何區分鏈接的價值，不同的評分模型針對同一鏈接會給出不同的評分，也就直接影響到信息搜集的效率和質量。

同樣機制下，針對超鏈接標簽的評分模型自然可以擴展到針對HTML頁面的評價中，因為每一個網頁都是由大量超鏈接標簽所構成的，一般看來，鏈接價值越高，其所在頁面的價值也越高，這就為搜索引擎的搜索專業化和應用廣泛化提供了理論和技術支撐。當前，常見的聚焦搜索策略包括基於「鞏固學習」和「語境圖」兩種。

從應用程度來看，當前國內主流搜索平台主要採用的是寬度優先搜索策略，主要是考慮到國內網路系統中信息的縱向價值密度較低，而橫向價值密度較高。但是這樣會明顯地遺漏到一些引用率較小的網路文檔，並且寬度優先搜索策略的橫向價值富集效應，會導致這些鏈接量少的信息源被無限制的忽略下去。

而在此基礎上補充採用線性搜索策略則會緩解這種狀況，不斷引入更新的數據信息到已有的數據倉庫中，通過多輪的價值判斷去決定是否繼續保存該信息，而不是「簡單粗暴」地遺漏下去，將新的信息阻滯在密閉循環之外。

>>>>
網頁數據動態化

傳統的網路爬蟲技術主要局限於對靜態頁面信息的抓取，模式相對單一，而近年來，隨著Web2.0/AJAX等技術成為主流，動態頁面由於具有強大的交互能力，成為網路信息傳播的主流，並已取代了靜態頁面成為了主流。AJAX採用了JavaScript驅動的非同步(非同步)請求和響應機制，在不經過網頁整體刷新的情況下持續進行數據更新，而傳統爬蟲技術缺乏對JavaScript語義的介面和交互能力，難以觸發動態無刷新頁面的非同步調用機制並解析返回的數據內容，無法保存所需信息。

此外，諸如JQuery等封裝了JavaScript的各類前端框架會對DOM結構進行大量調整，甚至網頁上的主要動態內容均不必在首次建立請求時就以靜態標簽的形式從伺服器端發送到客戶端，而是不斷對用戶的操作進行回應並通過非同步調用的機制動態繪制出來。這種模式一方面極大地優化了用戶體驗，另一方面很大程度上減輕了伺服器的交互負擔，但卻對習慣了DOM結構（相對不變的靜態頁面）的爬蟲程序提出了巨大挑戰。

傳統爬蟲程序主要基於「協議驅動」，而在互聯網2.0時代，基於AJAX的動態交互技術環境下，爬蟲引擎必須依賴「事件驅動」才有可能獲得數據伺服器源源不斷的數據反饋。而要實現事件驅動，爬蟲程序必須解決三項技術問題：第一，JavaScript的交互分析和解釋；第二，DOM事件的處理和解釋分發；第三，動態DOM內容語義的抽取。

前嗅的ForeSpider數據採集系統全方位支持各種動態網站，大部分網站通過可視化的操作就可以獲取。對於反爬蟲機制嚴格的網站，通過ForeSpider內部的腳本語言系統，通過簡單的腳本語言，就可以輕松獲取。

>>>>
數據採集分布化

分布式爬蟲系統是在計算機集群之上運轉的爬蟲系統，集群每一個節點上運行的爬蟲程序與集中式爬蟲系統的工作原理相同，所不同的是分布式需要協調不同計算機之間的任務分工、資源分配、信息整合。分布式爬蟲系統的某一台計算機終端中植入了一個主節點，並通過它來調用本地的集中式爬蟲進行工作，在此基礎上，不同節點之間的信息交互就顯得十分重要，所以決定分布式爬蟲系統成功與否的關鍵在於能否設計和實現任務的協同。

此外，底層的硬體通信網路也十分重要。由於可以採用多節點抓取網頁，並能夠實現動態的資源分配，因此就搜索效率而言，分布式爬蟲系統遠高於集中式爬蟲系統。

經過不斷的演化，各類分布式爬蟲系統在系統構成上各具特色，工作機制與存儲結構不斷推陳出新，但主流的分布式爬蟲系統普遍運用了「主從結合」的內部構成，也就是由一個主節點通過任務分工、資源分配、信息整合來掌控其他從節點進行信息抓取。

在工作方式上，基於雲平台的廉價和高效特點，分布式爬蟲系統廣泛採用雲計算方式來降低成本，大規模降低軟硬體平台構建所需要的成本投入。在存儲方式方面，當前比較流行的是分布式信息存儲，即將文件存儲在分布式的網路系統上，這樣管理多個節點上的數據更加方便。通常情況下使用的分布式文件系統為基於Hadoop的HDFS系統。

目前市場上的可視化通用性爬蟲，大都犧牲了性能去換取簡易的可視化操作。但前嗅的ForeSpider爬蟲不是。ForeSpider採用C++編程，普通台式機日採集量超過500萬條/天，伺服器超過4000萬條/天。是市場上其他可視化爬蟲的10倍以上。同時，ForeSpider內嵌前嗅自主研發的ForeLib資料庫，免費的同時支持千萬量級以上的數據存儲。

>>>>
通用型和主題型網路爬蟲

依據採集目標的類型，網路爬蟲可以歸納為「通用型網路爬蟲」和「主題型網路爬蟲」兩種。

通用型網路爬蟲側重於採集更大的數據規模和更寬的數據范圍，並不考慮網頁採集的順序和目標網頁的主題匹配情況。在當前網路信息規模呈現指數增長的背景下，通用型網路爬蟲的使用受到信息採集速度、信息價值密度、信息專業程度的限制。

為緩解這種狀況，主題型網路爬蟲誕生了。不同於通用型網路爬蟲，主題型網路爬蟲更專注採集目標與網頁信息的匹配程度，避免無關的冗餘信息，這一篩選過程是動態的，貫穿於主題型網路爬蟲技術的整個工作流程。

目前市面上的通用性爬蟲的採集能力有限，採集能力不高，網頁結構復雜的頁面無法採集。前嗅ForeSpider爬蟲是通用型的網路爬蟲，可以採集幾乎100%的網頁，並且內部支持可視化篩選、正則表達式、腳本等多種篩選，可以100%過濾無關冗餘內容，按條件篩選內容。相對主題型爬蟲只能採集一類網站而言，通用型的爬蟲有著更強的採集范圍，更加經濟合理。

㈣鍾珞的主要學術成果

1.鍾珞主編：《計算機科學導論》，武漢理工大學出版社，2003.1
2.鍾珞、夏紅霞主編，宋華珠、李道奇副主編《SCJP試題詳析大全》，電子工業出版社，
3.鍾珞、宋華珠主編，夏紅霞、袁景凌、鄒承明副主編：《系統分析員重點綜述與試題分析》，中國民航出版社，2003.4
4.鍾珞主編，夏紅霞、袁景凌副主編：《軟體工程重點綜述與試題分析》，中國民航出版社，2000.3
5.鍾珞、劉鋼主編，夏紅霞、袁景凌編著：《程序設計重點綜述與試題分析》，中國民航出版社，2000.1
6.鍾珞主編，呂品、楊世清副主編：《系統分析員重點綜述與試題分析》，中國民航出版社，2003.5
7.段隆振，胡學鋼主編：《數據結構》，武漢理工大學出版社，2003.9
8.鍾珞主編，陳文平、夏紅霞副主編：《初級程序員重點綜述與試題分析》，中國民航出版社，2003.4
9.鍾珞主編，鄭巧仙、夏紅霞副主編：《程序員重點綜述與試題分析》，中國民航出版社，2003.5
10.許鑫華，葉衛平主編：《計算機在材料科學中的應用》，機械工業出版社，2003.4
11.鍾珞、夏紅霞主編，李輝、李紀華副主編：《網站組建與維護》，中國民航出版社，2001.11
12.鍾珞、夏紅霞、楊庚主編，袁景凌副主編：《資料庫技術重點綜述與試題分析》，中國民航出版社，2001.2
13.鍾珞主編，冉春玉、趙廣輝副主編：《系統設計師重點綜述與試題分析》，中國民航出版社，2003.4
14.鍾珞主編，鄒承明、夏紅霞副主編：《MCSE試題詳析大全》，電子工業出版社，
15.李威宣，李先立編著：《測控技術與儀器導論》，武漢工業大學，1999.6
16.劉同員主編：《體育健康學》，人民體育出版社，2002.7
17.王威孚，朱喆，李煉主編：《馬克思主義哲學教學指導》，武漢理工大學出版社，2002.8
18.童恆慶，周樹民，李躍波，張開鵬編著：《概率論與數理統計》，武漢工業大學出版社，2000.10 結構受力模擬動畫生成及其視頻輸出技術研究構動態分析中的可視化技術[J]. 同濟大學學報,2001

㈤數據結構在軟體開發中的作用

本人還是自稱為菜鳥好了，學了一點相關知識，談不上指點，心得倒是馬馬虎虎，見笑
數據結構和演算法設計是分不開的（大學課程裡面這是整個的一門課）。對於軟體初學者，這部分內容不是特別重要，因為很自然，新手總是喜歡用簡單、好理解、易實現的方式去寫代碼；由於軟體本身的架構簡單，在空間和時間資源的消耗上也幾乎可以忽略。比如只有幾十個數據排序，那麼單向鏈表＋簡單插入排序足矣。
隨著學習深入，數據結構與演算法的重要作用也就逐漸明顯起來，尤其對於大型復雜的軟體體系結構。因為硬體的發展速度遠比不上軟體的膨脹速度，對於一些大型的軟體，可供使用的空間資源和可以容忍的時間復雜度相當有限（在使用者的角度，他當然會希望一個軟體產品佔用空間小，功能全，速度快），這就需要良好的數據結構和有效的演算法去支撐，用上面的例子，如果有幾十萬個甚至上億個數據需要排序，若不小心考慮數據結構與演算法的設計，運行的結果將不堪設想。
一樓所說的資料庫是一個重要的應用方面，尤其對於當今海量的數據而言。一個好的設計，可能用一台機子幾分鍾計算出結果，而一個差的設計，可能多機協同工作算幾小時甚至幾天。
更明顯的例子就是操作系統，其作用毋庸置疑，當然需要高效、節約，因為還要支撐其他軟體的運行；設計過程中，對於一些可選的數據結構以及演算法，就要仔細斟酌了。
再比如游戲，太顯然的例子，低端配置跑高端產品，誰都希望
在個人的學習過程中，理解數據結構和演算法設計很有助於深入理解軟體系統，無論自己寫，還是讀別人的成果。
個人的愚見。更多的精髓，如果樓主感興趣的化，就會在學習中慢慢體會了

㈥學習C++ 後，去學數據結構感覺十分的吃力！

首先，方向的問題是你自己選擇的，這個你一定要明白，沒人能幫你做這么重大的決策，編程這個東西，你首先自己一定要非常感興趣，不能說僅僅很好玩或者說很掙錢等等之類的，如果是這樣，樓主還是不要學習這個的好，費時費力，還不一定出成果，數據結構這個東西，毫無疑問，不管做什麼開發都應該學習一下的，即使說java，裡面的vector，linklist,map等等這些東西都是基於數據結構上的封裝，這是一個打基礎的東西，樓主千萬別被那些看似光鮮的詞彙給蒙住了，mfc固然好，但是如果你面向對象的基礎沒打好，即使前期你可以仿照書上的東西做一點小系統，但是後面你會發現你會越來越難行走，以為我以前看mfc就是這樣，所以建議樓主還是好好學習一下c/c++，注意：是好好學學，多看看一些底層的東西，這樣看數據結構時才不會被什麼指針、數組啊這些基礎的語法東西迷惑掉，同時學數據結構時前期一定要畫圖，內涵啊最重要，等到你學的差不多了再看vc吧......最後真誠建議，一定要踏踏實實地看（如果你想學的話）,遇到困難就不想學想換方向的永遠都學不好，碼字辛苦，望採納....

㈦王曉東的獲獎成果

* 學術研究領域為計算機演算法設計與演算法評價，基於計算機網路和信息安全的大規模問題求解演算法與數據結構，信息可視化技術，幾何計算，並行和分布式演算法設計，計算復雜性理論。先後主持完成了與演算法設計與分析有關的國家自然科學基金項目，國家優秀留學回國人員基金項目，福建省傑出人才基金項目和省自然科學基金項目等7個研究課題。
* 獲得國家科技進步2等獎1項，省科技進步2等獎3項。
* 主持國家精品課程演算法與數據結構和演算法設計與分析的課程建設。
* 獲福建省教學成果一等獎。
* 在國內外重要學術刊物上發表有創見性學術論文50餘篇。
*正式出版《演算法設計與分析》（清華大學出版社）、《演算法與數據結構》（電子工業出版社）等學術著作11部，其中有4部為普通高等教育「十一五」國家級規劃教材。
* 在演算法復雜性研究方面取得了一系列理論研究和應用成果。例如，在對著名的凸殼問題的計算復雜性研究成果中推廣了關於判定樹模型下問題的計算復雜性下界著名的Ben-Or定理，並應用於分析凸殼問題的計算復雜性，在較一般的情況下改進和完善了國際演算法界知名學者Aggarwal，Steele和Yao等提出的關於凸殼問題計算復雜性下界的結果。研究成果得到同行專家的好評並被國內權威刊物所引用。

㈧彭志平的研究方向

先後承擔了《數據結構》、《操作系統》、《Java語言》、《網路應用軟體開發》等實踐性較強的課程。結合自身科研項目，以第二課堂活動為切入點，積極組建了多個「Web應用架構技術」課外興趣小組，對學生產生耳濡目染、潛移默化的效果，使學生明確了學習方向，增強了自信心，提升了就業競爭力和就業質量。2007年他指導的2名學生參加廣東省「高校杯」軟體設計大賽，都取得了較好的成績。他經過認真總結，創新性地提出了以Java為線索的網路應用三階段教學理念，並將其落實到人才培養方案中。同時，他將科研課題引入到學生的畢業設計中，取得了良好的效果。自2006年起，他與太原理工大學、江蘇科技大學聯合培養碩士研究生5名，其中2名已畢業。
他瞄準學科前沿，潛心於科學研究，致力於多主體技術、機器學習、自主計算和語義Web服務等方向的研究，並取得了不少研究成果。2003年至今，他主持了6項省市（廳）縱向科研項目的研究，其中廣東省自然科學基金項目2項，廣東省教育廳自然科學研究項目1項，茂名市科技計劃項目3項，並作為主要成員參加了1項國家自然科學基金的研究。2005年，他的研究成果「面向智能Agent軟體技術的研究及其在智能診斷模擬系統中的應用」通過了廣東省科技廳組織的成果鑒定，其中自主研發的「基於Agent的故障診斷模擬系統」成功地應用於茂名市化工企業，取得了較好的效益。該成果被評為茂名市科學技術「二等獎」。近年來，他獲計算機軟體著作版權3項；在《電子學報》、《計算機研究與發展》、《Journal of Information and Computation Science》等國內外重要的學術期刊和會議發表學術論文30多篇，其中15篇被收錄進SCI、EI索引。
參加工作十幾年來，他腳踏實地，勤勤懇懇，開拓進取，干出了成績，曾榮獲茂名學院「優秀黨員」、「優秀教研室主任」、「科技工作先進個人」、師德先進個人，茂名市「優秀教師」和廣東省南粵優秀教師等稱號。

㈨資料庫結構

新一輪油氣資源評價資料庫是建立在國家層面上的資料庫，資料庫設計首先立足於國家能源政策和戰略制定的宏觀要求，還要結合油氣資源評價的工作特徵和各個評價項目及資源的具體情況。使用當前最流行和最成熟的資料庫技術進行資料庫的總體結構設計。

資料庫的設計以《石油工業資料庫設計規范》為指導標准，以《石油勘探開發數據》為設計基礎，借鑒前人的優秀設計理念和思路，參考國內外優秀的資源評價資料庫和油氣資源資料庫的設計技術優勢，結合本輪資源評價的具體特點，按照面向對象的設計和面向過程的設計相結合的設計方法，進行資料庫的數據劃分設計。

油氣資源評價資料庫要滿足新一輪全國油氣資源評價工作的常規油氣資源評價、煤層氣資源評價、油砂資源評價、油頁岩資源評價四個油氣資源評價的數據需求。進行資料庫具體數據內容設計。

並且，資料庫的設計要為油氣資源評價的快速、動態評價和遠程評價工作的需求保留足夠數據擴展介面，資料庫具有良好開放性、兼容性和可擴充性。

（一）數據劃分

資料庫內存放的數據將支持資源評價的整個過程。為了能更好地管理庫中數據，需要對整個過程中將用到的數據進行分類管理。具體分類方式如下（圖4-11）：

圖4-11 數據分類示意圖

1.按照應用類型劃分

按照數據在資源評價過程中的應用類型劃分，可以劃分為基礎數據、參數數據和評價結果數據。

基礎數據是指從勘探生產活動及認識中直接獲取的原始數據，這些數據一般沒有經過復雜的處理和計算過程。如分析化驗數據、鑽井地質數據、盆地基礎數據等。這些數據是整個評價工作的基礎。

參數數據是指在評價過程中各種評價方法和軟體直接使用的參數數據。

評價結果數據是指資源評價中產生的各種評價結果數據，如資源量結果數據、地質評價結果數據等。

2.按照評價對象劃分

本次評價共分為大區、評價單元、計算單元三個層次，在研究中又使用了盆地、一級構造單元，在評價對象總體考慮中按照評價對象將數據劃分為大區、評價單元、計算單元等類型。

3.按照獲取方式劃分

按照獲取方式可以將數據分為直接獲取、研究獲取、間接獲取幾類。

4.按照存儲類型劃分

按照存儲類型可以將數據劃分為結構化數據和非結構化數據。

結構化數據是指能夠用現有的關系資料庫系統直接管理的數據，進一步又可以分為定量數據和定性數據兩類。

非結構化數據是指不能用現有的關系資料庫系統直接管理和操作的數據，它必須藉助於另外的工具管理和操作。如圖件數據、文檔數據等。

庫中數據類型的劃分共分六個層次逐次劃分，包括：數據存儲類型→資源類型→評價對象→應用→獲取方式→數據特徵。

對於結構化存儲的數據在應用層分為三類：基礎數據、中間數據和結果數據，基礎數據中包含用於類比的基礎數據、用於統計分析的基礎數據和直接用於公式運算的基礎數據；結構化存儲的數據在獲取方式上可以繼續劃分，其中，用於公式運算的數據可以細化為專家直接錄入、由地質類比獲取、通過生產過程獲取、通過地質研究過程獲取及其他方式。中間數據可以從以下方式獲取：標准、統計、類比、參數的關聯。結果數據的獲取有兩種方式：公式運算結果和通過鑽井、地質、綜合研究等提交的文字報告。

對於非結構化存儲的數據在應用層分為兩類：圖形數據和文檔數據。

圖形數據在獲取方式上可以繼續劃分成四種方式：通過工程測量數據獲取（如地理圖件、井位坐標數據等）、通過地質研究過程獲取（如沉積相圖、構造區劃圖等）、由綜合研究獲取（如綜合評價圖等）、其他方式。

圖形數據在表現方式上又可以進一步分為有坐標意義的圖形（如構造單元劃分圖、地理圖、井點陣圖等）、數值圖（如產烴率曲線圖、酐洛根熱降解圖等）和無坐標含義圖（如剖面圖）等。

文檔數據是指評價過程中產生的各種報告、項目運行記錄等。

（二）資料庫結構

從業務需求上，根據數據用途、數據類型和數據來源，可將本次的油氣資源評價資料庫分為三級：基礎庫、參數庫、成果庫（圖4-12）。其結構如下：

圖4-12 資料庫結構示意圖

1.基礎庫

基礎庫是油氣資源評價工作的最基礎的原始數據，有實測數據（物探數據、測井數據、鑽井數據、開發數據等）、實驗數據和經驗數據等。

確定基礎數據實際上是一項涉及油田勘探、開發等領域的多學科的復雜工作，是油氣資源評價工作的研究過程和研究成果在資料庫中的具體表現方式。在設計資料庫的過程中，需要與參數研究專家經過多次反復，才能最終確定基礎資料庫，確保基礎資料庫能滿足目前所有評價工作中計算的需要。

2.參數庫

參數庫用於存儲油氣資源評價工作所用到的參數數據，評價軟體，直接從參數庫中提取參數數據，用於計算。參數數據由基礎數據匯總而來，也可以由專家根據經驗直接得到。

本次評價中所涉及的參數大致可以分為以下幾類：①直接應用的參數；②通過標准或類比借用的參數；③通過研究過程或復雜的預處理得到的參數。

3.成果庫

成果庫用於存儲資源評價結果，包括各種計算結果、各種文檔、電子表格、圖片、圖冊等數據。

資料庫的體系結構採用分布式多層資料庫結構，包括三個組成部分：應用服務層、應用邏輯層和數據服務層。

資料庫體系結構如圖4-13所示。

圖4-13 體系結構結構圖

（1）應用服務層：應用服務層包含復雜的事務處理邏輯，應用服務層主要由中間件組件構成。中間件是位於上層應用和下層服務之間的一個軟體層，提供更簡單、可靠和增值服務。並且能夠實現跨庫檢索的關鍵技術。它能夠使應用軟體相對獨立於計算機硬體和操作系統平台，把分散的資料庫系統有機地組合在一起，為應用軟體系統的集成提供技術基礎，中間件具有標准程序介面和協議，可以實現不同硬體和操作系統平台上的數據共享和應用互操作。而在具體實現上，中間件是一個用API定義的分布式軟體管理框架，具有潛在的通信能力和良好的可擴展性能。中間件包含系統功能處理邏輯，位於應用伺服器端。它的任務是接受用戶的請求，以特定的方式向應用伺服器提出數據處理申請，通過執行相應的擴展應用程序與應用服務層進行連接，當得到應用伺服器返回的處理結果後提交給應用伺服器，再由應用伺服器傳送回客戶端。根據國內各大石油公司具體的需求開發相應的地質、油藏、生產等應用軟體功能程序模塊和各種演算法模塊。

（2）應用邏輯層：邏輯數據層是擴展數據服務層邏輯處理層，針對當前的底層資料庫的數據結構，根據具體的需求，應用各種資料庫技術，包括臨時表、視圖、存儲過程、游標、復制和快照等技術手段從底層資料庫中提取相關的數據，構建面向具體應用的邏輯資料庫或者形成一個虛擬的資料庫平台。邏輯數據層包含底層資料庫的部分或全部數據處理邏輯，並處理來自應用服務層的數據請求和訪問，將處理結果返回給邏輯數據層。

形成一個虛擬的資料庫平台我們可以應用資料庫系統中的多個技術來實現。如果系統中的一個節點中的場地或分片數據能夠滿足當前虛擬資料庫，可以在應用服務層中使用大量的查詢，生成一個以數據集結果為主的虛擬資料庫平台，並且由數據集附帶部分資料庫的管理應用策略。或者對節點上的資料庫進行復制方法進行虛擬資料庫的建立。對與需要對多個節點上的資料庫進行綜合篩選，則要對各個節點上的資料庫進行復制，合並各個復制形成一個應用邏輯層，從而建立一個虛擬數據平台。

（3）數據服務層：即資料庫伺服器層，其中包含系統的數據處理邏輯，位於不同的操作系統平台上，不同資料庫平台（異構資料庫），具體完成數據的存儲、數據的完整性約束。也可以直接處理來自應用服務層的數據請求和訪問，將處理結果返回給邏輯數據層或根據邏輯數據層通過提交的請求，返回數據信息和數據處理邏輯方法。

（三）數據建設標准

1.評價數據標准

系統資料庫中的數據格式、大小、類型遵從國家及行業標准，參考的標准如表4-23。

表4-23 資料庫設計參考標准

續表

系統中數據的格式及單位參考《常規油氣資源評價實施方案》、《煤層氣資源評價實施方案》、《油砂資源評價實施方案》、《油頁岩資源評價實施方案》及數據字典。

2.圖形圖件標准

對於地質研究來說，地質類圖件是比較重要的。各種地質評價圖形遵循以下標准（表4-24）。

表4-24 系統圖形遵循的相關標准

系統對圖形的要求為必須為帶有地理坐標意義的、滿足上述標准體系要求的矢量圖形，且採用統一的地理底圖。圖形格式採用：MapGIS圖形交換格式、GeoInfo圖形格式、ArcInfo圖形交換格式、MapInfo圖形交換格式和GeoMap圖形交換格式。

圖件的比例尺要求：

全國性圖件：1∶400萬或1:600萬

大區圖件：1:200萬

盆地圖件：1:40萬或1:50萬

評價單元圖件：1:10萬或1:20萬

圖件的內容要求符合《常規油氣資源評價實施方案》、《煤層氣資源評價實施方案》、《油砂資源評價實施方案》和《油頁岩資源評價實施方案》的規定。

（四）數據內容

資料庫中存儲的數據包括常規油氣相關數據、煤層氣相關數據、油砂相關數據和油頁岩相關數據；還有可采系數研究涉及的數據，包括研究所需基礎數據和研究成果數據；以及趨勢預測相關數據。

導航:首頁 > 證書轉讓 > 數據結構研究成果

數據結構研究成果

與數據結構研究成果相關的資料