實施Windows群集服務
規劃的執行群集服務
有一些因素必須確定當您計劃為您的群集服務的實施。 有幾個項目,你應包括在您的規劃階段都列在這裡:
- 確定哪些應用程序和網絡服務是關鍵任務應用的組織,需要高可用性。
- 確定哪些集群技術落實,確保高可用性的關鍵任務應用先前發現的。 在這裡,您應該查明這些應用應該使用群集服務,而這些申請應當使用新大嶼山巴士。
- 當您已決定對集群技術,你必須確定服務器容量的要求。
- 確定網絡的風險。
- 確定所有潛在的點故障和網絡連接問題。
- 判斷是否首選節點配置,以支持一個特定的資源。
- 確定故障的時間性能和故障時間財產你要執行的。
- 確定的作用,每台服務器範圍內的應用和服務將運行。 服務器可配置為成員服務器或域控制器。
- 確定群集配置模型符合要求的組織。
- 當您已決定對集群技術和集群配置模式,你必須確定服務器硬件的要求。
- 確定如何在服務器集群將得到保障。
- 如何確定你要備份數據的群集。
- 當創建一個新的群集,您需要提供以下信息:
- 主機名稱指定的群集。
- IP地址設置為群集。
- 該域名將主辦群集。
- 用戶名和密碼的群集服務帳戶。
- 當確定應用的集群和故障,請考慮以下幾點:
- 該申請已使用傳輸控制協議/ Internet協議( TCP / IP ) ,或分佈式組件對象模型( DCOM )和命名管道,或遠端程序呼叫( RPC )在TCP / IP功能的群集。
- 驗證必須得到應用。
- 申請了能夠存儲的數據的磁盤連接到共享總線如果要列入容錯進程。
要求安裝群集服務
有幾個要求安裝群集服務列舉如下:
- 管理權限,需要每個節點上的群集。
- 應該有足夠的磁盤空間的系統驅動器和共享設備的群集服務安裝。
- 適當的網絡適配器驅動程序必須使用。
- 網絡適配器必須有正確的TCP / IP配置。
- 文件和打印共享微軟網絡已經安裝在一個節點來配置群集服務。
- 節點應配置相同的硬件和設備驅動程序。
- 每個節點必須屬於相同的網域。
- 網域帳戶使用相同的應該是在每個群集節點。
- 該系統的分頁文件必須有足夠的空間,以防止性能下降。 當文件沒有足夠的空間,它可以導致系統鎖死。
- 這是一個好做法,審查制度和事件日誌之前,並在安裝群集服務。
- 在安裝任何額外的節點的集群,首先確保以前安裝的節點正在運行。
- 您可以使用系統監視器來解決虛擬內存問題。
有幾個共享磁盤,硬件和網絡的具體考慮執行群集服務都列在這裡:
- 共享驅動器必須重視身體的節點,屬於群集。
- NTFS文件系統應採用格式的分區的共享磁盤
- 共享磁盤必須配置為基本磁盤。
- 在SCSI驅動器和適配器必須都有一個獨特的SCSI識別碼( ID ) 。
- 每個服務器必須有兩個 PCI網卡。
- 存儲主機適配器為SCSI或光纖通道必須要分開。
- 外部驅動器有多個RAID配置驅動器必須連接到服務器的群集。
- 一組必須有一個獨特的NetBIOS名稱。
- 節點的一部分集群必須屬於相同的網域。
資源規劃組群集
硬件和軟件組件的集束被稱為資源。 這包括服務和應用中的cluster.Resources可以歸納形成一個資源組。 具體性質的資源組和應用程序或服務的方式確定該資源組轉移到離線狀態的群集服務。
一般的資源中包含的資源組是:
- 應用託管
- IP地址
- 網絡名稱
- 物理磁盤
的因素考慮在規劃資源組為您的集群,以及一些建議,這裡列出:
- 資源必須是基於分組功能和資源依賴性。
- 當一個人的資源是依賴於另一種資源,資源必須居住在同一資源組。
- 資源,是依賴於對方也必須駐留在相同的網域。
- 考慮制定一種依賴樹圖,以協助你當你的資源規劃組的群集。 樹的依賴應包含資源集團及其相關的依賴性。
- 您可以使用下面的過程作為一個準則時,規劃資源組:
- 確定申請應設在群集。
- 確定這些資源的群體,需要容錯能力。
- 確定相依為每個申請。
- 哪些其他資源,如文件共享(不應用)將列入群集。
所有服務器集群有一個默認的簇群。 默認群集組有下列資源:
- 法定人數磁盤。
- 群集IP地址
- 集群名稱
規劃移轉的政策集群
作為規劃的一組執行,你必須確定故障的政策群集。 容錯政策,資源組決定如何處理群集服務的資源時,故障是開始。
這些選項可以配置來確定故障的政策資源組是:
- 故障時間 ;群集服務啟動時,容錯進程資源集團是失敗的。 資源組,然後轉移到花藥節點群集。 您可以配置群集服務,試圖重新啟動的資源沒有資源組動作之前該集團的其他節點。
- 故障恢復時間 ;失敗的資源組移回主節點的資源組時,在線一次。 您可以配置故障只發生在非繁忙時間。
- 推薦節點;設置首選節點,資源組確保資源組會自動向後移動到指定的首選節點。
規劃安全的集群
這一事實本身集群主機關鍵任務應用和服務,即表明您已經以確保群集。
有幾個戰略,以確保一組列於此處:
- 物理安全的節點群集。
- 限制物理訪問到群集的基礎設施。
- 確保所有 DNS , WINS和DHCP的服務器以及。
- 所有關鍵任務服務器集群應該放在後面的防火牆。
- 使用防火牆配置來控制流量,是針對群集。
- 您應該避免集群相結合的心跳訊息與其他網絡流量。
- 只使用幾個節點,管理服務器群集。
- 安全功能的Windows 2000 , Windows Server 2003中,和Active Directory可用來保護申請主辦的群集。
- 分配NTFS文件系統權限的服務器群集,以確保數據。
- 通過配置NTFS文件系統權限,確保只有管理員組的成員和群集服務帳戶獲得法定人數的群集磁盤。
- 群集服務帳戶不應該被用來運行應用程序。
- 您應該使用一個獨特的群集服務帳戶管理每個群集。 這將確保,如果一個帳戶損害,不能用於所有的集群。
- 使用domainlets如果你想更好的安全控制邊界的服務器群集。
- 您應該定期審計活動的群集。
如何創建新的群集
- 確認只有一個節點相連。
- 確保該節點可以訪問共享存儲設備。
- 確保該網絡接口的名稱和IP地址。
- 登錄到域。
- 單擊開始,行政工具,然後單擊Active Directory用戶和計算機打開Active Directory用戶和計算機管理控制台。
- 導航到用戶容器。
- 創建一個群集服務的用戶帳戶。
- 關閉Active Directory用戶和計算機。
- 單擊開始,管理工具,然後點擊群集管理器,打開群集管理器的管理控制台。
- 開放式連接到群集對話框中,單擊創建新群集的命令操作菜單上。 單擊確定。
- 新的服務器群集嚮導啟動。
- 單擊下一步對新服務器群集嚮導歡迎屏幕。
- 在群集名稱和域名網頁,提供的名稱組中的群集名稱文本框中,並指定網域的網域下拉列表框中。 單擊下一步
- 在選擇計算機網頁,提供的名稱,第一台計算機將最初的節點在新的群集。 單擊下一步。
- 在分析配置頁面上,使用現有的按鈕,以確定哪些活動嚮導進行核實節點。 單擊下一步。
- 在IP地址頁面上,輸入的IP地址為新的集群中的IP地址框中,然後單擊下一步。
- 當群集服務帳戶打開網頁,輸入用戶名,密碼和域的細節群集服務帳戶。 單擊下一步。
- 嚮導現在顯示配置為新的集群就擬議的群集配置頁面。
- 按一下法定人數按鈕選擇仲裁磁盤。 單擊確定。
- 旁邊的嚮導開始創建新的服務器群集。
- 當創建群集的網頁出現,單擊下一步。
- 單擊完成關閉嚮導。
- 群集管理員的管理工具打開。
- 新的集群將顯示在叢集系統管理員的管理工具。
- 要配置性能的新集群,右擊群集,然後選擇屬性快捷菜單。
集群管理
下面的機制可用於管理一組:
- 群集管理器( GUI工具) :叢集系統管理員的主要工具,用於管理和解決群集。 群集管理器是安裝在每個節點群集。 您也可以安裝叢集系統管理員的電腦上,不屬於群集如果你想遠程管理群集。
- Cluster.exe (命令行實用程序) :如果你想從事行政工作組的命令行,然後您可以使用Cluster.exe 。
行政的任務,您可以執行群集通過群集管理器中列出的位置:
- 查看信息狀態的群集。
- 查看屬性的默認群集組,默認磁盤組。
- 更改名稱的群集。 對於群集名稱變更,以反映,首先您雖然已經使群集名稱資源脫機,然後在線上。
- 創建資源組,並指定資源的依賴性。
- 刪除資源。 雖然您可以只刪除一個資源一旦所有分配給它的依賴性將被刪除。
- 創建新的資源集團,集群,並配置故障轉移和故障政策的資源群體。
- 刪除資源集團群集。 資源資源群被刪除時,一組被刪除。
- 新增應用到群集 :您可以啟動群集應用程序嚮導從叢集系統管理員,如果您要添加的應用群集。
- 變更所有權的資源群體。 資源可以從一個資源組,另一組,你可以將資源組從一個節點到另一個群集節點的群集。 您通常會改變所有權的一種資源組維護任務時,必須履行的群集。
- 改變性質的現有資源和資源的群體。 您也可以重新命名現有的資源和資源組。
- 改變現狀的資源群體。 當你改變現狀的資源組,以在線或離線,然後資源的特別小組將自動更新,以反映修改狀態的變化。
- 配置位置的法定人數資源和更改默認的大小法定人數日誌文件。
- 您可以發起一個失敗的群集。 這通常會做測試配置故障的政策,並測試資源如何重新啟動。
如何建立新的資源組
- 單擊開始,管理工具,然後按一下叢集系統管理員。
- 當打開連接組對話框打開,輸入名稱的集束要添加一個新的組。
- 單擊打開。
- 右鍵單擊組,並選擇新建,然後組從快捷菜單。
- 新小組嚮導啟動。
- 在名稱框中,輸入一個名稱為新的組。
- 在說明框中,提供了一個簡短的描述為新的組。 單擊下一步。
- 輸入節點是首選的業主為新集團在推薦業主列表框中。
- 點擊完成創建新組。
如何將資源組到另一個節點
- 單擊開始,管理工具,然後按一下叢集系統管理員。
- 展開節點,其中包含的資源組,您要移動。
- 按一下活躍的群體。
- 雙擊組。
- 右擊資源集團要移動,然後選擇移動組從快捷菜單。
如何創建文件共享資源
- 單擊開始,管理工具,然後按一下叢集系統管理員。
- 展開組文件夾。
- 右擊群集打印機,並選擇新的資源,然後從快捷菜單。
- 當新的資源對話框打開,提供了一個名稱,說明,資源型和集團。 單擊下一步。
- 輸入適當的節點可能的所有者名單。 單擊下一步。
- 新增資源的依賴程度在資源依賴列表中,然後單擊下一步。
- 當文件共享參數對話框打開,提供共享名稱,路徑和評論信息。
- 單擊完成。
如何建立虛擬服務器
- 單擊開始,管理工具,然後按一下叢集系統管理員。
- 當打開連接組對話框打開,輸入名稱的群集,然後單擊打開。
- 右鍵單擊組,並選擇新建,然後組從快捷菜單。
- 新小組嚮導啟動。
- 在名稱框中,輸入一個名稱為新的組。
- 在說明框中,提供了一個簡短的描述為新的組。 單擊下一步。
- 輸入節點是首選的業主在業主推薦列表框中。
- 點擊完成創建新組。
- 要創建一個IP地址資源,在群集管理器中,展開文件夾組
- 右擊虛擬服務器,並選擇新的資源,然後從快捷菜單。
- 當新的資源對話框打開,提供了一個名稱,說明,資源型和集團。 單擊下一步。
- 輸入適當的節點可能的所有者名單。 單擊下一步。
- 確保資源屬地清單包含任何信息。 單擊下一步。
- 在TCP / IP地址參數對話框中,提供了地址,子網掩碼和網絡的信息。
- 單擊完成。
- 要創建一個網絡名稱資源,在叢集系統管理員,擴大集團的文件夾中。
- 右擊虛擬服務器,並選擇新的資源,然後從快捷菜單。
- 當新的資源對話框打開,提供了一個名稱,說明,資源型和集團。 單擊下一步。
- 輸入適當的節點可能的所有者名單。 單擊下一步。
- 在資源依賴名單,添加IP地址資源。 單擊下一步。
- 輸入信息的網絡名稱參數對話框。
- 單擊完成。
如何創建一個用戶帳戶管理組
- 單擊開始,行政工具,然後單擊Active Directory用戶和計算機打開Active Directory用戶和計算機管理控制台。
- 導航到用戶容器。
- 右擊用戶,並選擇新建,然後用戶從快捷菜單。
- 提供必要的資料,名字,姓氏,和用戶登錄名文本框。 單擊下一步。
- 在密碼和確認密碼文本框,提供密碼,為新的集群用戶帳戶。
- 使用戶不能更改密碼複選框。
- 啟用密碼永不過期複選框。
- 單擊下一步。 單擊完成。
如何暫停和恢復一個節點
- 單擊開始,管理工具,然後按一下叢集系統管理員。
- 在左窗格中,選擇其中的節點要暫停。
- 選擇節點命令暫停從File菜單項目。
- 要恢復的節點暫停,單擊開始,管理工具,然後按一下叢集系統管理員。
- 在左窗格中,選擇節點是暫停。
- 選擇簡歷節點命令,在文件菜單上項目。
如何執行維護一個節點沒有驅逐節點
- 單擊開始,管理工具,然後按一下叢集系統管理員。
- 在左窗格中,選擇其中的節點要執行維修任務。
- 選擇節點命令暫停從File菜單項目。
- 在詳細資料窗格中,雙擊活動組,然後各組履行下列:選擇組,選擇文件菜單,然後選擇移動組命令。
- 著手做必要的維修節點被暫停。
- 完成後,打開群集管理器。
- 在左窗格中,選擇節點。
- 選擇簡歷節點命令,在文件菜單上項目。
如何執行維護一個節點與節點驅逐
- 單擊開始,管理工具,然後按一下叢集系統管理員。
- 群集服務停止運行。
- 選擇退出節點命令,在文件菜單上項目。
- 刪除節點的共享總線。
- 卸載群集服務。
- 著手做必要的維修任務。
- 完成後,該節點連接的共享總線。
- 安裝群集服務,然後加入群集。
如何改變大小的法定人數日誌
- 單擊開始,管理工具,然後按一下叢集系統管理員。
- 在左窗格中,右擊群集名稱,然後選擇屬性從快捷菜單。
- 切換到法定人數標籤。
- 變化的大小法定人數登錄重置法定人數登錄框。
- 單擊確定。
群集服務日誌文件
當群集服務活動,如新的資源創建組進行,該事件將被寫入群集日誌文件。 群集日誌中包含的信息在每個群集服務所發生的事件所群集。 測井是由默認。
群集日誌文件的最大尺寸為8MB的,是位於% windir % \集束\ cluster.log目錄。 當最大日誌文件的大小達到,活動項目從日誌文件中,使他們增加了。
所有群集日誌條目有下列資料:
- 該進程ID和線程ID導致入境。
- 時間戳
- 事件描述。
由於群集服務包含了若干部分,每個執行的具體職能的集群的一個組成部分事件日誌條目包含的信息的互操作的群集服務的組成部分。 資源DLL的日誌條目另一方面包含的信息是特定於資源的群體群集。
中所載資料的一個組成部分事件日誌條目包括以下內容:
- 該部分導致事件被記錄在案。
- 該節點的狀態時,事件記錄。
- 合併後組成部分和狀態。
也有少數群集日誌條目有一個狀態碼,錯誤代碼,或國家代碼。 一個國家代碼是與下列類型的對象:
- 網絡接口
- 網絡
- 節點
- 資源集團
- 資源
疑難解答群集服務
有幾個策略,您可以使用來解決群集服務和服務器群集的問題詳列於本節規定。
對於群集服務操作;的共享SCSI總線必須存在和必要的SCSI設備必須連接。 一台設備必須存在的法定人數磁盤共享總線上。 也有一些系統事件日誌錯誤有關集束SCSI設備的問題。
當故障排除SCSI設備事件日誌錯誤 ,您可以使用下面的清單作為一項準則。
- 內部終止的BIOS控制器應禁用。
- 自動SCSI總線重置選擇應禁用。
- 總電纜長度的巴士不得大於長度最長的SCSI定義的製造商。
- 檢查是否電纜及連接器引腳身體受損。
- 檢查是否有任何鬆散的聯繫。
- 檢查驅動程序和固件版本都是相同的每台服務器駐留在群集。
- 確認SCSI總線是正確終止。 檢查重複終止。
- 檢查是否有任何重複的SCSI識別碼上車。
- 如果一個群集節點可以連接到群集驅動器和另一個節點不能:
- 確保有問題的節點連接到群集驅動器。
- 檢查的SCSI ID是獨一無二的。
- 檢查SCSI控制器配置正確。 他們應該傳輸數據以同樣的速度。
- 同樣的驅動器號應分配的驅動器的每個節點上的群集。
當客戶無法訪問資源的集群 ,確認如下:
- 對於每個群集節點上,審查的錯誤在系統事件日誌中。
- 對於每一個資源組無法訪問,確保該集團有一個IP地址資源和網絡名稱資源。
- 對於客戶端連接到一個資源組, IP地址資源和網絡名稱資源應該上網。
- 確保網絡連接存在的特殊節點誰是主人的資源無法訪問。
- 確保客戶使用的是正確的IP地址或網絡名稱連接到資源的群集。
您可以查看狀態的網絡接口,和國家的私人和公共網絡通過群集管理 :
網絡接口可在以下規定:
- 行動;表明,該接口可以與其他接口的網絡。
- 無法使用;表明,該節點的接口下跌。
- 不可達;表明,該接口無法與其他接口的網絡,都在漲的狀態。
- 失敗;表明,該接口無法與任何其他網絡接口。 通常情況下所造成的網絡適配器和驅動器失效,或電纜故障。
私人和公共網絡可以是以下規定:
- 行動;表明,界面的群集可以溝通。
- 唐氏;表明,界面的集束不能溝通彼此間,以及與其他主機。
- 分區;表明,一個或多個接口的集群中的不可達狀態,但至少有兩個接口的群集可以溝通。
- 無法使用;表明,界面的集束無法使用。
當故障排除法定人數磁盤的問題,使用的戰略如下:
- 如果仲裁磁盤失敗了,你是無法啟動群集服務,然後啟動群集服務,沒有法定人數資源。 一旦啟動群集服務指定一個新的法定人數資源。
- 如果仲裁資源無法啟動:
- 確保所有的連接和電纜連接。
- 確保SCSI設備得到妥善終止。
- 確保設備的SCSI總線連接和業務能力。
- 如果法定人數日誌是腐敗,群集服務首次嘗試自動重置日誌。 如果群集服務無法啟動,因為腐敗的法定人數日誌中,您必須手動重置法定人數日誌。
當故障節點的問題,使用的戰略如下:
- 如果群集下降,首次嘗試將線上的一個節點。 下一步,檢查日誌信息以獲取更多信息的問題。
- 如果一個節點已關閉,企圖使一個節點在線然後檢查日誌信息以供參考。 但你應該首先確保資源的失敗節點失敗到另一個節點的群集。
- 如果一個節點失敗後,經營不善,檢查是否正在運行的CPU接近百分之百。 您可能已經超載的CPU 。
- 如果群集服務無法啟動故障時,節點失敗,檢查是否群集服務正在執行一個更新。 當更新正在執行,群集服務將無法啟動故障的過程。
- 如果資源不能歸還所有的時間,同時您的業務節點,檢查是否電源供應器是失敗的。 建議您使用不間斷電源( UPS ) 。
- 如果一個節點不能進入所有驅動器:
- 檢查電纜之間的驅動器和節點。
- 檢查共享驅動器從另一個節點。
- 檢查的配置群集。
- 檢查您是否可以訪問的驅動器從一個不同的節點。
- 如果您無法連接到一個節點使用群集管理器,檢查是否群集服務, RPC服務和節點中運行。
當故障排除資源組的問題,使用的戰略如下:
- 如果你不能把一個資源組在線:
- 確保該磁盤可以訪問。
- 檢查是否硬件問題或配置問題的存在,磁盤資源的問題組。
- 檢查是否所有相依的資源已經明確。
- 移動資源組到另一個節點,然後檢查它是否能夠被在線。
- 企圖使每項資源組在線一次。
- 如果一個資源組不容錯到另一個節點的集群:
- 確保資源的影響組選項已被選中。
- 確保節點中指定可能的所有者名單資源。
- 如果一個資源組失敗了,但不重新啟動:
- 檢查節點網絡。
- 檢查中的信息可能所有者列表組和資源。
- 試圖找出其中的資源是個大問題,使每項資源在線一次。
- 如果一個資源組失敗並不備份:
- 確認節點,您期望的資源無法返回的定義是首選所有者的資源組。
- 確認允許故障恢復選項已被選中。
- 驗證防止故障恢復複選框是明確的。
當故障排除資源問題,使用的戰略如下:
- 如果你不能把一個資源在線:
- 檢查申請是否已安裝。
- 檢查資源是否正確配置。
- 確認資源可以運行群集服務。
- 如果一個具體的資源不未能超過:
- 檢查設備的配置是否正確。
- 檢查設備和電纜業務。
- 如果一個資源並不失敗後:
- 檢查的硬件工作。
- 驗證網絡連接的業務。
- 檢查的配置故障的政策。
- 如果一個失敗的資源並不在線一遍:
- 檢查沒有重新選擇的資源未被選中。
- 檢查是否失效閾值的資源已達到
- 檢查是否有任何依賴的資源是離線。
- 檢查所有相依的資源已正確配置。
- 當你有IP地址資源問題,確保IP地址是獨一無二的。 下一步,確保子網掩碼定義是正確的。 您可以使用Ping實用工具來測試IP地址資源。
- 當你有網絡名稱資源的問題,確認IP地址資源的依賴,網絡名稱資源配置正確無誤。 IP地址資源的依賴應該上網。
- 當你有後台打印程序資源問題,驗證物理磁盤資源和網絡名稱資源依賴性的打印後台處理程序資源的正確配置和在線。 檢查是否有任何NTFS權限阻止訪問。 這個問題也可能是由於充分緩衝目錄的磁盤。
- 當你有文件共享資源問題,確保網絡名稱資源和物理磁盤資源依賴性和所有其他相依的業務。 確保該文件共享的目錄已創建,它可以訪問。 檢查是否有任何NTFS權限,這是防止對文件共享的訪問。
|
06月執行的Windows群集服務


