數(shù)據(jù)中心基礎設施管理(也被稱為DCIM),對于不同的企業(yè)組織有著不同的意義。其核心概念是,一家企業(yè)可以通過將IT和基礎設施功能整合在一起更有效地管理其數(shù)據(jù)中心。DCIM工具可以幫助企業(yè)緩解運維難題,并讓企業(yè)組織更深入地了解數(shù)據(jù)中心性能。同時可以就即將發(fā)生的麻煩事件向工作人員發(fā)出警告。
DCIM使得企業(yè)用戶得以能夠收集關于能源如何消耗、IT資源如何部署或數(shù)據(jù)中心空間占地如何被利用的詳細信息。經(jīng)過部署實施后,DCIM可以減輕IT專業(yè)人員在管理設施方面所面臨的一些負擔,還可以幫助評估一家企業(yè)組織的空間資源、IT資產(chǎn)和能源的消耗情況。
數(shù)據(jù)中心的性能是最需要進行嚴格檢查的業(yè)務功能之一,DCIM可以幫助企業(yè)能夠測量其數(shù)據(jù)中心的設備、能源和空間等資源的具體使用情況。關于DCIM,企業(yè)的基礎設施團隊和IT團隊從其各自的立場,都有不同的觀點。有人認為,充分利用DCIM,需要在這些團隊之間進行可行的協(xié)調。合理的部署DCIM可以幫助企業(yè)產(chǎn)生有價值的數(shù)據(jù),合適的DCIM工具,有助于數(shù)據(jù)中心的安全運維。
DCIM通常被認為具備在企業(yè)內(nèi)部聚合IT和建筑設施功能的能力。其目標是向管理員提供數(shù)據(jù)中心性能的全面檢查,以便以最佳效率使用能源、設備和占地空間。DCIM就一家企業(yè)數(shù)據(jù)中心是如何運行的向管理員們提供全面的視圖,從而使能源,設備和占地空間達到最大效用。最全面的DCIM包允許企業(yè)從相對較小的領域開始著手。比如,功率測量和PUE跟蹤,然后隨著企業(yè)能夠更方便地使用相關信息后,模塊化地添加功能。
庫存跟蹤幾乎似乎在從管理電源和冷卻演變而來的系統(tǒng)中不太適用,但此功能可以是DCIM軟件包中的一個相當有用的部分。只要其部署到位,基本上都是可以自行維護特別是當包括了射頻識別或RFID,標簽或其他自動感測方法的時候。
清楚的了解數(shù)據(jù)中心有些什么硬件,其用了多久了,這些硬件位于或被移動到哪,可節(jié)省大量的跟蹤時間。當與來自現(xiàn)代服務器中的內(nèi)部監(jiān)視器的數(shù)據(jù)集成時,價值可能是無價的。數(shù)據(jù)中心可以有效識別利用率降低的設備,調查原因,并重新使用設備或其應用程序。一款DCIM包與另一款最大的區(qū)別在于其如何處理大量數(shù)據(jù),將返回什么樣的信息以及這些信息如何有用,是否容易訪問,是否一致。測試一款DCIM工具是否優(yōu)秀的方法是:安排一名精通數(shù)據(jù)的IT人員,但沒有經(jīng)過專門的系統(tǒng)培訓,看其是否能夠在沒有幫助的情況下快速識別重大報警,并采取行動措施。
如果不是,那么圖形用戶界面(GUI)的邏輯便是有問題的。當發(fā)生實際故障問題時,很少會有一名受過訓練的專家正好在場的情況。發(fā)出次要警報,并且對故障設備發(fā)出預測是專家們的職責范圍,但是主要警報應該由在第一現(xiàn)場的有資格在數(shù)據(jù)中心進行操作的任何人執(zhí)行。
關于DCIM的購買:在供應商進行產(chǎn)品演示期間,讓其銷售工程師模擬一個主要問題,然后請求工作人員在沒有幫助的情況下排查并診斷。如果DCIM產(chǎn)品過于復雜或功能和顯示不夠直觀明顯,那么請購買其他供應商的產(chǎn)品。
如果DCIM未能正常運行時;或當你數(shù)據(jù)中心需要做出改變時,你企業(yè)數(shù)據(jù)中心所能夠獲得的幫助的數(shù)量和質量,獲得多長時間的幫助,以什么成本獲得,都是至關重要的。對配置升級,故障排除和持續(xù)的運營培訓的良好支持都應包括在維護成本中。數(shù)據(jù)中心的DCIM培訓人員必須是IT專業(yè)人員。在采購之前嘗試咨詢供應商的幫助。查看需要導航的菜單數(shù)量,當與供應商的幫助聯(lián)系上之后,搞清楚正在與誰進行溝通交流。
定義數(shù)據(jù)中心基礎架構管理或者準確地解釋其應該做什么幾乎是不可能的。為什么呢?因為每款DCIM工具都有不同,他們對于數(shù)據(jù)中心基礎設施的監(jiān)控差別很大。除了基本警報之外的任何信息都是廣泛,多樣和詳細的。其真的適合借助工作人員的支持進行操作,可以充分利用輸入。數(shù)據(jù)中心是復雜的,他們都可以從DCIM工具中獲益,但只有在選擇了正確的工具的前提下。
在采用DCIM軟件和硬件之前,數(shù)據(jù)中心操作運營人員們會很高興只是知道操作環(huán)境溫度是否正在上升,冷卻單元是否出現(xiàn)故障或一款UPS進入了旁路?,F(xiàn)在,服務器、空調、UPS系統(tǒng)、冷卻設備、電源板和所有其他設備在其內(nèi)部工作的每個方面都會顯示數(shù)據(jù)。
重要的是要更好地管理我們的數(shù)據(jù)中心,以提高能效和可靠性。捕獲超過基本數(shù)據(jù)并包含IT資產(chǎn)跟蹤功能的軟件包當然是有用的,但這些不應該是制定購買決策的主要原因。一款好的DCIM產(chǎn)品應該將大量性能數(shù)據(jù)變成真正的管理信息,以便更好地實現(xiàn)這些復雜和動態(tài)的操作。真正定義一款好的DCIM工具的標準是看其如何實現(xiàn)這一目標,這就是企業(yè)客戶在評估工具時應該注意的。
一款良好的DCIM部署實施應該有助于彌補IT和設施團隊之間的任何差距,但不會讓設施人員被海量無用的數(shù)據(jù)淹沒。建筑管理也是如此。一款好的DCIM工具將所選的報警和警告將提供給監(jiān)控整個數(shù)據(jù)中心園區(qū)的樓宇管理或自動化系統(tǒng),并且通常連接到安全桌面。這些人比數(shù)據(jù)中心處理的數(shù)據(jù)更多,所接受的使用和操作培訓也很少。
每款DCIM產(chǎn)品都提供標準化的圖形用戶界面(GUI)。主屏幕應該足夠合理,任何用戶都能快速掌握至少85%的顯示內(nèi)容,而無需解釋。如果你不能這樣做,那其就不是直觀的設計,而不應該你想要的GUI。
有效的DCIM工具還應基于所有數(shù)據(jù)生成易于理解的趨勢,并且理想的情況下,還將在關鍵系統(tǒng)發(fā)生故障之前發(fā)出警報。一款強大的DCIM產(chǎn)品應該是模塊化的。數(shù)據(jù)中心基礎設施管理軟件有助于在數(shù)據(jù)中心中融合設施和IT。然而,由于傳統(tǒng)設施或建筑管理團隊與IT團隊之間就控制權而陷入了一場拔河,因此使得DCIM使用的興起呈現(xiàn)了一定程度的組織性問題。
DCIM包含許多技術,并且這些廣泛的功能使得企業(yè)客戶在選擇和部署DCIM軟件時特別具有挑戰(zhàn)性。深圳計通專注于數(shù)據(jù)中心機房數(shù)據(jù)中心基礎設施建設20余年,為數(shù)據(jù)中心提供一個模塊化的DCIM平臺,其中包括幫助處理工作任務,跟蹤和報告IT資產(chǎn),系統(tǒng)健康狀況,能源使用和效率的單元,以及通過手機APP移動設備監(jiān)控的另一個模塊、數(shù)據(jù)統(tǒng)計分析、工作流管理等。
而IT團隊使用各種服務器或系統(tǒng)管理工具來進行資產(chǎn)配置和監(jiān)控。這種孤立的方法沒有給團隊之間分享來自不同工具的信息或定期一起工作提供理由。
DCIM所有權可以分為不同的群體。部署和維護DCIM平臺通常是屬于負責提供服務器,存儲,網(wǎng)絡和其他計算資源的IT操作人員的工作領域內(nèi)的。實際的數(shù)據(jù)中心監(jiān)測信息則仍然在企業(yè)的設施和IT之間擺動,這項團隊之間其實可以作為互補,而不是相互對抗,利益相關者們可以共享同一平臺。