數據中心運維服務主要負責基礎設施維護,包括高低壓變配電系統、發電機組、不間斷直流電源系統、不間斷交流電源系統、機房空調系統及電力電纜、機房環境集中監控系統、防雷及接地系統、弱電系統、消防系統等。
通過對設備的正確維護和保養,保障機房設備穩定、可靠、節能運行,確保通信設備的運行環境,延長設備的生命周期,降低設備的故障率。
數據中心基礎設施運維的主要任務:
(1)維護機房設施,延長設備的使用周期。
(2)改造機房設施,適應各種需求。
(3)合理運行設施,降低運營成本。
(4)保證各類運行設備設施的電氣性能、機械性能、維護技術指標符合標準。
(5)加強運行設備維護管理,做好預防性維護,保證設備穩定、可靠地運行。
(6)及時排除安全隱患,防止重大安全事故的發生。
(7)完善應急保障方案,減少故障歷時。
(8)積極采用新技術,改進維護方法,提高工作效率。
(9)合理調整系統配置,提高效率,延長各類設備使用壽命。
(10)加強用電管理,降低能耗,節約運行維護費用。
(11)保持設備和環境整潔。
基礎設施運維部門的主要職責,是做好對基礎設施系統和設備的日常維護和管理工作;制定維護作業計劃,并根據計劃做好例行測試和維護工作。定期巡視,及時排除故障和隱患,保證基礎設施系統和設備的正常、穩定運行;嚴格執行數據中心運維管理制度;發生重大障礙和突發事故,要迅速處理并上報;事后積極分析事故原因,吸取教訓,制定防范措施,并切實落實;定期收集匯總動力系統各類相關運行數據,分析系統及設備運行狀況,提出改善系統及設備運行質量的對策與措施。
設備的維護工作內容:其中需要維護的系統包括電氣配電系統、空調系統、消防系統、監控系統等。
(1)高壓變配電設備操作人員必須持有當地供電部門頒發的高壓變配電設備操作證書。(2)應實行兩人值班制,一人操作、一人監護,實行操作唱票制度。不準一人進行高壓操作。(4)在切斷電源、檢查有無電壓、安裝移動地線裝置、更換熔斷器等工作時,均應使用防護工具。(5)在距離10kV~35kV導電部位1m以內工作時,應切斷電源,并將變壓器高低壓兩側斷開,凡有電容的器件(如電纜、電容器、變壓器等)應先放電。(6)核實負荷開關確實斷開,設備不帶電后,再懸掛“有人工作,禁止合閘”警告牌,方可進行維護和檢修工作。警告牌只許原掛牌人或監視人撤去。(7)嚴禁用手或金屬工具觸動帶電母線,檢查通電部位時應用符合相應等級的試電筆或驗電器。(8)雨天不準露天作業,高處作業時應系好安全帶,嚴禁使用金屬梯子。(1)人工倒換備用電源設備時,必須遵守有關技術規定,嚴防人為差錯。(2)要定期試驗信號繼電器的動作和指示燈是否正常。(1)機組應保持清潔,無漏油、漏水、漏氣、漏電(簡稱四漏)現象。機組上的部件應完好無損,接線牢靠,儀表齊全、指示準確,無螺絲松動。(2)根據各地區氣候及季節情況的變化,應選用適當標號的燃油和機油。(3)保持機油、燃油及其容器的清潔,定時清洗和更換(機油、燃油和空氣)濾清器。油機外部運轉件,要定期補加潤滑油。(4)啟動電池應經常處于穩壓浮充狀態,每月檢查一次充電電壓及電解液液位。(5)市電停電后應能在15分鐘內正常啟動并供電,需延時啟動供電的,應報上級主管部門審批。(6)新裝或大修后的機組應先試運行,當性能指標都合格后,才能投入使用。(2)對于并聯冗余系統宜在穩壓并機均分負荷的方式下運行。(3)各地根據當地市電頻率的變化情況,選擇合適的跟蹤速率。對于市電頻率變化過快的地區,UPS的工作方式宜采用內同步。(1)每組至少選2只標示電池,作為了解全組工作情況的參考。(2)不同規格、不同廠家的電池禁止在同一直流供電系統中使用;不同年限的電池不宜在同一直流供電系統中使用。(3)密封電池在使用前不需進行初充電,但應進行補充充電。補充充電方式應按說明書規定進行。對空調系統每年應進行一次工況測試,以及時掌握系統各主要設備的性能,并對空調系統設備進行一次有針對性的整修和調整,保證系統運行穩定可靠,不帶病工作。(1)機房專用空調均有清潔空氣用的空氣過濾器,機組長期運轉時,空氣過濾器必然會積累大量塵土,必須經常做清理,以防止因塵土積累過多而阻塞過濾器,造成氣流量減少,蒸發器內制冷劑蒸汽過熱度減小,蒸發壓力降低,影響制冷效果。嚴重時蒸發器表面結霜,未蒸發完全的制冷劑液體進入壓縮機,造成壓縮機損壞。空氣過濾器屬于損耗品,須定期清潔、更換;清潔、更換周期視機房內的空氣質量情況確定,要盡量避免在空氣過濾器報警的時候再更換或清潔過濾器。(3)送風機如有異常響聲,應停機檢查風機葉片有無異物或損壞,軸承是否有發熱損壞,如果是皮帶傳動的風機,還須檢查皮帶是否松動,如果皮帶已松須及時上緊;風機皮帶屬于損耗品,須定期更換,周期為1~2年。(4)過濾器清潔、濾料無破損、透氣孔無阻塞、無變形。(6)翅片水槽和冷凝水盤應干凈無沉積物,冷凝水管應暢通。(1)室外冷凝器(或干冷器)須定期檢查,不能有塑料袋、廢紙等異物阻塞冷凝器翅片影響散熱;如果翅片上積有太多塵土影響通風散熱時,須及時對其進行清洗,否則會造成壓縮機排汽壓力過高。(2)風扇支座緊固,基墩不松動,無風化現象。電機和風葉應無灰塵、油污、扇葉轉動正常,無抖動和摩擦。(3)定期用鉗形電流表測試風機的工作電流,檢查風扇的調速機構,看是否正常。(4)電機的軸承應為緊配合,發現扇葉擺動或轉動不正常時應進行維修或更換。(1)用高、低壓氣壓表測試制冷管路的高低壓壓力,發現問題及時排除。(2)蒸發器表面不可控結露或出現結霜時,說明蒸發器內蒸發壓力偏低。首先檢查通風量是否減少(空氣過濾器被堵,送、回風風路有阻礙物等),再檢查制冷循環回路是否存在阻塞,此時,掛上高、低壓壓力表,檢查高壓端排氣壓力與回液壓力是否一致或接近。如果排氣壓力明顯高于回液壓力,則說明系統有阻塞(阻塞處表面會有明顯的溫度降,這是阻塞點處的制冷劑內部壓力降造成的表面溫度變化,通過手摸可以就可以查到,這種現象通常發生在回液段,壓縮機的排氣段,由于溫度過高,不宜手摸,避免燙傷),最容易發生阻塞的位置是干燥過濾器(系統在施工過程中沒有做好清潔工作),通過更換干燥過濾器可以解決。如果系統流動正常,則再檢查膨脹閥是否損壞,如均正常,則可判斷為系統缺少制冷劑,對系統進行補充直至蒸發壓力恢復正常(加注制冷劑時,需注意不要在壓縮機吸汽端加注液體制冷劑,以防止“液擊”。現在大部分直接蒸發制冷的DX機房專用空調采用的均是渦漩式壓縮機,可以不必考慮“液擊”的問題,但是加注液體制冷劑也需要緩慢進行)。對于采用R407C制冷劑的機組,由于此種制冷劑是混合型的,加注時必須是液體制冷劑。(3)在沖入氟利昂之前,要先檢查系統是否有泄漏,由于潤滑油和氟利昂是互溶的,通常在制冷劑泄漏的地方,會有油污出現,通過檢查油污點,可以迅速找到泄漏位置,如有條件也可以使用檢漏儀確定具體的漏點。(4)壓縮機排氣壓力過高時,首先按風冷冷凝的維護步驟進行檢查,再檢查冷凝器(或干冷器)風機是否能正常工作,冷凝器放置地點通風是否順暢,如均正常,則可判斷制冷劑充入量過多或制冷系統內混有不可凝性氣體(空氣或氮氣等)。制冷劑充入量過多,表現為當壓縮機停機時,溫度和壓力均同時下降,此時放掉適量制冷劑即可(當制冷劑是含CFC產品時,建議盡量將排放的制冷劑回收,以減少環境的污染);如系統中混有不可凝性氣體時,則表現為壓縮機開機后壓力、溫度上升較快,停機時,溫度降低較快而壓力降低較慢,此時,須通知生產廠家的技術人員前來解決。(5)發現壓縮機有異象時,應盡快通知廠家來處理,如震動、響聲過大時,宜考慮盡早更換。由于氟利昂制冷劑在高溫時,會產生酸,這將會腐蝕新換的壓縮機的電機的電氣絕緣,所以要盡可能避免在壓縮機燒毀的時候再更換。在更換壓縮機時,干燥過濾器須一并更換,更換壓縮機時,由于壓縮機本身帶有的潤滑油是足夠整個系統運行使用到的,但是系統里保存的制冷劑里已經包含了大量的原有潤滑油,因此在新換上壓縮機時,還需要觀察壓縮機潤滑油的液位窗。必要時,需要釋放掉部分潤滑油,以避免壓縮機負荷過重。壓縮機更換后,局部必須要做抽真空干燥處理。如果是已經燒毀的壓縮機,還需要考慮在系統上做除酸的處理,具體實施方案,需要找廠家協商解決。(6)定期觀察視鏡內氟利昂的流動情況,判斷有無水分,是否缺液。(1)加濕最好使用軟化水。如無條件對加濕供水進行軟化,電極式的加濕器須對加濕罐定期清洗水垢(清洗周期要根據當地的空氣濕度及水質的硬度來確定),以保持電極板良好的導電性能;如果當地水源導電率偏低,或使用純凈水做加濕時,對于電極式的加濕系統,加濕罐中的水因電流太小無法沸騰時,可往水中添加適量食鹽以增加導電率。電極式加濕的加濕罐屬于損耗品,罐體內的水垢應定期清理,尤其在秋季、冬季和春季,加濕系統的負荷比較重時,如果水垢不能得到及時清理,將會嚴重腐蝕電極,此時加濕罐就需要更換(即使是使用軟化水,電極也會被腐蝕,只是減少的清潔水垢的工作量,當電極腐蝕嚴重時,加濕罐也需要更換)。(3)檢查給排水管路,保證暢通,無滲漏、堵塞現象。(4)檢查電磁閥的動作,加濕負荷電流和控制器的工作情況,發現問題及時排除。(5)加濕的上水系統是機房跑水的主要風險之一,機房內應在機房專用空調的底部做防水處理,并做好漏水檢測,與此同時,還需要漏水檢測與加濕上水的總閥門做好聯動,機房內一旦有漏水報警,需要立刻關斷整個機房加濕系統的上水總電磁閥。(1)冷卻循環管路暢通,無跑、冒,各閥門動作可靠;定期清除冷卻水池雜物及清除冷凝器水垢。(1)定期檢查報警器的聲、光報警是否正常,接觸器、熔斷器有無松動或損壞,發現問題及時排除。(2)檢查電加熱器的螺絲有無松動,熱管有無塵埃,如有松動和塵埃應及時緊固和清潔。(3)用鉗形電流表測試所有電機的負載電流,測量數據與原始記錄不符時,應查出原因,進行排除。(4)檢查繼電器和電子元件有無損壞和變質,發現問題及時更換。(5)用測量回風溫度,偏差超出標準時,應進行調整。(6)測量設備的保護接地線,如果引線接觸不良,應及時緊固。(1)機房專用空調的傳感器長期暴露在流動的空氣中,在塵土、水汽的長期作用下,傳感器的數值會發生漂移,使得機房內溫濕度的顯示和控制產生誤差。為減少傳感器數值誤差對機房溫濕度的影響,傳感器可進行定期校正。尤其是在同一較大的機房內有多臺單獨的機房專用空調時,傳感器的誤差可能會造成一部分空調在制冷或除濕,而另一部分空調在加熱或加濕。(2)傳感器校正需安排專業的工程師,參照確保是準確的溫濕度計。可以使用水銀的,或酒精的干濕球溫度計;如有條件,可每隔1-2年校正一次。(1)制冷循環回路要保持足夠量制冷劑,調節閥動作可靠,系統內無臟污、結冰、堵塞和滲漏。(2)壓縮機與電機的同心度要符合技術指標,軸封漏油量不準超出規定指標,運轉應正常。(4)潤滑油泵運行正常,油路暢通,油量足,無泄漏,定期檢測潤滑油品質;設備停用期間每半月應啟動一次油泵,運轉20~30分鐘。(1)冷媒循環回路流量充足,各支路分配均勻,壓力和溫度正常,自動補給裝置完好;調節閥作用可靠,管路暢通無跑、冒。(3)二次風除塵過濾裝置要經常保持清潔,調節機構靈活可靠。(4)定期檢查風機電機的潤滑及轉動方向,保證足夠的空氣循環量。(1)冷卻循環管路暢通,無跑、冒,各閥門動作可靠;定期清除冷卻水池雜物及清除冷凝器水垢。(3)冷卻塔風機、播水器運行正常,水流暢通,播灑均勻。(2)送風機如有異常響聲,應停機檢查風機葉片有無異物或損壞,軸承是否有發熱損壞,如果是皮帶傳動的風機,還須檢查皮帶是否松動,如果皮帶已松須及時上緊;風機皮帶屬于損耗品,須定期更換,周期為1~2年。(1)各電機運行正常,軸承潤滑良好,絕緣電阻在2MΩ以上。接線牢固,負荷電流及溫升符合要求。(2)熔斷器及開關規格應符合要求,溫升不應超過標準。(3)各種電器、控制元器件表面清潔,結構完整,動作準確,顯示及告警功能完好。“摸”:使用紅外線測溫儀測量電機、高低壓制冷管路、油路、電動控制元器件等溫度是否正常,有無振蕩現象。“看”:設備有無打火、冒煙、跑、冒、漏現象。查看冷卻水池水位。巡視記錄內容:高(低)壓壓力、油壓、油溫、能量調節裝置數值、冷卻水溫、冷凍水溫度及壓力、各系統負荷電流,發現異常及時處理。(4)設備長時間停用時,要將制冷劑壓入冷凝器或儲罐內,系統要保持正壓;排凈供冷及冷卻系統用水,防止冬天凍壞管路;切斷主配電盤電源。普通空調設備應能夠滿足長時間運轉的要求,并具備停電保存溫度設置,來電自啟動功能。使用普通空調應注意:(1)勿受壓:空調器外殼是塑料件,受壓范圍有限,若受壓,面板變形,影響冷暖氣通過,嚴重時更會損壞內部重要元件。(2)換季不用時:清掃濾清器,以免灰塵堆積影響下次使用;拔掉電源插頭,以防意外損壞;干燥機體,以保持機內干燥;室外機置上保護罩,以免風吹,日曬、雨淋。(3)重新使用:檢查濾清器是否清潔,并確認已裝上;取下室外的保護罩,移走遮擋物體;沖洗室外機散熱片;試機檢查運行是否正常。消防主機、及早期報警主機、早期報警探測器、感煙探測器、感溫探測器、報警、排煙、滅火器材、應急廣播、消防電話等。(4)控制屏和聯動臺主備電源自動切換功能和備用電源自動充電功能維護保養。(9)消火栓內手動報警器檢測數量。遠程聯動啟動消防泵和聯動臺手動啟停消防泵的控制功能和信號顯示功能維護保養。(10)水流指示器報警功能和信號顯示功能維護保養。(11)壓力開關遠程聯動啟動噴灑泵和聯動臺手動啟停噴灑泵的控制功能和信號顯示功能維護保養。(12)煙感探測器和手動報警器報警聯動強切非消防電源及防火閥的控制功能和顯示信號功能維護保養。(13)煙感和手動報警器報警聯動啟動加壓送風機切斷空調風機的控制功能和信號顯示功能維護保養,聯動臺手動啟停加壓送風機的控制功能和信號顯示功能維護保養。(2)卷簾門兩側煙感探測器報警聯動卷簾門一步降的控制功能和信號顯示功能維護保養,溫感探測器報警聯動卷簾門二步降的控制功能和信號顯示功能維護保養。(1)滅火劑儲存容器、選擇閥、液體單向閥、高壓軟管、集流管、閥驅動裝置、管網與噴嘴等全系統組件進行外觀檢查,各系統組件外觀完好,標志清晰完整。(2)滅火劑儲存容器內的壓力,不小于設計存儲壓力的90%。(3)氣體驅動裝置的氣動源的壓力,不小于設計壓力的90%。儲存容器間內清潔狀況,不允許有其它雜物,影響系統的操作。避免陽光直射,冬季和夏季應檢查室內溫度是否在0℃~50℃之間。檢查氣動啟動瓶組上的壓力表,其讀數應為4.0MPa~5.0 MPa,若壓力不在此值范圍內,請立即維護。檢查滅火劑儲瓶組上的壓力表,其讀數應在正常區間內,否則立即維護。檢查各種閥門是否完好無損,選擇閥上的手動手柄是否處于“關”的位置,各種安全銷完好無脫落。檢查防護區內通道是否暢通,火災探測器、噴頭的清潔狀況。檢查滅火報警控制器各種指示是否正常,備用電源能否可靠地使用。(5)定期對氣體啟動瓶組、滅火劑瓶組、管道及分配系統、噴頭進行維護和檢查。電動啟動閥與滅火報警控制器的連接是否正確、可靠、完好,端子是否有松動或脫落。從氣動啟動瓶組上卸下電磁閥,檢查其動作是否準確靈活。檢查啟動瓶是否超過使用期限,啟動瓶每5年檢驗一次,應根據鋼質無縫氣瓶標準進行。檢查啟動管路的完好性,所有連接部位無松動,對有松動、損傷的部位應更換,必要時應進行氣密試驗。檢查滅火劑儲瓶組的數量和儲存藥劑的總量是否符合設計的要求。檢查每個滅火劑儲瓶中滅火劑的量是否與規定的量相符,不符合規定的要檢查原因,修復好后重新充裝滅火劑。檢查滅火劑儲瓶是否超過使用期限,儲瓶每5年檢驗一次,應根據鋼質無縫氣瓶標準進行。檢查管道中和集流管上的安全閥、單向閥、選擇閥的安裝位置、方向是否正確,與管道連接是否牢靠。安全閥泄壓口是否暢通。檢查單向閥、選擇閥的密封性能,然后將選擇閥的手動手柄旋至“開”的位置,選擇閥應開啟。相應防護區的放氣指示燈亮。檢查噴頭的數量、噴頭孔徑、安裝位置是否符合設計的規定。對局部應用系統,應檢查保護對象是否處于噴頭的有效保護范圍之內。(4)噴頭、報警閥、雨淋閥、壓力開關、水流指示器等主要系統組件工作正常。(5)報警閥、雨淋閥除應有商標、型號、規格等標志外,尚應有水流方向的永久性標志。(6)報警閥和控制閥的閥瓣及操作機構應動作靈活,無卡澀現象;閥體內應清潔、無異物堵塞。(8)壓力開關、水流指示器及水位、氣壓、閥門限位等自動監測裝置應有清晰的銘牌、安全操作指示標志;水流指示器尚應有水流方向的永久性標志。(4)水槍、水帶、消火栓閥、消火栓箱、消防卷盤、閥門等主要系統組件正常。(5)水力止回閥除應有商標、型號、規格等標志外,尚應有水流方向的永久性標志。(6)水力止回閥的閥瓣及操作機構應動作靈活,無卡澀現象;閥體內應清潔、無異物堵塞。(2)吸氣式煙霧探測火災報警系統的靈敏度調整范圍,系統的報警閥值調節情況設置正常。(4)采樣孔堵塞,采樣管網斷裂等異常情況發生時及時發出報警。(6)采樣孔必須相對均勻地分布在不同的采樣管上。對明顯存在環境差異的采樣孔分別予以測試。(1)監控系統設備包括:各級監控中心主機和配套設備、計算機監控網絡、監控模塊及前端采集設備。(2)監控中心主機和配套設備應安裝在干燥、通風良好、無腐蝕性氣體的房間,室內應有防靜電措施及空調。(3)監控中心主機和配套設備應由不間斷電源供電,交流電壓的變化范圍應在額定值的-15%~ 10%內;直流電壓的變化范圍應在額定值的-15%~ 20%內。(6)監控系統作為數據中心運維高級維護手段,其自身應有例行的常規巡檢、維護操作和定期的對系統功能與性能指標的測試。(7)分析每天的各種告警數據報表、歷史數據報表和參數曲線,結合月、季的階段匯總報表,了解設備運行情況,制定相應的電源設備維護計劃。(8)監控中心應實行24小時值班,日常值班人員應對系統終端發出的各種聲光告警,立即作出反應。對于一般告警,可以記錄下來,進一步觀察,必要時做派修處理;對于緊急告警,應通知維護人員去處理,如涉及設備停止運行或出現嚴重故障,影響通信網的正常運行,應立即通知維護人員搶修,并通知上級主管人員。監控中心內設備,如服務器、業務臺、打印機、音箱和大型顯示設備等運行是否正常;查看系統操作記錄、操作系統和數據庫日志,是否有違章操作和錯誤發生。前端采集設備的數據采集、處理以及上報數據是否正常、準確。采集點接線端子檢查并緊固。(12)監控系統的功能和性能指標每季抽查一次,每半年檢測一次,抽查檢測過程以不影響供電系統的正常工作為原則。監控中心每季將數據庫內保存的歷史數據倒入外存后,作上標簽妥善保管,三年后刪除。系統配置參數發生改變時,自身配置數據要備份,在出現意外時,用來恢復系統。(14)集中監控系統軟件有正規授權,應用軟件有自主版權,系統軟件應有安裝盤,在系統出現意外情況下,重新安裝恢復。具備完善的安裝手冊、用戶手冊與技術手冊,整套軟件和文檔由專人保管。(15)每日、每月、每季和每年打印出的報表或輸出為只讀形式電子報表,裝訂成冊或刻在光盤上,妥善保管。