Rút kinh nghiệm bảo mật Trung tâm dữ liệu sau sự cố Data center của VNG

posted in: Tin tức | 0

Hẳn bạn vẫn còn nhớ sự cố data center của VNG diễn ra ngày 23/9. Bất chợt một ngày “không đẹp trời lắm”, các trang điện tử bỗng dưng biến mất. Cụ thể là vào khoảng 10h30 ngày 23/9, rộ lên thông tin rằng đã xảy ra sự cố Data center của VNG. Các trang báo mạng như Baomoi.com, Zing.vn, Vov.vn, Toquoc.vn, Zalo, Thanhnien.vn… bị gián đoạn truy cập. Khi kết nối đến trang web, tất cả đều hiển thị dòng thông báo lỗi “Quá thời gian truy cập” / “Hệ thống đang nâng cấp và bảo trì… Quý khách vui lòng quay trở lại sau ít phút nữa.”

Lý do được người chịu trách nhiệm đưa ra là do sự cố mất điện. Tuy nhiên sự cố Data center cũng gây không ít ảnh hưởng đến các trang nghe nhạc hoặc ứng dụng online… làm người dùng không thoải mái.

Vậy làm thế nào để bạn biết chiến lược nguồn điện như thế nào là tốt nhất cho ứng dụng trung tâm dữ liệu để tránh tình trạng xảy ra sự cố điện như Data center của VNG?

Tính toàn và phân chia hiệu quả sử dụng nguồn điện

Một trong những số liệu phổ biến nhất để đo lường hiệu quả trong các trung tâm dữ liệu là hiệu quả sử dụng năng lượng (PUE). Nó so sánh tổng công suất trung tâm dữ liệu với sức mạnh được sử dụng để chạy thiết bị CNTT. Trung tâm dữ liệu tối ưu sẽ có giá trị PUE là 1.0, trong đó tất cả sức mạnh đi vào trung tâm dữ liệu đang được sử dụng trực tiếp để cấp nguồn cho thiết bị CNTT.

Bất kỳ giá trị nào trên 1.0 nghĩa là một phần của tổng công suất thiết bị đang được chuyển hướng đến các hệ thống hỗ trợ trung tâm dữ liệu như làm mát, chiếu sáng và hệ thống điện. Số PUE càng cao, phần lớn nguồn điện được tiêu thụ bởi các hệ thống hỗ trợ liên quan đến thiết bị CNTT, dẫn đến một trung tâm dữ liệu kém hiệu quả hơn.

Việc giảm PUE và tăng hiệu quả đã được trên các hệ thống cơ khí và khả năng sử dụng làm mát miễn phí. Khi chủ sở hữu trung tâm dữ liệu cố gắng giảm chi phí hơn nữa, trọng tâm đã chuyển sang hệ thống điện. Hệ thống điện lãng phí năng lượng dưới dạng tổn thất do sự thiếu hiệu quả trong các thiết bị điện và hệ thống phân phối. Trung bình, tổn thất hệ thống phân phối điện chiếm 12% tổng năng lượng tiêu thụ bởi trung tâm dữ liệu.

sự cố data center của vng

Mẹo thiết kế hệ thống điện

Hãy thử xem xét những yêu cầu khi lên kế hoạch cho hệ thống phân phối điện trung tâm dữ liệu:

– Cài đặt hoặc thay thế nguồn điện và thiết bị CNTT hiện có bằng thiết bị tiết kiệm năng lượng

– Xem lại thiết bị CNTT được đề xuất để xác định xem các hệ thống có thể hoạt động trên 240 Vac hoặc 380 Vdc hay không

– Xem lại tất cả các ưu điểm và thách thức của các hệ thống điện khác nhau

– Xác định bao nhiêu cơ sở hạ tầng hiện có sẽ cần được thay thế để thay đổi hệ thống điện

– Thiết kế linh hoạt vào hệ thống điện sẽ cho phép trung tâm dữ liệu thích nghi trong tương lai

– Thiết kế một hệ thống điện mô-đun và có thể mở rộng để loại bỏ tải một phần

Tương tự như các hệ thống cơ khí, các thay đổi có thể được thực hiện cho hệ thống điện để làm cho nó hiệu quả hơn và tiết kiệm năng lượng. Chìa khóa cho một thiết kế cơ sở quan trọng nhiệm vụ tốt là không làm giảm độ tin cậy của cơ sở trong quá trình này.

Hệ thống phân phối điện điển hình

Hệ thống phân phối điện trung tâm dữ liệu kế thừa điển hình được tạo thành từ năm thành phần chính. Nguồn được cung cấp cho trung tâm dữ liệu ở điện áp trung bình từ nguồn điện của máy phát điện / máy phát điện. Công suất được giảm từ điện áp trung bình xuống điện áp phân phối (480 V) bằng máy biến áp trạm biến áp. Sức mạnh sau đó đi qua một hệ thống cung cấp điện liên tục (UPS) có điều kiện điện và cung cấp khả năng đi qua trong thời gian ngừng hoạt động cho đến khi máy phát điện bắt đầu. Sau đó điện năng được giảm xuống điện áp trạm biến áp (208/120 V) bằng một đơn vị phân phối điện (PDU). PDU cung cấp điện cho nguồn cung cấp điện IT, nơi nó được chỉnh lưu và giảm xuống 12 Vdc, là điện áp hoạt động bên trong của thiết bị CNTT.

Bốn thành phần trong hệ thống phân phối điện kế thừa có tổn thất cao nhất là:

– Biến áp trạm biến áp: Biến áp không tải và tổn thất lõi

– UPS: Rectifier và biến tần tổn thất

– PDU biến áp: Biến áp không tải và mất lõi

– Cung cấp điện IT: Rectifier và biến áp tổn thất.

Một phương pháp khác để tăng hiệu quả là loại bỏ tải một phần của trung tâm dữ liệu. Loại bỏ tải một phần giảm tổn thất bằng cách cho phép thiết bị hoạt động ở hiệu suất hoạt động cao nhất của nó. Điều này có thể được thực hiện bằng cách thiết kế một hệ thống điện mô-đun và có thể mở rộng, một hệ thống phát triển với tải hoặc bằng cách thiết kế hệ thống điện sử dụng các mức linh hoạt và phù hợp với độ tin cậy và dự phòng cho các chương trình khác nhau trong trung tâm dữ liệu.

Một phương pháp thứ ba là để loại bỏ các thiết bị điện không hiệu quả hoàn toàn. Tăng hiệu quả bằng cách loại bỏ các thiết bị có nhiều tổn thất nhất là lý do tại sao các chiến lược năng lượng khác nhau đang được nghiên cứu để phân phối trung tâm dữ liệu.

Phân phối nguồn điện theo kế hoạch 415/240 Vac 

Một chiến lược phân phối điện đang ngày càng được sử dụng rộng rãi trong trung tâm dữ liệu là 415/240 Vac. Chiến lược này loại bỏ PDU và phân phối điện ở điện áp cao hơn hình thành UPS thẳng đến tủ máy chủ. Mục tiêu chính là để đạt được hiệu quả bằng cách loại bỏ các tổn thất biến áp kết hợp với PDU và bằng cách cho phép tải IT hoạt động hiệu quả hơn ở điện áp cao hơn.

Ưu điểm:

– Hiệu quả năng lượng (giảm 5% đến 7% tổn thất)

– Giảm tải trên các hệ thống làm mát

– Tăng độ tin cậy

– Kích thước bộ dẫn mạch nhánh và nhánh nhỏ hơn để cung cấp cùng một lượng điện năng

– Có được khoảng trắng trong trung tâm dữ liệu (hai tủ cho mỗi PDU được loại bỏ)

– Giảm chi phí bảo trì (PDU và hệ thống cơ khí)

– Thiết bị phân phối điện luôn sẵn sàng.

Thách thức:

– Mức độ lỗi hiện tại cao hơn

– Tiềm năng cho đèn flash hồ quang đòi hỏi mức độ cao hơn của thiết bị bảo vệ cá nhân (PPE) để làm việc trên thiết bị

– Dây dẫn trung tính đầy đủ yêu cầu trong suốt hệ thống

– Harmonic ảnh hưởng đến phần còn lại của hệ thống.

Thách thức chính với hệ thống phân phối Vac 415/240 là mức độ lỗi hiện tại cao. Việc tháo PDU ra khỏi hệ thống cũng loại bỏ trở kháng biến áp, giới hạn dòng lỗi hiện tại ở hạ lưu trong trung tâm dữ liệu.

Một lựa chọn để xem xét khi thiết kế một hệ thống 415/240 Vac là phá vỡ hệ thống phân phối thành các mảnh nhỏ hơn, nhiều mô-đun hơn.

Bằng cách sử dụng các máy biến áp trạm biến áp trở kháng nhỏ hơn, kỹ sư có thể làm giảm dòng lỗi tổng thể trên toàn bộ hệ thống. Một tùy chọn khác để xem xét là việc sử dụng các thiết bị giới hạn hiện tại. Vì các thiết bị giới hạn hiện tại có xu hướng có thời gian phản ứng nhanh, nên đề xuất một nghiên cứu phối hợp để xác minh rằng độ tin cậy của hệ thống không bị ảnh hưởng.

Phân phối 480/277 Vac

Chiến lược phân phối điện năng 480/277 Vac tương tự như 415/240 Vac trong đó nó loại bỏ PDU và phân phối điện ở điện áp cao hơn thẳng tới tủ máy chủ. Mục tiêu chính, lợi thế và thách thức của chiến lược phân phối điện năng 480/277 Vac giống hệt như chiến lược phân phối điện của 415/23 Vac.

Một bất lợi lớn của chiến lược phân phối điện 480/277 Vac là 277 V vượt quá mức 240 V của hầu hết các nguồn cung cấp thiết bị CNTT. Việc thực hiện chiến lược này đòi hỏi phải mua các máy chủ tùy chỉnh với nguồn cung cấp điện được thiết kế để hoạt động ở 277 V. Vì lý do này, chiến lược phân phối điện năng 480/277 Vac không phổ biến như chiến lược phân phối điện của 415/240 Vac. Hiện tại nó chỉ được sử dụng trong các cơ sở rất lớn, nơi tiết kiệm năng lượng lớn hơn chi phí của các máy chủ tùy chỉnh do khối lượng lớn các máy chủ được mua.

Phân phối 600 Vac

Chiến lược phân phối điện 600 Vac dựa trên việc sử dụng điện áp tiêu chuẩn của Canada là 575/347 Vac. Công suất được giảm xuống 600 Vac tại trạm biến áp trạm biến áp và phân phối cho hệ thống UPS. Nguồn điện sau đó được phân phối từ hệ thống UPS tại 600 Vạc đến một PDU nằm gần trung tâm dữ liệu.

Ưu điểm:

– Giảm chi phí đồng (xe buýt thiết bị nhỏ hơn và máy cấp nhỏ hơn để cung cấp cùng một lượng điện năng)

– Sử dụng toàn bộ thiết bị điện 600 V

– Dòng lỗi có sẵn thấp hơn (trở kháng biến áp PDU).

Thách thức:

– Không đạt được hiệu quả (tổn thất biến áp PDU)

– Không có khoảng trắng trong trung tâm dữ liệu

– Không giảm chi phí bảo trì.

Mặc dù chiến lược phân phối 600 Vac không loại bỏ tổn thất biến áp PDU hoặc giảm chi phí bảo trì, nó có thể giảm chi phí vốn ban đầu. Một hệ thống 600 Vac tận dụng dòng điện giảm ở điện áp cao hơn dẫn đến các dây dẫn nhỏ hơn hoặc ít hơn. Sử dụng dây dẫn nhỏ hơn hoặc ít hơn sẽ làm giảm lượng đồng và giảm chi phí. Điện áp cao hơn cũng cho phép các trạm biến áp lớn hơn. Tùy thuộc vào kích thước của trung tâm dữ liệu, sử dụng các trạm biến áp lớn hơn có thể dẫn đến giảm tổng số trạm biến áp cần thiết.

Công suất 380 Vdc

Trái ngược, năng lượng dc rất phổ biến trên thế giới ngày nay. Các ngành công nghiệp viễn thông và vận tải đã sử dụng năng lượng dc trong nhiều năm. Các nguồn năng lượng thay thế và tái tạo như năng lượng mặt trời, năng lượng gió và pin nhiên liệu là nguồn năng lượng dựa trên nguồn DC. Hầu hết các thiết bị điện tử trong nhà ở và trong văn phòng hoạt động nội bộ trên điện dc. Và, quan trọng nhất, các thiết bị lưu trữ năng lượng như pin và hệ thống UPS hoạt động trên điện dc.

Khi bạn nhìn vào một hệ thống phân phối trung tâm dữ liệu truyền thống điển hình, công suất được điều chỉnh từ ac sang dc, đảo ngược từ dc sang ac, chuyển từ 480 Vac thành 208 Vac, sửa lại từ ac sang dc, và sau đó chuyển xuống 12 Vdc trước cấp nguồn cho thiết bị CNTT. Mỗi khi năng lượng được chuyển đổi, tổn thất xảy ra ở dạng nhiệt dẫn đến giảm hiệu suất năng lượng.

Chiến lược phân phối điện 380 Vdc phân phối nguồn điện dc từ UPS (bộ chỉnh lưu dc) thẳng tới nguồn điện IT. Mục tiêu chính là đạt được hiệu quả bằng cách loại bỏ các tổn thất biến tần trong UPS, tổn thất bộ chỉnh lưu trong nguồn cung cấp điện IT và các tổn thất biến áp kết hợp với PDU.

Ưu điểm:

– Hiệu quả năng lượng (giảm 8% đến 10% tổn thất)

– Giảm tải trên các hệ thống làm mát

– Tăng độ tin cậy

– Dấu chân vật lý nhỏ hơn

– Tích hợp với các nguồn năng lượng thay thế

– Giảm chi phí bảo trì.

Thách thức:

– Kiến thức hạn chế và khó tìm thợ điện có kinh nghiệm về hệ thống dc

Phải tính đến sự sụt giảm điện áp trên các nguồn cấp dữ liệu dương và âm mối nguy hiểm flash arc flash (NFPA 70E cung cấp hướng dẫn về bảo vệ đèn flash hồ quang dc).

Ngoài số lượng thợ điện hạn chế với kinh nghiệm điện dc, thách thức chính với sức mạnh của dc trong quá khứ là thiếu tiêu chuẩn. Tuy nhiên, điều này đang bắt đầu thay đổi. Cả hai Viện Tiêu chuẩn Viễn thông Châu Âu (ETSI) và Liên minh EMerge đã tiêu chuẩn hóa trên 380 Vdc và hướng dẫn sản xuất cho phân phối điện dc.

Nhận xét các hệ thống nguồn điện

Trừ khi trung tâm dữ liệu hoàn toàn được cung cấp bởi một nguồn năng lượng thay thế, chẳng hạn như các tế bào nhiên liệu, nó rất có thể được cung cấp điện ac từ tiện ích. Trong hệ thống điện dc, UPS được sử dụng để điều chỉnh công suất từ ​​ac đến dc. Bởi vì sự phân phối đến trung tâm dữ liệu là dc, bất kỳ bỏ qua của hệ thống UPS cũng sẽ cần một chỉnh lưu.

Do đó, các hệ thống dc có hiệu quả chi phí hơn trong một hệ thống dự phòng an toàn Data Center Tier 4, nơi một UPS thứ hai (bộ chỉnh lưu dc) được sử dụng làm đường vòng. Những điều cần lưu ý khi thiết kế hệ thống phân phối điện dc bao gồm sử dụng thiết bị bảo vệ thích hợp được đánh giá để sử dụng trong hệ thống dc và tuân thủ các yêu cầu cụ thể đối với hệ thống tiếp đất dc.

Trong nỗ lực tăng hiệu quả và giảm chi phí, các chiến lược năng lượng khác nhau để phân phối điện cho trung tâm dữ liệu đang bắt đầu được sử dụng. Cho dù bạn dự định cập nhật trung tâm dữ liệu hiện có, mở rộng trung tâm dữ liệu hiện có hay xây dựng một trung tâm dữ liệu mới, thiết kế hệ thống phân phối điện là một phần quan trọng của kế hoạch và hệ thống đó phải được đánh giá để xác định hệ thống nào là hệ thống chính xác cho ứng dụng.

Nghiên cứu trường hợp lý thuyết

Hai chiến lược sức mạnh để phân phối năng lượng cho trung tâm dữ liệu dường như đạt được mức độ phổ biến nhất bao gồm kiến ​​trúc ac cao hơn 415/240 V và kiến ​​trúc 380 Vdc.

Hệ thống 415/240 Vac có mức tiết kiệm CAPEX 12% và tiết kiệm 20% OPEX khi so sánh với trung tâm dữ liệu kế thừa 208/120 V. Hệ thống 380 Vdc có tiết kiệm 14% CAPEX và tiết kiệm 28% OPEX khi so sánh với trung tâm dữ liệu kế thừa 208/120 V. Cần lưu ý rằng không giống như di sản và hệ thống 415 Vac, 380 Vdc sử dụng UPS dự phòng (bộ chỉnh lưu dc) làm đường vòng và không bao gồm một đường rẽ riêng biệt trên mỗi hệ thống UPS (bộ chỉnh lưu dc).

Hy vọng, với những thông tin trên, bạn sẽ biết cách xử lý hệ thống điện để tránh gặp sự cố Data center của VNG. Hoặc bạn có thể lựa chọn dịch vụ cho thuê chỗ đặt máy chủ giá rẻ để được phục vụ những dịch vụ chất lượng nhất mà không cần nhức đầu về các lỗi hệ thống trong trung tâm dữ liệu nữa! Chúc bạn may mắn!

Bình luận