Việc kết hợp làm mát bằng chất lỏng và quản lý SSD hiệu quả mang đến hướng đi mới cho các trung tâm dữ liệu đang tìm cách nâng cao hiệu suất và mật độ lưu trữ.
Khi các trung tâm dữ liệu nỗ lực đạt được hiệu quả năng lượng cao hơn, đặc biệt là với nhu cầu của khối lượng công việc AI, nhiều người đang chuyển sang làm mát bằng chất lỏng để tối ưu hóa hiệu suất và quản lý mức tiêu thụ năng lượng. Làm mát bằng chất lỏng có thể quản lý hiệu quả nhiệt do máy chủ hiệu suất cao tạo ra, cho phép chúng hoạt động ở công suất cao nhất mà không tốn nhiều chi phí năng lượng như làm mát không khí truyền thống. SSD mật độ cao của Solidigm phù hợp lý tưởng cho những môi trường này, mang lại hiệu suất vượt trội từ terabyte đến watt.
Trong khi AI buộc nhiều nhà khai thác trung tâm dữ liệu phải cân nhắc việc làm mát bằng chất lỏng, thì tác động của nó còn lan rộng hơn nhiều. Trong một báo cáo trước đó, chúng tôi đã kiểm tra tác động của việc làm mát bằng chất lỏng trên Dell PowerEdge R760 2U. Làm mát bằng chất lỏng trực tiếp (DLC) của CoolIT giảm đáng kể mức tiêu thụ năng lượng của máy chủ bằng cách giảm tốc độ quạt, tiết kiệm điện 200 watt. Cuộc thử nghiệm đó hoàn toàn tập trung vào hiệu năng của CPU; lần này, chúng tôi muốn tập trung vào lưu trữ hơn để hiểu tác động của SSD đến mức tiêu thụ điện năng của máy chủ.
Trạng thái năng lượng hoạt động của NVMe là gì?
Trạng thái nguồn NVMe là trạng thái được xác định trước mà thiết bị NVMe có thể chuyển đổi sang để quản lý hiệu suất và mức tiêu thụ điện năng. Thông số kỹ thuật NVMe cho phép tối đa 32 trạng thái nguồn, mỗi trạng thái được đặc trưng bởi mức tiêu thụ điện năng tối đa, độ trễ đầu vào (ENLAT), độ trễ thoát (EXLAT) và các giá trị hiệu suất tương đối. Các trạng thái năng lượng này được chia thành trạng thái hoạt động và không hoạt động. Trạng thái nguồn hoạt động, hay Trạng thái P, cho phép thiết bị xử lý các hoạt động I/O. Các trạng thái không hoạt động, hay Trạng thái F, được sử dụng khi thiết bị không hoạt động và không xử lý các hoạt động I/O.
Việc quản lý các trạng thái năng lượng này là rất quan trọng để tối ưu hóa hiệu quả sử dụng năng lượng của các thiết bị NVMe, đặc biệt là trong những môi trường mà mức tiêu thụ điện năng là mối quan tâm hàng đầu, chẳng hạn như các thiết bị biên và các ứng dụng chuyên dụng như SSD trên Trạm vũ trụ quốc tế. Ví dụ: thông số kỹ thuật NVMe bao gồm các tính năng như Chuyển đổi trạng thái nguồn tự động (APST), cho phép thiết bị tự động chuyển đổi giữa các trạng thái nguồn dựa trên mức sử dụng hiện tại và điều kiện nhiệt. Điều này giúp cân bằng hiệu suất với mức tiêu thụ điện năng, đảm bảo hoạt động đáng tin cậy trong môi trường từ xa hoặc hạn chế. Hỗ trợ Runtime D3 (RTD3) cho phép thiết bị chuyển sang trạng thái không sử dụng nguồn điện, giúp tiết kiệm năng lượng hơn nữa khi không sử dụng thiết bị.
Trạng thái năng lượng của NVMe đặc biệt có lợi khi hiệu quả sử dụng năng lượng và quản lý nhiệt được đặt lên hàng đầu. Ví dụ: trong các thiết bị biên, khả năng chuyển nhanh sang trạng thái năng lượng thấp hơn khi không hoạt động có thể giảm đáng kể mức tiêu thụ năng lượng, điều này rất quan trọng đối với các thiết bị hoạt động trong môi trường từ xa hoặc khắc nghiệt với nguồn điện hạn chế. Điều này đạt được thông qua các tính năng như Quản lý năng lượng trạng thái hoạt động PCIe (ASPM) và các trạng thái năng lượng thấp như L1.1 và L1.2, giúp giảm mức tiêu thụ điện năng xuống mức tối thiểu. Quản lý năng lượng và sản lượng nhiệt trên ISS là rất quan trọng do môi trường hạn chế và được kiểm soát. Trạng thái năng lượng NVMe có thể giúp tiết kiệm mức tiêu thụ điện năng của SSD để quản lý công suất thiết kế nhiệt (TDP) và tối ưu hóa ngân sách năng lượng tổng thể, đảm bảo SSD hoạt động hiệu quả mà không quá nóng.
Trong những môi trường chuyên biệt này, trạng thái nguồn NVMe cung cấp một cách linh hoạt và hiệu quả để quản lý mức tiêu thụ điện năng của thiết bị NVMe. Bằng cách tận dụng các trạng thái này, các thiết bị có thể cân bằng hiệu suất và hiệu quả sử dụng năng lượng, khiến chúng phù hợp với nhiều ứng dụng khác nhau, từ điện toán ranh giới cho đến các sứ mệnh không gian. Khả năng điều chỉnh linh hoạt trạng thái năng lượng dựa trên điều kiện thời gian thực đảm bảo rằng các thiết bị NVMe có thể đáp ứng các nhu cầu khác nhau của các môi trường khác nhau đồng thời tối ưu hóa hiệu suất năng lượng và quản lý nhiệt.
Ngoài các trạng thái nguồn NVMe, khái niệm Nhiệt độ tổng hợp và Nhiệt độ cảm ứng đóng một vai trò quan trọng trong việc quản lý hiệu suất nhiệt của SSD NVMe trong SSD doanh nghiệp mới. Nhiệt độ cảm ứng biểu thị nhiệt độ vỏ bên ngoài của SSD. Solidigm là công ty đi đầu trong việc áp dụng các tiêu chuẩn Nhiệt độ cảm ứng mới cao hơn. Ví dụ: Nhiệt độ cảm ứng được cài đặt tại nhà máy cho Solidigm D5-P5336 là 80°C. Giới hạn nhiệt độ cảm ứng cao hơn này cho phép SSD được làm mát với luồng khí thấp hơn hoặc hoạt động ở nhiệt độ môi trường cao hơn. Tính linh hoạt này cho phép các trung tâm dữ liệu tối ưu hóa chiến lược làm mát và cải thiện khả năng quản lý nhiệt tổng thể, có khả năng giảm chi phí làm mát và nâng cao độ tin cậy cũng như tuổi thọ của SSD.
Quản lý trạng thái năng lượng hoạt động của NVMe
Trong môi trường thử nghiệm Linux chạy Ubuntu 22.04, chúng ta có thể sử dụng bộ công cụ NVMe để thăm dò ổ đĩa nhằm xem và thay đổi trạng thái nguồn của D5-P5336. Như bạn có thể thấy bên dưới, ổ đĩa hỗ trợ các trạng thái 0,1 và 2, với giai đoạn 0 là mức hạn chế ít nhất và giai đoạn 2 là mức hạn chế cao nhất.
Đối với Solidigm 61,44 TB D5-P5336, PS0 là 25W, PS1 là 15W và PS2 là 10W. Ổ đĩa không hoạt động ở mức khoảng 5,5W, do đó, với mỗi lần tăng chế độ nguồn, SSD sẽ ngày càng có ít năng lượng tiêu hao hơn để dành cho các hoạt động đọc và ghi NAND. Hoạt động ghi chịu ảnh hưởng lớn nhất vì nó sử dụng nhiều năng lượng hơn để ghi vào NAND so với đọc từ nó.
Lệnh kiểm tra trạng thái nguồn hiện tại trên SSD Solidigm D5-P5336 của chúng tôi được hiển thị bên dưới. Giá trị hiện tại là 00000000 cho biết ổ đĩa đang ở PS0, đây là chế độ 25W cao nhất.
Một lệnh tương tự được đưa ra để thay đổi trạng thái nguồn, với số cuối cùng biểu thị chế độ nguồn mà bạn muốn SSD ở đó. Ví dụ: lệnh sau sẽ đặt chế độ nguồn ở PS0 trên SSD Soldigim D5-P5336. Nếu bạn sử dụng chế độ nguồn 1 hoặc 2, hãy thay đổi số—-value= để tương ứng với chế độ nguồn chính xác.
Tác động của các trạng thái quyền lực đến hiệu suất
Để đo lường tác động của nguồn điện và tác động đến hiệu suất của các trạng thái nguồn trên ổ SSD Solidigm D5-P5336 61,44TB, chúng tôi đã trang bị cho Dell PowerEdge R760 24 ổ SSD. Chạy Ubuntu và trình tạo khối lượng công việc FIO, chúng tôi có thể dễ dàng chạy khối lượng công việc nhất quán trên tất cả các ổ SSD và cập nhật chế độ nguồn một cách nhanh chóng.
Chúng tôi đã sử dụng tính năng giám sát nguồn điện tích hợp của Dell bên trong hệ thống quản lý tích hợp iDRAC9 của máy chủ để giám sát nguồn điện ở cấp hệ thống.
Chúng tôi tập trung vào khối lượng công việc băng thông đọc và ghi tuần tự, sử dụng kích thước khối 128K trên mỗi ổ đĩa, sau đó đo hiệu suất tổng hợp trên tất cả 24 ổ SSD. Cần lưu ý rằng cấu hình Dell PowerEdge R760 cụ thể này với 24 khay NVMe sử dụng bộ chuyển đổi PCIe so với các khay NVMe được gắn trực tiếp. Vì vậy, tổng băng thông đo được sẽ làm bão hòa các làn chuyển đổi PCIe có sẵn trước khi chạm vào các ổ đĩa. Điều này ảnh hưởng đến tổng hiệu suất đọc mà chúng tôi đo được so với bảng thông số Soldigim P5536, nhưng tốc độ ghi tổng hợp đều nằm dưới giới hạn đó.
Tổng số Watt | Tốc độ ghi | Đọc GB/s | Watt Trên cơ sở |
Watt/Ổ đĩa (với chi phí hệ thống) |
|
---|---|---|---|---|---|
Nhàn rỗi Không có ổ đĩa | 462 | – | – | – | – |
Ổ đĩa nhàn rỗi đã được cài đặt | 594 | – | – | 132 | 5,5 |
Đọc tuần tự 24x PS0 | 858 | – | 109GB/giây | 396 | 16,5 |
Đọc tuần tự 24x PS1 | 858 | – | 105GB/giây | 396 | 16,5 |
Đọc tuần tự 24x PS2 | 759 | – | 79,8GB/giây | 297 | 12.375 |
Viết tuần tự 24x PS0 | 1089 | 82,5GB/giây | – | 627 | 26.125 |
Viết tuần tự 24x PS1 | 825 | 34,4GB/giây | – | 363 | 15.125 |
Viết tuần tự 24x PS2 | 726 | 17,3GB/giây | – | 264 | 11 |
Nhìn lại bài viết của chúng tôi về lợi ích của việc chuyển đổi nền tảng làm mát bằng không khí sang làm mát bằng chất lỏng trực tiếp, chúng tôi thấy hiệu suất của CPU tăng lên một chút nhưng chúng tôi cũng tiết kiệm được 200W điện năng. Sức mạnh là một mặt hàng quý giá trong làn sóng máy chủ tập trung vào AI mới thường xuyên dành mọi tài nguyên sẵn có cho GPU và CPU cao cấp. Trong một trung tâm dữ liệu ở mức hoặc gần giới hạn nguồn điện dành cho làm mát không khí, việc chuyển sang DLC sẽ mua một lượng điện năng cho phép máy chủ lắp nhiều ổ SSD hơn với cùng mức tiêu thụ điện năng như máy chủ làm mát bằng không khí.
Tiết kiệm điện năng 200W có thể giúp ích rất nhiều về mật độ lưu trữ; khoản tiết kiệm đó cho phép bạn tăng gấp đôi dung lượng lưu trữ từ 12 lên 24 ổ SSD trong máy chủ làm mát bằng chất lỏng so với máy chủ làm mát bằng không khí nếu bạn có khối lượng công việc hướng đến khối lượng công việc đọc nhiều. Với Solidigm D5-P5336, máy chủ 24 vịnh này đã tăng dung lượng lưu trữ từ 737TB lên 1.474 TB nhờ vòng lặp lỏng. Nếu khối lượng công việc ghi nhiều, bạn có thể trang bị cho máy chủ thêm khoảng tám ổ SSD. Tuy nhiên, những số liệu này là với các chế độ nguồn cơ bản, vì vậy nếu bạn sẵn sàng giảm bớt một số hiệu suất ghi ở mức cao nhất, bạn có thể dễ dàng trang bị cho máy chủ của mình 24 ổ SSD với khối lượng công việc ghi nhiều với hiệu suất giảm.
Phần kết luận
Thông qua thử nghiệm SSD Solidigm D5-P5336, chúng tôi đã thấy cách quản lý trạng thái năng lượng NVMe có thể tác động đáng kể đến hiệu quả sử dụng năng lượng mà không ảnh hưởng đáng kể đến hiệu suất. Các nhà khai thác trung tâm dữ liệu đang tìm cách tối đa hóa hiệu quả sử dụng năng lượng có thể tận dụng các trạng thái năng lượng này để đạt được mật độ lưu trữ lớn hơn hoặc giảm chi phí vận hành, đặc biệt là trong môi trường tập trung vào AI, nơi năng lượng ở mức cao. SSD mật độ cao của Solidigm có vị trí tốt cho việc này, mang lại hiệu suất tuyệt vời từ terabyte đến watt, đặc biệt là với các công nghệ làm mát bằng chất lỏng hiện đại.
Phát hiện của chúng tôi cho thấy rằng ngay cả những điều chỉnh nhỏ đối với trạng thái năng lượng cũng có thể mang lại mức tiết kiệm năng lượng đáng kể, điều này có thể rất quan trọng trong những môi trường bị giới hạn bởi nguồn điện sẵn có. Tối ưu hóa mức tiêu thụ điện năng tổng thể của máy chủ giúp tăng cường mật độ lưu trữ và hỗ trợ hoạt động của trung tâm dữ liệu bền vững hơn.
Quản lý năng lượng ngày càng trở nên quan trọng khi các máy chủ hiện đại bị đẩy đến giới hạn của chúng, đặc biệt là trong khối lượng công việc do AI điều khiển. Việc kết hợp các tùy chọn làm mát bằng chất lỏng và quản lý SSD hiệu quả mang đến hướng đi mới cho các trung tâm dữ liệu đang tìm cách nâng cao hiệu suất và mật độ lưu trữ mà không vượt quá ngân sách điện năng.
Bạn có thể xem bản demo đầy đủ của các công nghệ này trực tiếp tại OCP 2024. Chúng tôi sẽ giới thiệu cách làm mát bằng chất lỏng và SSD của Solidigm có thể trở thành nền tảng cho hiệu quả sử dụng năng lượng trong trung tâm dữ liệu hiện đại.
Báo cáo này được tài trợ bởi Solidigm. Tất cả các quan điểm và ý kiến thể hiện trong báo cáo này đều dựa trên quan điểm khách quan của chúng tôi về (các) sản phẩm đang được xem xét.
Tương tác với StorageReview
Bản tin | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | Nguồn cấp dữ liệu RSS