Математики РУДН с помощью марковских цепей помогли улучшить эффективность работы дата-центров
Математики из РУДН создали модель максимально эффективной работы дата-центров. В ее основу положена нетривиальная марковская цепь. Помимо очевидных практических применений результатов для организации работы серверов и дата-центров, теоретический аппарат будет полезен в теории массового обслуживания, а также для работы с большими данными и нейросетями. Исследование опубликовано в журнале Mathematics.
Дата-центр представляет собой систему серверов, задача которых – оперативно предоставлять вычислительные ресурсы и место на диске по запросу пользователей. Чем выше нагрузка, тем сильнее греется оборудование. В случае перегрева серверы могут временно прекращать работу. Уровень температуры, который соответствует точке перегрева, называют первым критическим уровнем. Второй – это уровень, до которого должна упасть температура сервера, чтобы он возобновил (хотя бы частично) работу.
Эти уровни отличаются. Например, если каждый пользователь нагружает сервер так, что температура его процессора вырастает на 0,1 градуса, а первый критический уровень составляет 100 градусов, то второй критический уровень нужно выставлять не выше 99,9 градуса. Если поставить выше, то первый же запрос пользователя снова перегреет сервер. При этом два критических уровня должны располагаться достаточно близко друг к другу – если их разница велика, то мощности сервера не будут использоваться полностью. Необходимо настроить эти уровни так, чтобы серверы дата-центра не выключались постоянно из-за перегрева, и при этом работали с полной загрузкой.
Математики из РУДН Ольга и Александр Дудины смогли найти решение задачи оптимизации, которое позволяет добиться, чтобы серверы работали на полную мощность и при этом не перегревались. Условия ее выглядит так: в зависимости от случайного процесса, имитирующего поток пользователей, расставить два критических уровня так, чтобы не допустить перегрева, но при этом вычислительные мощности использовались бы на максимум. При этом допускается частичная неработоспособность, то есть, если второй критический уровень по температуре превышен, часть запросов от пользователей отвергается.
Математики РУДН решили возникающие вероятностные уравнения для разных значений критических уровней. В качестве случайного процесса, моделирующего приход пользователей, математики РУДН использовали марковскую цепь. Простейший пример такой цепи: представим случайное блуждание точки по прямой. Каждую секунду подбрасывается монетка: если выпадает орел, то точка перемещается на 1 см вперед, если решка – на один сантиметр назад. В таком процессе время дискретно, то есть изменения происходят раз в секунду, а положение точки в будущем зависит только от ее текущего положения и результата подбрасывания монетки.
Чтобы проверить эффективность своего метода, математики РУДН провели численный эксперимент, в котором моделировалось поведение сервера. Его результаты оценивались с помощью показателя E, критерия качества, определяющего убытки за отказ пользователю в обслуживании и перегрев оборудования в единицу времени. Оказалось, что новый метод позволяет более чем в десять раз – с 0,31 до 0,03 – снизить потери моделируемого сервера, существенно повысив эффективность работы дата-центра.
Кроме того, марковская цепь, которая возникла в работе математиков, обладает рядом интересных свойств. Помимо применения в ИТ, их модель будет полезна в теории очередей. Эта теория необходима для решения задача массового обслуживания, работе с большими данными и с нейросетями.
Статья:
Optimization of Queueing Model with Server Heating and Cooling.
Mathematics, 2019, 7(9), 768.
https://doi.org/10.3390/math7090768
Научное направление: математика
Российский университет дружбы народов (RUDN University)
Представьте себе мир, где у каждого есть достаточно еды, чистая вода, доступ к образованию и достойная работа. Мир, где берегут природу и заботятся о будущем нашей планеты. Это и есть цели устойчивого развития — построить устойчивое будущее для всех! Для этого Организация Объединенных Наций (ООН) в 2015 году определила 17 Целей устойчивого развития (ЦУР). ЦУР — это глобальный план, который помогает странам и людям вместе двигаться к лучшему будущему. К нему присоединились 193 государства-члена ООН.
Исследователи факультета искусственного интеллекта РУДН провели масштабное исследование, которое раскрыло системные ошибки больших языковых моделей (LLM) при диагностике депрессии по тексту. Эта работа, выполненная совместно с коллегами из AIRI, ФИЦ ИУ РАН, ИСП РАН, МФТИ и MBZUAI, не только выявляет проблему, но и закладывает основу для создания более надёжных и безопасных инструментов для детектирования депрессии и тревожности.
В РУДН состоялась первая научно-практическая конференция «Функциональная морфология тканевого микроокружения: от теории к практике», посвящённая памяти академика РАН Михаила Пальцева. Она объединила ведущих исследователей из России, Китая и других стран, став важной площадкой для обсуждения трансляции фундаментальных открытий в персонализированную медицину.