Медиа-центр

Новости

Наука

Математик РУДН предложил новый способ использования нейронных сетей для работы с данными больших размерностей

Математик РУДН предложил новый способ использования нейронных сетей для работы с данными больших размерностей

2 октября 2020

Математик РУДН предложил новый подход к изучению распределения вероятностей наблюдаемых данных с помощью искусственных нейронных сетей. Новый подход лучше взаимодействует с так называемыми выбросами — с теми объектами входных данных, которые значительно выделяются из общей выборки.

Восстановление распределения вероятностей наблюдаемых данных искусственными нейронными сетями — это наиболее важная часть машинного обучения. Распределение вероятностей не только позволяет прогнозировать поведение исследуемой системы, но и количественно оценить неопределенность, с которой делаются прогнозы. Главная трудность заключается в том, что, как правило, распределения данных в точном виде не доступны. Для решения этой проблемы используют байесовские и близкие к ним приближенные методы. Но их использование увеличивает сложность нейронной сети. Снизить неопределенность позволяет комбинация байесовских методов с другими (например, с дельта-методом).

Математики РУДН предложили использовать детерминированные веса для нейронных сетей, что позволяет преодолеть ограничения байесовских методов. Они получили формулу, которая позволяет корректно оценить дисперсию распределения наблюдаемых данных. Предложенную модель проверили на разных данных: синтетических и реальных; на данных, содержащих выбросы и на тех, из которых они были предварительно удалены. Новый метод позволяет восстанавливать распределения вероятностей с недоступной прежде точностью.

Математик РУДН Павел Гуревич вместе с коллегами использовали детерминированные веса для нейронных сетей, чего никогда не делалось в пределах байесовских нейронных сетей. Математики РУДН предположили, что истинное распределение является нормальным с неизвестным средним и дисперсией. Фактически они создали обновленную версию метода сопряженных градиентов (gradient conjugate prior), подходящую для нейронных сетей. В результате расчётов Павел Гуревич получил формулу, которая позволяет корректно оценить дисперсию распределения данных. Новый метод оценили по методу AUC (area under the curve — это площадь под графиком, который позволяет оценить качество классификации; чем выше оценка AUC, тем качественнее классификация). В результате получилось лучшее значение оценки AUC как для «чистых» наборов данных, так и для данных, содержащих выбросы.

Метод, который предложили математики РУДН, применим, например, к задаче выявления мошенничества (fraud detection): для объекта определяется, к какому из двух классов он принадлежит (мошенничество или не мошенничество). Такие методы относятся к классу «обучение с учителем» (supervised learning). Предложенный метод поможет эффективно определять, какие транзакции, скорее всего, будут мошенническими, при этом значительно уменьшая количество так называемых «ложных срабатываний» (false positives). Метод, предложенный математиками РУДН, чрезвычайно эффективен в обнаружении и предотвращении мошенничества, поскольку он позволяет автоматически обнаруживать «подозрительные» шаблоны в больших объемах данных.

Статья в журнале Artificial Intelligence.

Предыдущая новость

25 сентября 2020

Проекты молодых ученых Математического института им. С.М. Никольского РУДН выиграли конкурс стажировок Немецко-Российского Междисциплинарного научного центра

Следующая новость

14 июля

После инфаркта 44% пациентов бросают терапию, рискуя повторным приступом – исследование ученых РУДН

Наука

14 июля

После инфаркта 44% пациентов бросают терапию, рискуя повторным приступом – исследование ученых РУДН

Исследователи медицинского института РУДН и Городской поликлиники № 2 Москвы проанализировали, как пациенты после острого инфаркта миокарда соблюдают рекомендации по приёму двойной антитромбоцитарной терапии (ДАТТ) — комбинации ацетилсалициловой кислоты (АСК) и ингибитора P2Y12 (тикагрелор, клопидогрел или прасугрел). Работа отмечена I местом в Конкурсе научных работ молодых ученых в области лекарственной безопасности «ЛекБез 2025» на III Российском конгрессе «Безопасность фармакотерапии 360°: Noli nocere!»

Наука

30 июня

Учёные РУДН создали новые вещества для борьбы с устойчивыми бактериями

Исследователи РУДН вместе с бельгийскими коллегами разработали новые химические соединения, которые могут блокировать образование бактериальных биоплёнок — плотных скоплений микробов, устойчивых к антибиотикам.

Наука

27 июня

При участии ученых РУДН разработаны биосовместимые нанотермометры без использования редкоземельных элементов

Сегодня в составе большинства аналогичных высокочувствительных термометров используют редкоземельные элементы — например, евробий или тербий — из-за их люминесцентных свойств. Исследователи РУДН совместно с учеными Университета ИТМО и Национального научного центра морской биологии им. А.В. Жирмунского предложили альтернативные инновационные нанотермометры на основе металлоорганических каркасов (MOF), в составе которых отсутствуют редкоземельные элементы.