Математики РУДН и Свободного университета Берлина предложили новый способ использования нейронных сетей для работы с зашумленными данными больших размерностей
Математики РУДН и Свободного университета Берлина предложили новый способ использования нейронных сетей для работы с зашумленными данными больших размерностей
Математики РУДН и Свободного университета г. Берлина предложили новый подход к изучению распределений вероятностей наблюдаемых данных с помощью искусственных нейронных сетей. Новый подход лучше взаимодействует с так называемыми выбросами — с теми объектами входных данных, которые значительно выделяются из общей выборки.

Восстановление распределения вероятностей наблюдаемых данных искусственными нейронными сетями — это наиболее важная часть машинного обучения. Распределение вероятностей не только позволяет прогнозировать поведение исследуемой системы, но и количественно оценить неопределенность, с которой делаются прогнозы. Главная трудность заключается в том, что, как правило, наблюдаются лишь сами данные, но их вероятностные распределения в точном виде не доступны. Для решения этой проблемы используют байесовские и близкие к ним приближенные методы. Но их использование увеличивает сложность нейронной сети и соответственно ее обучения.

Математики РУДН и Свободного университета г. Берлина использовали детерминированные веса для нейронных сетей, а выходами сетей закодировали распределения латентных переменных для искомого маргинального (частного) распределения. Анализ динамики обучения таких сетей позволил им получить формулу, которая корректно оценивает дисперсию распределения наблюдаемых данных, несмотря на наличие в данных выбросов. Предложенную модель проверили на разных данных: синтетических и реальных. Новый метод позволяет восстанавливать распределения вероятностей с более высокой точностью по сравнению с другими современными методами. Точность оценивалась по методу AUC (area under the curve — это площадь под графиком, который позволяет оценить среднеквадратичную ошибку предсказаний в зависимости от размера выборки, оцененной сетью как «надежная»; чем выше оценка AUC, тем качественнее предсказания).

Статья опубликована в журнале Artificial Intelligence.

Новости
Все новости
Наука
25 сентября
Проекты молодых ученых Математического института им. С.М. Никольского РУДН выиграли конкурс стажировок Немецко-Российского Междисциплинарного научного центра

Заявки на стажировку молодых ученых РУДН были одобрены Немецко-Российским Междисциплинарным научным центром (G-RISC): Юлия Беляева и Виктория Лийко пройдут стажировку в Гейдельбергском университете им. Рупрехта и Карла, Амина Адхамова в Гисенском университете им. Юстуса Либиха.

Наука
23 сентября
Химик РУДН создал катализатор для синтеза вещества, способного уничтожать личинки комаров-переносчиков желтой лихорадки

Химик РУДН разработал катализатор для получения ацетата эвгенола — вещества, которое уничтожает личинки комаров-переносчиков опасных заболеваний, но безопасно для здоровья человека.

Наука
18 сентября
Почвоведы РУДН разработали новый метод оценки качества почвы

Почвоведы РУДН выявили прямую корреляцию между скоростью образования почвой углекислого газа, именуемой эмиссией СО2, и содержанием в ней биомассы микроорганизмов. Известно, что эмиссия СО2 из почвы обусловлена в основном дыханием почвенных микроорганизмов и корней растений. Чем больше почва выделяет СО2, тем, как правило, большую биомассу микроорганизмов она содержит. Показано, что эмиссия СО2 черноземом разных экосистем (или разных типов землепользования) коррелирует с содержанием микробной биомассы, а наиболее тесно — со скоростью его микробного дыхания. А почва с хорошими микробными свойствами обладает «лучшим качеством», более плодородна, обеспечивает наибольшую урожайность сельскохозяйственных культур и другой растительной биомассы.