Математики РУДН и Свободного университета Берлина предложили новый способ использования нейронных сетей для работы с зашумленными данными больших размерностей

Математики РУДН и Свободного университета Берлина предложили новый способ использования нейронных сетей для работы с зашумленными данными больших размерностей

Математики РУДН и Свободного университета г. Берлина предложили новый подход к изучению распределений вероятностей наблюдаемых данных с помощью искусственных нейронных сетей. Новый подход лучше взаимодействует с так называемыми выбросами — с теми объектами входных данных, которые значительно выделяются из общей выборки.

Восстановление распределения вероятностей наблюдаемых данных искусственными нейронными сетями — это наиболее важная часть машинного обучения. Распределение вероятностей не только позволяет прогнозировать поведение исследуемой системы, но и количественно оценить неопределенность, с которой делаются прогнозы. Главная трудность заключается в том, что, как правило, наблюдаются лишь сами данные, но их вероятностные распределения в точном виде не доступны. Для решения этой проблемы используют байесовские и близкие к ним приближенные методы. Но их использование увеличивает сложность нейронной сети и соответственно ее обучения.

Математики РУДН и Свободного университета г. Берлина использовали детерминированные веса для нейронных сетей, а выходами сетей закодировали распределения латентных переменных для искомого маргинального (частного) распределения. Анализ динамики обучения таких сетей позволил им получить формулу, которая корректно оценивает дисперсию распределения наблюдаемых данных, несмотря на наличие в данных выбросов. Предложенную модель проверили на разных данных: синтетических и реальных. Новый метод позволяет восстанавливать распределения вероятностей с более высокой точностью по сравнению с другими современными методами. Точность оценивалась по методу AUC (area under the curve — это площадь под графиком, который позволяет оценить среднеквадратичную ошибку предсказаний в зависимости от размера выборки, оцененной сетью как «надежная»; чем выше оценка AUC, тем качественнее предсказания).

Статья опубликована в журнале Artificial Intelligence.

Новости
Все новости
Наука
30 июля
Химик РУДН нашел способ сделать производство биотполива в 4-10 раз эффективнее с помощью кремниевой матрицы и гетерополикислот

Химик РУДН создал кремниевый молекулярный каркас для получения эфиров из отходов сельского хозяйства, древесной и бумажной промышленности. Он в 4-10 раз повышает эффективность получения эфиров, которые можно использовать как биотопливо. Это позволит снизить энергозатраты и сделает производство биотоплива дешевле. 

Наука
28 июля
Химики РУДН разработали новый путь синтеза веществ для фармацевтики

Химики РУДН предложили универсальный способ синтеза производных тиеноиндолизинов. Свойства этих веществ позволяют использовать их для создания антибактериальных и противораковых препаратов, а также в производстве новых материалов для оптоэлектроники.

Наука
26 июля
Химики РУДН разработали домино-реакцию для получения противоопухолевых препаратов

Химики РУДН предложили новую реакцию для получения сложных органических веществ в одном сосуде. Продукты синтеза оказались эффективными против клеток раковых опухолей, в том числе — устойчивых к известным препаратам.