Недавние достижения в новой области научного машинного обучения (также известного как машинное обучение для физических наук или наука, управляемая данными) расширили сферу применения традиционных методов машинного обучения (МО) до временной эволюции физических систем. В этой области был достигнут быстрый прогресс в использовании нейронных сетей для прогнозирования с использованием доступных наблюдений за непрерывными полями или со сложными ограничениями и физически мотивированными законами сохранения. Эти нейронные сети предлагают способ решения устройств PDE, которые дополняют традиционные цифровые решения. Например, методы машинного обучения на основе данных полезны, когда наблюдения зашумлены или необходимо полностью знать или определить лежащую в основе физическую модель.
Более того, нейронные модели имеют то преимущество, что их входные данные постоянно различимы, что полезно в различных приложениях. Например, при проектировании физических систем модели являются физическими объектами и поэтому не могут быть различимы с аналитической точки зрения. Точно так же стандартные физические модели существуют во многих областях, таких как гидрология, но прямые модели являются недифференцируемыми черными ящиками. Это усложняет решение задач оптимизации, управления, анализа чувствительности и обратного вывода. В то время как сложные методы, такие как байесовская оптимизация или моделирование низкого порядка, пытаются компенсировать это отсутствие дифференциации, градиенты для нейронных сетей легко доступны и эффективны.
Существует много критериев, общих для классических приложений ML, таких как классификация изображений, прогнозирование временных рядов и анализ текста, и оценки с использованием этих критериев предоставляют стандартные средства для проверки эффективности и действенности моделей ML. В настоящее время существует потребность в широкодоступных, практически простых и статистически сложных стандартах с готовыми к использованию наборами данных для сравнения методов в науке о машинном обучении. Несмотря на то, что в последние годы был достигнут некоторый прогресс в отношении эталонных стандартов, они надеются предоставить более полный стандарт с точки зрения охватываемых PDE и разрешить более разнообразные способы оценки эффективности и точности метода ML.
Проблемы включают в себя различные основные уравнения и различные предположения и условия; Наглядный тизер смотрите на рисунке ниже. Данные можно генерировать, запуская код через стандартный интерфейс или загружая наборы данных моделирования с высоким разрешением. Весь код распространяется под лицензией с открытым исходным кодом, что позволяет легко использовать его повторно и расширять. Кроме того, они предлагают API для облегчения внедрения и оценки новых подходов, существующих конкурентоспособных базовых методов, таких как FNO и авторегрессионные модели на основе U-Net, а также набор предварительно вычисленных показателей производительности для этих алгоритмов. В результате они могут сравнивать свои прогнозы с «основной истиной», предоставляемой базовыми симуляторами, используемыми для генерации данных.
Справочные стандарты в области машинного обучения, как и в других областях приложений машинного обучения, могут предоставлять легкодоступные обучающие данные для разработки и тестирования алгоритмов без необходимости создавать данные с нуля. Данные обучения/тестирования в этих задачах моделирования теоретически не ограничены, потому что моделирование может привести к большему количеству данных. На практике создание таких наборов данных может быть очень трудоемким с точки зрения вычислительного времени, хранения и доступа к необходимым специальным навыкам. PDEBENCH также удовлетворяет потребность в быстрых и готовых данных для обучения, избегая этих препятствий и предоставляя легкий путь для будущего расширения.
В этой статье они предлагают универсальный справочный набор для Scientific ML, который:
- Он предоставляет разнообразные наборы данных с различными характеристиками, основанными на 11 хорошо известных зависящих от времени и независимых от времени PDE.
- Он охватывает как «классические», так и обратные задачи обучения.
- Доступ к нему можно получить через унифицированный интерфейс для чтения/сохранения данных во многих приложениях.
- Он расширяемый.
- Содержит результаты для самых последних моделей ML (FNO, элементный и (например, вязкость).
Каждый набор данных содержит достаточно выборок для обучения и тестирования для широкого диапазона значений параметров с достаточно высокой точностью, чтобы фиксировать локальную динамику. Более того, их цель состоит не в том, чтобы предоставить полный стандарт, включающий только некоторые возможные комбинации задач логического вывода во всех известных экспериментах, а в том, чтобы облегчить будущим исследователям оценку предпочитаемых ими методов. Их цель здесь — предложить другим исследователям использовать их готовые к запуску модели, чтобы самим заполнить пробелы. Для оценки методов МО для научных задач они рассматривают множество шкал, выходящих за рамки стандартной MSE и включающих физические свойства.
Предварительные экспериментальные результаты, полученные с помощью PDEBENCH, подчеркивают важность всеобъемлющих научных критериев машинного обучения: универсальной модели не существует, и существуют значительные возможности для новых разработок машинного обучения. Результаты показывают, что MSE в тестовых данных, мера стандартной ошибки в ML, может быть лучшим показателем для оценки моделей ML, особенно в турбулентных, негладких системах, где он не может фиксировать небольшие пространственные изменения. Они также обсуждают приложение, в котором базовый параметр PDE сильно влияет на сложность базовой задачи машинного обучения. Набор данных, код и предварительно протестированные модели находятся в свободном доступе в Интернете.
This Article is written as a research summary article by Marktechpost Staff based on the research paper 'PDEBENCH: An Extensive Benchmark for Scientific Machine Learning'. All Credit For This Research Goes To Researchers on This Project. Check out the paper and code.
Please Don't Forget To Join Our ML Subreddit
Аниш Тико — стажер-консультант в MarktechPost. В настоящее время он получает степень бакалавра в области науки о данных и искусственного интеллекта в Индийском технологическом институте (IIT) в Бхилаи. Он проводит большую часть своего времени, работая над проектами, направленными на использование возможностей машинного обучения. Его исследовательский интерес — обработка изображений, и он увлечен поиском решений для этой области. Любит общаться с людьми и участвовать в интересных проектах.
«Zombie amateur evangelist. Incurable creator. Proud twitter innovator. Food lover. Internetaholic. Rigid introvert.»
More Stories
Spotify обвиняет Apple в нежелательном изменении технологии регулировки громкости
Первый пациент Neuralink дал имя своему мозговому чипу и выучил новые языки
Meta рассматривает возможность выпуска новых очков смешанной реальности в качестве альтернативы гарнитурам