Астрономия, управляемая данными
![]() | Эта статья была выдвинута на удаление . Обсуждение было закрыто 24 мая 2024 года консенсусом об объединении содержания в статью «Астроинформатика» . Если вы обнаружите, что такие действия не были предприняты незамедлительно, рассмотрите возможность оказания помощи в слиянии вместо того, чтобы повторно выдвигать статью на удаление. Чтобы обсудить слияние, воспользуйтесь страницей обсуждения целевой статьи . ( май 2024 г. ) |
![]() | Было предложено объединить эту статью с журналом «Астроинформатика» . ( Обсудить ) Предлагается с мая 2024 г. |
![]() | В этой статье есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения )
|
Астрономия, управляемая данными (DDA), относится к использованию науки о данных в астрономии . некоторые результаты телескопических наблюдений и обзоров неба Принимаются во внимание , а подходы, связанные с интеллектуальным анализом данных и управлением большими данными, используются для анализа, фильтрации и нормализации набора данных , которые в дальнейшем используются для создания классификаций, прогнозов и обнаружения аномалий с помощью передовых статистических методов. подходы , цифровая обработка изображений и машинное обучение . Результаты этих процессов используются астрономами и учеными-космонавтами для изучения и выявления закономерностей, аномалий и движений в космическом пространстве, а также для заключения теорий и открытий в космосе .
История [ править ]
В 2007 году проект Galaxy Zoo [1] был запущен для морфологической классификации [2] [3] большого количества галактик . В этом проекте для классификации рассматривались 900 000 изображений, взятых из Слоановского цифрового обзора неба (SDSS). [4] за последние 7 лет. Задача заключалась в том, чтобы изучить каждую картину галактики, классифицировать ее как эллиптическую или спиральную и определить, вращается она или нет. команда астрофизиков под руководством Кевина Шавински из Оксфордского университета За этот проект отвечала , и Кевин и его коллега Крис Линлотт подсчитали, что такой команде потребуется 3–5 лет, чтобы завершить работу. [5] Там им пришла в голову идея использовать методы машинного обучения и науки о данных для анализа изображений и их классификации. [6]
Методология [ править ]
Данные, полученные из обзоров неба, сначала передаются на предварительную обработку . При этом избыточность удаляется и фильтруется. Далее извлечение признаков , которые в дальнейшем принимаются за процессы. из этого отфильтрованного набора данных выполняется [7] Некоторые из известных обзоров неба перечислены ниже:
- Паломарский цифровой обзор неба (DPOSS) [8]
- Двухмикронный обзор всего неба (2MASS) [9]
- Телескоп Грин-Бэнк (GBT) [10]
- Исследователь эволюции галактики (GALEX) [11]
- Слоановский цифровой обзор неба (SDSS) [4]
- SkyMapper Обзор южного неба (SMSS) [12]
- Панорамный обзорный телескоп и система быстрого реагирования (PanSTARRS) [13]
- Большой синоптический обзорный телескоп (LSST) [14]
- Массив квадратных километров (SKA) [15]
Размер данных вышеупомянутых обзоров неба колеблется от 3 ТБ до почти 4,6 ЭБ . [7] Кроме того, задачи интеллектуального анализа данных , которые участвуют в управлении данными и манипулировании ими, включают такие методы, как классификация , регрессия , кластеризация , обнаружение аномалий и анализ временных рядов . Для реализации задачи задействовано несколько подходов и приложений для каждого из этих методов.
Классификация [ править ]
Классификация [16] используется для конкретной идентификации и классификации астрономических данных, таких как спектральная классификация , фотометрическая классификация, морфологическая классификация и классификация солнечной активности . Подходы к методам классификации перечислены ниже:
- Искусственная нейронная сеть (ИНС)
- Машина опорных векторов (SVM)
- Обучение векторному квантованию (LVQ)
- Дерево решений
- Случайный лес
- k - ближайшие соседи
- Наивные байесовские сети
- Сеть радиальных базисных функций
- Гауссов процесс
- Таблица решений
- Альтернативное дерево решений (ADTree)
Регрессия [ править ]
Регрессия [17] используется для прогнозирования на основе полученных данных посредством статистических тенденций и статистического моделирования. Различные варианты использования этого метода используются для определения фотометрических красных смещений и измерений физических параметров звезд. [18] Подходы перечислены ниже:
- Искусственная нейронная сеть (ИНС)
- Регрессия опорного вектора (SVR)
- Дерево решений
- Случайный лес
- k - регрессия ближайших соседей
- Регрессия ядра
- Регрессия главных компонентов (ПЦР)
- Гауссов процесс
- Регрессия наименьших квадратов (LSR)
- Частичная регрессия наименьших квадратов
Кластеризация [ править ]
Кластеризация [19] классифицирует объекты на основе метрики меры сходства . Он используется в астрономии для классификации, а также для обнаружения особых/редких объектов . Подходы перечислены ниже:
- Анализ главных компонентов (PCA)
- DBSCAN
- k - означает кластеризацию
- ОПТИКА
- Модель паутины
- Самоорганизующаяся карта (СОМ)
- Максимизация ожиданий
- Иерархическая кластеризация
- АвтоКласс [20]
- Моделирование гауссовой смеси (GMM)
Обнаружение аномалий [ править ]
Обнаружение аномалий [21] используется для обнаружения нарушений в наборе данных. Однако здесь этот метод используется для обнаружения редких/особых объектов . Используются следующие подходы:
- Анализ главных компонентов (PCA)
- k - означает кластеризацию
- Максимизация ожиданий
- Иерархическая кластеризация
- Одноклассная СВМ
временных Анализ рядов
Анализ временных рядов [22] помогает анализировать тенденции и прогнозировать результаты с течением времени. Он используется для прогнозирования тенденций и обнаружения новых данных (обнаружения неизвестных данных). Здесь используются следующие подходы:
Ссылки [ править ]
- ^ «Зоониверс» . www.zooniverse.org . Проверено 10 мая 2024 г.
- ^ Кавана, Митчелл К.; Бекки, Кенджи; Гровс, Брент А. (08 июля 2021 г.). «Морфологическая классификация галактик с глубоким обучением: сравнение трехсторонних и четырехсторонних CNN». Ежемесячные уведомления Королевского астрономического общества . 506 (1): 659–676. arXiv : 2106.01571 . дои : 10.1093/mnras/stab1552 . ISSN 0035-8711 .
- ^ Гоял, Лалит Мохан; Арора, Маанак; Пандей, Тушар; Миттал, Мамта (01 декабря 2020 г.). «Морфологическая классификация галактик с помощью Conv-сетей» . Информатика наук о Земле . 13 (4): 1427–1436. дои : 10.1007/s12145-020-00526-w . ISSN 1865-0481 .
- ^ Jump up to: Перейти обратно: а б «Sloan Digital Sky Survey-V: новаторская паноптическая спектроскопия - SDSS-V» . Проверено 10 мая 2024 г.
- ^ Пати, Сатависа (18 июня 2021 г.). «Как наука о данных используется в астрономии?» . Аналитический взгляд . Проверено 10 мая 2024 г.
- ^ Барон, Даля (15 апреля 2019 г.), Машинное обучение в астрономии: практический обзор , arXiv : 1904.07248
- ^ Jump up to: Перейти обратно: а б Чжан, Янься; Чжао, Юнхэн (22 мая 2015 г.). «Астрономия в эпоху больших данных» . Журнал науки о данных . 14 : 11. Бибкод : 2015DatSJ..14...11Z . дои : 10.5334/dsj-2015-011 . ISSN 1683-1470 .
- ^ «Цифровой обзор неба Паломара (DPOSS)» . сайты.astro.caltech.edu . Проверено 10 мая 2024 г.
- ^ «IRSA — Обзор всего неба в два микрона (2MASS)» . irsa.ipac.caltech.edu . Проверено 10 мая 2024 г.
- ^ «ГБТ» . Обсерватория Грин Бэнк . 26 июня 2023 г. Проверено 10 мая 2024 г.
- ^ «ГАЛЕКС – исследователь эволюции галактики» . www.galex.caltech.edu . Проверено 10 мая 2024 г.
- ^ «Обзор южного неба SkyMapper» . skymapper.anu.edu.au . Проверено 10 мая 2024 г.
- ^ «Домашняя страница архива данных Pan-STARRS1 — Публичный архив PS1 — STScI Outerspace» . .outerspace.stsci.edu . Проверено 10 мая 2024 г.
- ^ Телескоп, Большой синоптический обзор. «Обсерватория Рубин» . Обсерватория Рубин . Проверено 10 мая 2024 г.
- ^ «Исследуй | СКАО» . www.skao.int . Проверено 10 мая 2024 г.
- ^ Чоудхури, Шован; Шон, Марко П. (02 октября 2020 г.). «Классификация научных работ с использованием методов контролируемого машинного обучения» . 2020 Межгорная инженерия, технологии и вычисления (IETC) . IEEE. стр. 1–6. дои : 10.1109/IETC47856.2020.9249211 . ISBN 978-1-7281-4291-3 .
- ^ Сарстедт, Марко; Муи, Эрик (2014), Сарстедт, Марко; Муи, Эрик (ред.), «Регрессионный анализ» , Краткое руководство по исследованию рынка: процесс, данные и методы с использованием статистики IBM SPSS , Берлин, Гейдельберг: Springer, стр. 193–233, doi : 10.1007/978- 3-642-53965-7_7 , ISBN 978-3-642-53965-7 , получено 10 мая 2024 г.
- ^ «Бюллетень Королевского общества наук Льежа | PoPuPS» . Бюллетень Королевского общества наук Льежа (на французском языке). ISSN 0037-9565 .
- ^ Биндра, Камалприт; Мишра, Ануранджан (сентябрь 2017 г.). «Детальное изучение алгоритмов кластеризации» . 2017 6-я Международная конференция по надежности, инфоком-технологиям и оптимизации (Тенденции и будущие направления) (ICRITO) . IEEE. стр. 371–376. дои : 10.1109/ICRITO.2017.8342454 . ISBN 978-1-5090-3012-5 .
- ^ Пиццути, К.; Талия, Д. (май 2003 г.). «P-autoclass: масштабируемая параллельная кластеризация для анализа больших наборов данных» . Транзакции IEEE по знаниям и инженерии данных . 15 (3): 629–641. дои : 10.1109/TKDE.2003.1198395 . ISSN 1041-4347 .
- ^ Тудуму, Шрикант; Бранч, Филип; Джин, Цзюн; Сингх, Джагдатт (Джек) (2 июля 2020 г.). «Комплексный обзор методов обнаружения аномалий в больших объемах данных» . Журнал больших данных . 7 (1): 42. дои : 10.1186/s40537-020-00320-x . hdl : 10536/DRO/DU:30158643 . ISSN 2196-1115 .
- ^ Вайнер, Ирвинг Б., изд. (15 апреля 2003 г.). Справочник по психологии (1-е изд.). Уайли. дои : 10.1002/0471264385.wei0223 . ISBN 978-0-471-17669-5 .