Статья о прогнозировании

жүктеу/скачать 301,5 Kb.

бет	6/8
Дата	02.12.2023
өлшемі	301,5 Kb.
	#194749
түрі	Статья

1 2 3 4 5 6 7 8

Байланысты:
перевод
Задания суммативного оценивания за 2 четверть, CMTOVCTTACQZ02032023214854, шоттар 2020, «Sapiens Адамзаттың қысқаша тарихы», СМБӨЖ1

РФ СВР
ЛСТМ ГРУ

Модель	RMSE	МАЭ	МАПЭ	Р2	Поезд(ы)
Вывод (РС)
ЛСТМ	0,02224	0,0173	3,862%	0,735	173,765	1,862
ГРУ	0,02285	0,0176	3,939%	0,720	254,520	1.550
ГИБРИДНЫЙ	0,02295	0,0177	3,959%	0,717	461,967	2.383
КНН	0,02332	0,0179	4,003%	0,711	<0,01	0,074
ТКН	0,02334	0,0180	4,021%	0,711	40,475	1,219
АРИМА TFT	0,02343 0,02353	0,0180 0,0181	4,010% 4,062%	0,708 0,707	4.035 105,913	0,109 8.842
РФ	0,02402	0,0184	4,095%	0,697	2.121	0,586
СВР	0,02452	0,0189	4,240%	0,681	<0,01	0,008

Стол3указывает результаты RMSE для различных криптовалют. Рейтинг трех лучших моделей одинаков для всех криптовалют. Однако на нижних позициях можно наблюдать некоторую изменчивость, например, SVR и TFT особенно хорошо работают на BTC.

Таблица 3.Производительность RMSE отдельных моделей для каждой криптовалюты (ранги указаны в скобках).

БТД ЭТХ LTC XMR XRP Средний

ЛСТМ ГРУ
ГИБРИДНЫЙ
КНН ТКН АРИМА TFT

РФ СВР

0,0239 (1)
0,0245 (2)
0,0246 (3)
0,0249 (6)
0,0250 (7)
0,0251 (8)
0,0249 (5)
0,0266 (9)
0,0248 (4)
0,030 (1)
0,0309 (2)
0,0309 (3)
0,0319 (5)
0,0319 (4)
0,0320 (7)
0,0319 (6)
0,0332 (8)
0,0342 (9)
0,0189 (1)
0,0193 (2)
0,0195 (3)
0,0197(4)
0,0198 (5)
0,0198 (6)
0,0199 (7)
0,0199 (8)
0,0207 (9)
0,0236 (1)
0,0243 (2)
0,0244 (3)
0,0245 (5)
0,0245 (6)
0,0244 (4)
0,0250 (7)
0,0251 (8)
0,0268 (9)
0,0148 (1)
0,0153 (2)
0,0154 (3)
0,0155 (4)
0,0156 (5)
0,0158 (7)
0,0159 (8)
0,0157 (6)
0,0160 (9)
0,0222 (1)
0,0229 (2)
0,0230 (3)
0,0233 (4)
0,0233 (5)
0,0234 (6)
0,0235 (7)
0,0240 (8)
0,0245 (9)

Ансамбли

Стол4освещает выступления десяти лучших ансамблей по показателю RMSE. Ансамбли не превосходят по производительности сеть LSTM, а последняя входит во все наиболее эффективные ансамбли. Интересно посмотреть, как ансамбль LSTM и GRU превосходит модель HYBRID, которая представляет собой глубокую непоследовательную сеть, объединяющую LSTM и GRU.

Таблица 4.Средняя производительность ансамбля по сравнению с отдельными моделями, ранжированная по RMSE в порядке возрастания.

Ансамбль RMSE МАЭ МАПЭ Р2

ЛСТМ

ГРУ, ЛСТМ ГИБРИД, ЛСТМ ГИБРИД, ГРУ, ЛСТМ ЛСТМ, КНН
ГРУ, ЛСТМ, КНН ГРУ, ЛСТМ, ТЦН
ЛСТМ, ТЦН ГИБРИД, ЛСТМ, КНН
ГИБРИД, ГРУ, ЛСТМ, КНН
0,0222
0,0225
0,0225
0,0226
0,0227
0,0227
0,0227
0,0227
0,0227
0,0227
0,0173
0,0174
0,0174
0,0175
0,0175
0,0176
0,0176
0,0176
0,0175
0,0175
3,86%
3,89%
3,89%
3,90%
3,92%
3,91%
3,92%
3,93%
3,92%
3,91%

0,73

0,72

Чтобы оценить вклад отдельной модели, мы сравнили среднюю точность всех ансамблей, включающих эту модель, и тех, которые ее не включают (и разницу можно рассматривать как средний вклад RMSE, даваемый этой отдельной моделью). Результаты в таблице5подтвердите индивидуальный рейтинг модели в таблице2. В частности, вклад нерекуррентных моделей отрицательен, т. е. они в среднем ухудшают точность ансамбля.

Таблица 5.Вклад каждой модели в ансамбле ранжирован по разнице в порядке убывания.

Модель RMSE с моделью

RMSE без
Модель

Разница (%)1

ЛСТМ ГРУ

ГИБРИДНЫЙ
КНН ТКН АРИМА TFT

РФ СВР

0,023
0,0231
0,0231
0,0232
0,0232
0,0232
0,0232
0,0232
0,0233
0,0233
0,0232
0,0232
0,0232
0,0232
0,0231
0,0231
0,0231
0,0231
1,26%
0,57%
0,48%
– 0,03%
– 0,06%
– 0,2%
– 0,21%
– 0,41%

×100.
– 0,87%

1Разница =(RMSE без модели−RMSE с моделью)
RMSE без модели

Дискуссия

Результаты показывают, что рейтинг производительности моделей одинаков для разных криптовалют, а их средняя производительность подтверждает рейтинг. Рекуррентные подходы DL доминируют в задаче прогнозирования цен на криптовалюту согласно всем показателям точности. В частности, LSTM является наиболее эффективной моделью со средним RMSE 0,0222 и существенно превосходит другие сетевые архитектуры, такие как TCN (сверточная) и TFT (трансформаторная), которые имеют ошибку на 4,9% и 5,8% выше соответственно. Природа последних архитектур может объяснить их низкую производительность. Что касается TCN, сверточные сети хорошо интерпретируют повторяющиеся иерархические закономерности в данных (захваченные расширенными свертками), но эти закономерности отсутствуют во временных рядах цен криптовалют. Более того, TCN обычно лучше работает для детальных (плотных) прогнозов (например, почасовых прогнозов, а не ежедневных или ежемесячных прогнозов). Это связано с тем, что колебания между более широкими временными окнами имеют другое распределение, и их труднее уловить с помощью расширенных сверток. Что касается TFT, его механизм внимания известен тем, что фиксирует взаимосвязь между ковариатами рассматриваемого временного ряда. Однако такие ковариаты в наших экспериментах игнорируются (и мы оставляем это для будущей работы). Известно также, что TCN и TFT требуют больших объемов данных, т. е. им требуются значительные объемы данных для успешного захвата закономерностей. К сожалению, объем исторических данных, доступных для обучения этих моделей прогнозированию ежедневных цен, ограничен. Вторая лучшая модель — GRU, рекурсивная сеть, более простая, чем LSTM, которая достигает RMSE всего на 2,7% выше при аналогичных вычислительных затратах. Подводя итог, результаты для моделей DL показывают, что более дорогие и сложные архитектуры могут быть избыточными для этого типа задач временных рядов.
KNN обеспечивает отличный компромисс между точностью прогноза и требуемыми
вычислительными усилиями: ошибка на 4,8% выше, чем LSTM, но не требует времени на обучение и в 25 раз быстрее времени вывода. Другие модели машинного обучения (SVR и RF) находятся в нижней части рейтинга и, что весьма удивительно, уступают базовой модели ARIMA. Вероятно, это связано с тем, что они не могут уловить значимые закономерности во временных рядах, которые зашумлены и содержат выбросы (SVR работает лучше, потому что он менее склонен к выбросам). Напротив, из-за предположений о линейности прогнозы ARIMA являются направленными и более точными для краткосрочного анализа. В заключение, ARIMA обеспечивает хороший компромисс между хорошей точностью и меньшими вычислительными затратами.
В конечном счете, последняя часть эксперимента показывает, что объединение разных регрессоров в ансамбль не повышает производительность. Этот подход призван компенсировать недостатки модели путем ее усреднения с другими, более точными в конкретных случаях. Однако если регрессор в подавляющем большинстве случаев дает более точные прогнозы, его усреднение со значительно более неточными моделями отрицательно влияет на его производительность.
Действительно, LSTM неизменно превосходит все ансамбли из-за большого разрыва в точности с другими моделями.

Выводы

В этой статье сравниваются глубокое обучение (DL), машинное обучение (ML) и статистические модели для прогнозирования ежедневных цен на криптовалюты. Наша оценка на шаг вперед

Структура является инкрементной и работает по ежемесячному графику переобучения. Мы протестировали данные за 12 месяцев. Результаты показывают, что в целом рекуррентные подходы DL являются лучшими моделями для этой задачи. В частности, LSTM является наиболее эффективной моделью, и ее обучение обходится дешевле, чем другие модели DL с наиболее близкой производительностью. Причины, по которым модели DL, такие как TCN и TFT, неэффективны, могут заключаться, например, в том, что сверточные подходы лучше подходят для плотных прогнозов («разреженные» в нашем анализе), а TFT хорошо подходит для использования ковариатов (игнорируемых в нашем анализе), тогда как Оба подхода страдают от проблемы нехватки данных. KNN и ARIMA обеспечивают хороший компромисс между точностью и вычислительными затратами. Наконец, развертывание ансамблевых подходов вредно, поскольку их производительность уступает индивидуальному подходу LSTM.
Наличие точных прогнозов крайне важно для криптотрейдеров, которые часто торгуют ежечасно или ежедневно. Следовательно, адаптация точных прогнозов для торговых стратегий может помочь им увеличить свои доходы. Однако наши предсказатели могут предсказывать только ежедневные цены; в будущем мы стремимся создать предикторы, которые также будут предоставлять почасовые цены, и исследовать интеграцию таких предикторов с некоторыми торговыми стратегиями (например, [3]).
На колебания цен на криптовалюты также могут влиять несколько факторов, включая нормативные акты, тенденции в социальных сетях, настроения рынка и волатильность других криптовалют. Например, работа [63] анализирует, как новости и события регулирования влияют на доходность рынка криптовалют, используя подход, основанный на событиях. Согласно этому отчету, события, которые повышают вероятность принятия регулирования, связаны с отрицательной доходностью криптовалют. Другой пример из [64], где цены на другие криптовалюты демонстрируют взаимозависимую связь (Биткойн является родительской монетой как для Litecoin, так и для Zcash). Поэтому в будущем мы стремимся интегрировать подобные ковариаты в наши модели, чтобы повысить точность прогнозов.
Еще один способ улучшения прогнозирования предполагает исследование взаимосвязи между
криптовалютами. Их цены демонстрируют взаимозависимую связь, и монеты можно сгруппировать в кластеры со схожим поведением.65]. Используя эту структуру, аналогичные криптовалюты можно использовать для обучения более точной модели, специфичной для этого шаблона, и предлагать богатую и ценную информацию о динамике между криптовалютами, а также повышать точность предсказаний криптопрогнозирования.

Вклад автора:Концептуализация, AV и AR; методология, AV, AR, DC и KM; программное обеспечение, ДР и УЗ; валидация, AV, AR и KM; формальный анализ, АР и КМ; ресурсы, АВ; курирование данных, AR и KM; письменное – подготовка оригинала черновика, ДК и КМ; написание — обзор и редактирование, AV, AR, DC и KM; визуализация, КМ; надзор, AV, AR и DC; администрирование проектов, AV и DC; приобретение финансирования, А.В. Все авторы прочитали и согласились с опубликованной версией рукописи.
Финансирование:Эта публикация стала результатом исследования, частично поддержанного Научным фондом Ирландии в рамках гранта №. 18/CRT/6223. Эта публикация также стала результатом исследования, проведенного при финансовой поддержке Научного фонда Ирландии в рамках гранта № 12/RC/2289-P2, софинансируемого Европейским фондом регионального развития. В целях открытого доступа автор применил общественную лицензию на авторские права CC BY к любой версии рукописи, принятой автором, возникшей в результате этой публикации.

жүктеу/скачать 301,5 Kb.

Достарыңызбен бөлісу: