Негативные события делают переобучение прогнозных моделей в криптографии нетривиальной задачей.

В недавней статье, опубликованной в CoinDesk, я обрисовал некоторые ключевые проблемы количественных стратегий для криптоактивов. Создание прогнозных моделей и количественных стратегий для криптоактивов - увлекательная задача, которая представляет собой совершенно новые трудности по сравнению с традиционными рынками капитала. По мере того, как мы в IntoTheBlock создавали больше прогнозных моделей на основе машинного обучения (ML), мы столкнулись с несколькими трудностями, которые выходят за рамки традиционных методологий машинного обучения и количественного анализа. Одна из этих проблем - это то, что я назвал в статье дилеммой переподготовки.

Прогностические модели на основе машинного обучения для финансовых активов, таких как криптовалюты, в основном основаны на контролируемых методах обучения. Суть контролируемого обучения состоит в том, что модели обучаются в заданном помеченном наборе данных, таком как «Биткойн торгует в Coinbase» или «Эфириум-заказы в Binance», и они изучают закономерности или особенности в этом наборе данных с целью прогнозирования определенного целевого значения, такого как цена или волатильность. Тренировка не является разовым мероприятием и должна проводиться регулярно. Определение правильной частоты переобучения - важная задача для любой модели прогнозирования. Переобучение моделей - это один из тех аспектов, который в прогнозных моделях для криптоактивов выглядит совершенно иначе, чем на традиционных рынках капитала.

Предположим, у нас есть модель машинного обучения, которая пытается предсказать цену акций Microsoft (MSFT). Модель обучалась в исторической книге заказов MSFT на NASDAQ в течение последнего десятилетия. Учитывая, что производительность MSFT была относительно стабильной по сравнению с рыночными условиями, правила переобучения нашей прогнозной модели основаны на двух фундаментальных критериях:

1) На основе частоты: модель можно переобучать каждые несколько месяцев, чтобы фиксировать информацию о последней торговой активности.

2) На основе дрейфа модели. Модель можно переобучить, когда ее производительность начнет ухудшаться. В машинном обучении это называется дрейфом модели и проиллюстрировано на следующем рисунке:

Эти два шага кажутся относительно простыми. Либо мы регулярно переобучаем модель, либо когда ее производительность ухудшается. Эта методология невероятно хорошо работает с моделями прогнозирования для традиционных классов активов, но регулярно терпит неудачу при применении к криптовалюте. В этом суть того, что мы называем дилеммой переподготовки.

Дилемма переподготовки

Основная причина, по которой методы регулярной или дрейфовой переподготовки работают с обычными классами активов, заключается в их стабильности и эффективности. Возвращаясь к нашему примеру акций MSFT, прогнозная модель может столкнуться с некоторыми выбросами, но их должно быть немного, и они, конечно, вряд ли окажут влияние в долгосрочной перспективе. Крипто - полная противоположность.

Суть дилеммы переобучения можно проиллюстрировать, расширив наш примерный сценарий и предположив, что мы обучаем модель прогнозирования, аналогичную нашему примеру MSFT, но на этот раз для прогнозирования цены биткойна на основе записей книги заказов Coinbase. Только в этом году мы столкнемся с необычными событиями, такими как мартовский крах, постоянные недели отсутствия волатильности в июне-июле, сумасшедший всплеск волатильности в конце июля, за которым последует еще одно резкое падение в начале сентября. Учитывая молодую историю большинства криптоактивов, последовательность многих из этих выпадающих событий является относительно новой и повлияет на производительность большинства прогнозных моделей. На этом этапе нам нужно решить, является ли переобучение нашей прогнозной модели подходящим решением.

Перед лицом необычного события решение переобучить прогнозирующую модель далеко не тривиально. Если мы перейдем к переобучению, мы примем на себя несколько рисков, таких как переобучение модели для записей выбросов или даже снижение ее производительности. Кроме того, невозможно проверить, узнала ли модель что-нибудь новое, учитывая, что выброс вообще произошел. Если мы решим не переобучать модель, мы рискуем увидеть дальнейшее снижение производительности. Теперь представьте, что наша прогнозная модель регулярно сталкивается с этими выбросами, и вы получите представление о масштабах проблемы. В этом суть дилеммы переподготовки.

Не существует серебряных пуль для решения проблем, связанных с дилеммой переобучения в прогнозировании криптоактивов. В IntoTheBlock мы регулярно сталкиваемся с этими проблемами и изучаем различные творческие решения, которые будут предметом будущих публикаций 😊