
Финансовые рынки часто подвергаются различным формам манипуляций, в том числе pump-and-dump схемам, которые приводят к значительной волатильности цен и финансовым потерям для инвесторов. В предыдущих исследованиях на тему криптовалютных рынков использовались методы машинного обучения для раннего выявления целей манипуляций. Однако эти методы имели серьезные ограничения из-за дисбалансов в исторических данных. Чтобы решить эти проблемы, мы предлагаем новый фреймворк для обнаружения целей манипуляций, включающий двухэтапную нормализацию данных, специфичную оптимизацию алгоритмов и новые микроструктурированные признаки. На семинаре было рассмотрено несколько подходов на основе градиентного бустинга, включая оптимизацию гиперпараметров с учетом несбалансированности классов и алгоритмы ранжирования. Результаты предложенных алгоритмов превосходят существующие методы, достигая точности 5% в топ-1 и 45% точности в топ-10 на тестовой выборке с сильным дисбалансом классов (дисбаланс классов составляет примерно 270).