Далі я занурююся в DBSCAN для статистичної панелі, а також зберігаю знімки для дерева рішень, яке активується після 5-6 годин роботи (2-3 дні дадуть більше статистично релевантних даних для обміну). моя головна мета — швидко вміти виявляти своєрідну поведінку та винятки між 545 тікерами Binance. DBSCAN знаходить групи на основі щільності, тобто точки, що розташовані близько одна до одної, стають кластером, а ізольовані точки позначаються як викиди. Ключова відмінність від k-means: k-means змушує кожен актив об'єднуватися в групу, незалежно від обставин. DBSCAN насправді краще розділяє та аналізує своєрідні викиди у цьому форматі. На панелі керування наразі кожен розширений актив описується 7 вимірами одночасно > наскільки тривала, як довго/коротко, швидкість, рідкість, обсяг, кореляція BTC та режим волатильності. На цьому я поки що закінчу. Збираю деякі дані і поділюся ними в статті, над якою працюю.
Stoic
Stoic23 бер., 15:04
Спроба k означає кластеризацію, де дані розділяються на групи за подібністю. У цьому випадку: Він бере кожен розширений актив і вимірює п'ять параметрів: Наскільки розтягнутий актив, скільки часу він там перебуває, як швидко рухається, наскільки рідкісний цей рівень і який об'єм за ним стоїть. Сформувалися чотири групи: Шумовий сплеск: прийшов швидко, вже відходить. Короткий дотик, мабуть, не вартий того, щоб його обмінювати. Повільний гринд: був розтягнутий на кілька часових циклів, низька швидкість. Потенційно застрягла будівля позиціонування. Переповнена позиція: крайній процентильний ранг, середній обсяг. Ризик стиснення або ліквідації залежить від напрямку. Тонкий ринок — низький обсяг порівняно з розширенням. Z-score технічно дійсний, але потребує додаткового дослідження. Детальна стаття про весь процес.
Коротко: у статистичних окопах
8,39K