Seuraavaksi tutkin DBSCANia tilastollisen dashboardin vuoksi ja myös tallennan päätöspuun snapshotteja, jotka aktivoituvat 5–6 tunnin ajon jälkeen (2–3 päivää antaa tilastollisesti merkityksellisempää dataa jaettavaksi) Päätavoitteeni on pystyä tunnistamaan omalaatuinen käyttäytyminen ja poikkeamat 545 Binance-tickerissä nopealla vilkaisulla. DBSCAN löytää ryhmiä tiheyden perusteella, eli pisteet, jotka ovat lähellä toisiaan, muodostavat klusteria ja eristetyt pisteet merkitään poikkeaviksi. Keskeinen ero k-meansiin: k-means pakottaa jokaisen omaisuuden ryhmään riippumatta siitä. DBSCAN itse asiassa erottaa ja jäsentää erikoiset poikkeamat paremmin tässä muodossa. Tällä hetkellä kojelaudassa jokainen laajennettu omaisuus kuvataan samanaikaisesti seitsemällä ulotuksella > kuinka pitkä, kuinka pitkä/lyhyt, nopeus, harvinaisuus, volyymi, BTC-korrelaatio ja volatiliteettijärjestelmä. Tässä vaiheessa aion lopettaa tältä erää. Kerään dataa ja jaan sen artikkelissa, jota parhaillaan työstän.
Stoic
Stoic23.3. klo 15.04
K:n kokeileminen tarkoittaa nyt klusterointia, jossa data jaetaan ryhmiin samankaltaisuuden perusteella. Tässä tapauksessa: Se ottaa jokaisen laajennetun omaisuuden ja mittaa viisi parametria: Kuinka laaja omaisuus on, kuinka kauan se on ollut siellä, kuinka nopeasti se liikkuu, kuinka harvinainen tuo taso on ja kuinka paljon volyymia sen takana on. Neljä ryhmää syntyi: Äänipiikki: pääsin nopeasti, olen jo taaksepäin. Lyhyt kosketus, todennäköisesti ei kannata vaihtaa. Hidas grindaus: pidennetty useiden aikasykleiden ajan, pieni nopeus. Mahdollisesti jumissa oleva sijoittuminen rakennus. Ahtaat asemat: äärimmäinen prosenttipiste, kohtuullinen volyymi. Puristus- tai likvidointiriski riippuen suunnasta. Ohut markkina — pieni volyymi suhteessa laajentumiseen. Z-piste on teknisesti hyväksyttävä, mutta kaipaa lisää tutkimista. Yksityiskohtainen artikkeli seurattavaksi koko prosessista.
TLDR: tilastojen juoksuhaudoissa
8,37K