Jag gräver i DBSCAN för den statistiska dashboarden och lagrar även ögonblicksbilder för ett beslutsträd som aktiveras efter 5–6 timmars körning (2–3 dagar ger mig mer statistiskt relevant data att dela) mitt huvudmål med detta är att kunna identifiera idiosynkratiska beteenden och avvikare över 545 Binance-tickers med en snabb blick. DBSCAN hittar grupper baserat på täthet, dvs. punkter som ligger nära varandra blir ett kluster och isolerade punkter flaggas som avvikare. Den avgörande skillnaden från k-betyder: k-betyder tvingar varje tillgång till en grupp oavsett vad. DBSCAN separerar och tolkar faktiskt idiosynkratiska avvikare bättre i detta format. I instrumentpanelen beskrivs varje utökad tillgång av 7 dimensioner samtidigt. > hur långt/kort, hastighet, sällsynthet, volym, BTC-korrelation och volatilitetsregime. Här tänker jag avsluta för nu. Jag samlar in lite data och kommer att dela den i artikeln jag arbetar med.
Stoic
Stoic23 mars 15:04
Att testa k innebär klustring nu där datan delas upp i grupper med hjälp av likhet. I detta fall: Den tar varje utökad tillgång och mäter fem parametrar: Hur utsträckt tillgången är, hur länge den har funnits där, hur snabbt den rör sig, hur sällsynt nivån är och hur mycket volym som finns bakom. Fyra grupper uppstod: Ljudtopp: kom dit snabbt, redan på väg tillbaka. Kort beröring, troligen inte värt att byta. Långsam grind: förlängd med flera tidscykler, låg hastighet. Potentiellt fälla och positioneringsbyggnad. Trång position: extrem percentilrankning, måttlig volym. Squeeze eller likvidationsrisk beroende på riktning. Tunn marknad — låg volym i förhållande till extension. Z-poängen är tekniskt sett giltig men behöver mer efterforskning. Detaljerad artikel följer om hela processen.
Sammanfattning: i statistikens skyttegravar
8,39K