Dále se ponořím do DBSCAN pro statistický dashboard a také ukládám snapshoty pro rozhodovací strom, který se aktivuje po 5-6 hodinách provozu (2-3 dny mi dají statisticky relevantnější data ke sdílení). mým hlavním cílem je být schopen rozpoznat idiosynkratické chování a odlehlé hodnoty napříč 545 Binance tickery rychlým pohledem. DBSCAN nachází skupiny podle hustoty, tj. body, které jsou blízko u sebe, se stanou shlukem a izolované body jsou označeny jako odlehlé hodnoty. Klíčový rozdíl oproti k-means: k-means nutí každý aktivum do skupiny bez ohledu na cokoli. DBSCAN ve skutečnosti lépe segreguje a rozlišuje idiosynkratické odlehlé hodnoty v tomto formátu. V současném dashboardu je každý rozšířený asset popsán současně 7 dimenzemi > jak dlouhá, jak dlouhá/krátká, rychlost, vzácnost, objem, korelace BTC a režim volatility. Tady to teď rozhodnu. Sbírám nějaká data a budu je sdílet v článku, na kterém pracuji.
Stoic
Stoic23. 3. 15:04
Zkoušení k znamená nyní shlukování, kdy se data rozdělí do skupin pomocí podobnosti. V tomto případě: Vezme každý rozšířený asset a měří pět parametrů: Jak dlouho je asset, jak dlouho tam je, jak rychle se pohybuje, jak vzácná je ta úroveň a kolik objemu za ním stojí. Vznikly čtyři skupiny: Hlukový výkyv: rychle jsem tam byl, už se vracím. Krátký kontakt, pravděpodobně nestojí za to ho vyměnit. Pomalé mletí: prodlouženo na několik časových cyklů, nízká rychlost. Potenciálně uvězněná budova pozicování. Přeplněná pozice: extrémní percentilové pořadí, střední objem. Riziko stlačení nebo likvidace v závislosti na směru. Tenký trh — nízký objem ve srovnání s rozšířením. Z-skóre je technicky platné, ale vyžaduje další zkoumání. Podrobný článek o celém procesu následuje.
Stručně: ve statistických zákopech
8,37K