DApp Store | Web3 Hub tapahtumille ja peleille

Trendaavat aiheet

0xFunky

BioMedical AI Start up - CTO / Kaggle-kilpailu - Master / @GooseCityDAO / Perustaja @codechainAI

Karpathyn autotutkimuksen innoittamana opetin VibeHQ:n kehittymään, ei yhden agentin kehittämiseen, vaan koko moniagenttisen yhteistyömenetelmän kehittämiseen. 7 täysin automaattista ajoa ilman manuaalista puuttumista: • Tokenien käyttö: 7,2 miljoonaa → 5,7 miljoonaa (huippulasku 62 %) • Koordinointiin liittyvien ongelmien väheneminen (työn päällekkäisyys jne.) :4 → 0 • PM-tokenien hukka: -91 % Loop: benchmark → yhteistyökvantisointi ja LLM-analyysin vikatila → /optimize-protocol uudelleenkirjoituskoordinaatiokoodi → rebuild → repeat. Tekoäly seuraa agenttien epäonnistumista tiimityössä, analysoi miksi epäonnistui, ja muuttaa sitten oman lähdekoodinsa koordinoidakseen yhteistyölogiikkaa, ilman manuaalista työtä koko prosessin ajan, mikä täysin mahdollistaa tekoälyn järjestää oman tiiminsä hiljaisen ymmärryksen. Kun tarkastellaan olennaisia asioita, autoresearch optimoi automaattisesti mallin koulutuksen, aiempi Ralph oli autonominen silmukka yhdellä agentilla, ja Gastown ajoi samanaikaisesti 20–30 Claude-koodia orkestrointi, mutta ei kykene kehittymään, nämä ovat hyvin vahvoja, mutta myöhemmin ne myös kehittävät yhden agentin kykyjä. Kukaan ei kehitä tiimityötä itsessään, miten työ jaetaan, miten välttää konflikteja, miten jakaa kontekstia tai miten avata esteitä. Kuvittele, mitä tämä olento olisi, jos se juoksisi karkuun: • Agentit kehittävät omaa tiimikulttuuriaan ja työkemiaansa. • Sopeutua jokaiseen projektiin, jakamalla 3–7 hengen tiimi projektin kehitystason mukaan. • Mitä enemmän projekteja teette yhdessä, sitä vahvempi tiiminne. • Agentit voivat ottaa uusia tiimikavereita mukaan projektin ollessa käynnissä, jolloin työ siirtyy automaattisesti. Ihan oikeasti, mihin se lopulta kehittyy? En tiedä, mutta tämä on jännittävin osa.

Kolme päivää sitten lähdin automaattisen tutkimuksen virityksen nanochatista ~2 päiväksi depth=12-mallilla. Se löysi ~20 muutosta, jotka paransivat validointihäviötä. Testasin näitä muutoksia eilen, ja kaikki olivat additiivisia ja siirrettiin suurempiin (syvyys=24) malleihin. Kaikkien näiden muutosten perusteella mittasin tänään, että tulostaulun "Aika GPT-2:een" laskee 2,02 tunnista 1,80 tuntiin (~11 % parannus), tämä on uusi tulostaulun merkintä. Joten kyllä, nämä ovat todellisia parannuksia ja niillä on todellinen merkitys. Olen hieman yllättynyt, että ensimmäinen naiivi yritykseni toimi näin hyvin sen lisäksi, mitä luulin olevan melko hyvin säädetty käsin. Tämä on minulle ensimmäinen kerta, koska olen tottunut tekemään neuroverkkokoulutuksen iteratiivista optimointia manuaalisesti. Keksit ideoita, toteutat ne, tarkistat, toimivatko ne (parempi validoinnin menetys), keksit uusia ideoita niiden pohjalta, luet joitakin artikkeleita inspiraatiota varten jne. Tämä on se ydin siitä, mitä teen päivittäin kahden vuosikymmenen ajan. On uskomatonta nähdä agentin tekevän koko työnkulun alusta päähän ja yksin, kun se teki noin 700 muutosta itsenäisesti. Se tarkasteli todella kokeiden tulosten järjestystä ja käytti sitä seuraavien suunnitteluun. Se ei ole vielä uutta, uraauurtavaa "tutkimusta", mutta kaikki säädöt ovat "todellisia", en löytänyt niitä aiemmin manuaalisesti, ja ne kasaantuvat ja paransivat nanochatia. Suurten asioiden joukossa esimerkiksi: - Se huomasi virheen, että parametrittomassa QKnormissa ei ollut skaalauskertointa, joten huomioni oli liian hajanaista. Agentti löysi kertoimia terävöittääkseen sitä, mikä viittasi tulevaan työhön. - Se havaitsi, että Value Embeddingit todella pitävät regularisoinnista, enkä soveltanut mitään (hups). - Se huomasi, että nauhakiinnitykseni oli liian konservatiivinen (unohdin virittää sen). - Havaittiin, että AdamW-betat olivat kaikki sekaisin. - Se sääti painon laskuaikataulua. - Se viritti verkon alustumisen. Tämä on kaiken sen virityksen lisäksi, jonka olen jo tehnyt pitkän ajan kuluessa. Tarkka sitoutuminen löytyy täältä, tästä automaattisen tutkimuksen "kierroksesta 1". Aloitan "kierroksen 2", ja samanaikaisesti tarkastelen, miten useat agentit voivat tehdä yhteistyötä rinnakkaisuuden avaamiseksi. Kaikki LLM:n rajalaboratoriot tekevät tämän. Se on viimeinen pomotaistelu. Se on tietysti paljon monimutkaisempi mittakaavassa – ei ole vain yhtä junaa. Py-tiedosto viritettäväksi. Mutta sen tekeminen on "vain insinöörityötä" ja se tulee toimimaan. Käynnistät joukon agentteja, saat heidät virittämään pienempiä malleja, edistät lupaavimpia ideoita yhä suurempiin mittakaavoihin ja ihmiset (vapaaehtoisesti) osallistuvat reunoihin. Ja yleisemmin, *mikä tahansa* mittari, josta välität ja joka on kohtuullisen tehokas arvioida (tai jolla on tehokkaampia välitysmittareita, kuten pienemmän verkon kouluttaminen), voidaan automaattisesti tutkia agenttiparvella. Kannattaa miettiä, kuuluuko ongelmasi myös tähän ryhmään.

Johtavat

Rankkaus

Suosikit