Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

0xFunky
BioMedical AI Start up - CTO / Kaggle-kilpailu - Master / @GooseCityDAO / Perustaja @codechainAI
Se on nykyään todella tunteellista
"Etuosan manuaalinen kaiverrus on käytännössä ohi"
AI + Figma on kuin avaaminen ja ripustaminen, oikean menetelmän löytäminen voi nopeasti kaivertaa lähes saman version kuin Figma, ja sitä voi muokata molempiin suuntiin ilman manuaalista muokkausta.
Aiemmin käytin eniten aikaa kaiverrukseen, joka saattoi hioa koko päivän OCD-hyökkäyksen aikana, mutta nyt tekoäly voi saada kaiverruksen valmiiksi muutamassa minuutissa, ja palautusaste on edelleen liian korkea...
Ihailu syntyi juuri tässä ajassa.
162
Karpathyn autotutkimuksen innoittamana opetin VibeHQ:n kehittymään, ei yhden agentin kehittämiseen, vaan koko moniagenttisen yhteistyömenetelmän kehittämiseen.
7 täysin automaattista ajoa ilman manuaalista puuttumista:
• Tokenien käyttö: 7,2 miljoonaa → 5,7 miljoonaa (huippulasku 62 %)
• Koordinointiin liittyvien ongelmien väheneminen (työn päällekkäisyys jne.) :4 → 0
• PM-tokenien hukka: -91 %
Loop: benchmark → yhteistyökvantisointi ja LLM-analyysin vikatila → /optimize-protocol uudelleenkirjoituskoordinaatiokoodi → rebuild → repeat.
Tekoäly seuraa agenttien epäonnistumista tiimityössä, analysoi miksi epäonnistui, ja muuttaa sitten oman lähdekoodinsa koordinoidakseen yhteistyölogiikkaa, ilman manuaalista työtä koko prosessin ajan, mikä täysin mahdollistaa tekoälyn järjestää oman tiiminsä hiljaisen ymmärryksen.
Kun tarkastellaan olennaisia asioita, autoresearch optimoi automaattisesti mallin koulutuksen, aiempi Ralph oli autonominen silmukka yhdellä agentilla, ja Gastown ajoi samanaikaisesti 20–30 Claude-koodia
orkestrointi, mutta ei kykene kehittymään, nämä ovat hyvin vahvoja, mutta myöhemmin ne myös kehittävät yhden agentin kykyjä.
Kukaan ei kehitä tiimityötä itsessään, miten työ jaetaan, miten välttää konflikteja, miten jakaa kontekstia tai miten avata esteitä.
Kuvittele, mitä tämä olento olisi, jos se juoksisi karkuun:
• Agentit kehittävät omaa tiimikulttuuriaan ja työkemiaansa.
• Sopeutua jokaiseen projektiin, jakamalla 3–7 hengen tiimi projektin kehitystason mukaan.
• Mitä enemmän projekteja teette yhdessä, sitä vahvempi tiiminne.
• Agentit voivat ottaa uusia tiimikavereita mukaan projektin ollessa käynnissä, jolloin työ siirtyy automaattisesti.
Ihan oikeasti, mihin se lopulta kehittyy? En tiedä, mutta tämä on jännittävin osa.


Andrej Karpathy10.3. klo 06.28
Kolme päivää sitten lähdin automaattisen tutkimuksen virityksen nanochatista ~2 päiväksi depth=12-mallilla. Se löysi ~20 muutosta, jotka paransivat validointihäviötä. Testasin näitä muutoksia eilen, ja kaikki olivat additiivisia ja siirrettiin suurempiin (syvyys=24) malleihin. Kaikkien näiden muutosten perusteella mittasin tänään, että tulostaulun "Aika GPT-2:een" laskee 2,02 tunnista 1,80 tuntiin (~11 % parannus), tämä on uusi tulostaulun merkintä. Joten kyllä, nämä ovat todellisia parannuksia ja niillä on todellinen merkitys. Olen hieman yllättynyt, että ensimmäinen naiivi yritykseni toimi näin hyvin sen lisäksi, mitä luulin olevan melko hyvin säädetty käsin.
Tämä on minulle ensimmäinen kerta, koska olen tottunut tekemään neuroverkkokoulutuksen iteratiivista optimointia manuaalisesti. Keksit ideoita, toteutat ne, tarkistat, toimivatko ne (parempi validoinnin menetys), keksit uusia ideoita niiden pohjalta, luet joitakin artikkeleita inspiraatiota varten jne. Tämä on se ydin siitä, mitä teen päivittäin kahden vuosikymmenen ajan. On uskomatonta nähdä agentin tekevän koko työnkulun alusta päähän ja yksin, kun se teki noin 700 muutosta itsenäisesti. Se tarkasteli todella kokeiden tulosten järjestystä ja käytti sitä seuraavien suunnitteluun. Se ei ole vielä uutta, uraauurtavaa "tutkimusta", mutta kaikki säädöt ovat "todellisia", en löytänyt niitä aiemmin manuaalisesti, ja ne kasaantuvat ja paransivat nanochatia. Suurten asioiden joukossa esimerkiksi:
- Se huomasi virheen, että parametrittomassa QKnormissa ei ollut skaalauskertointa, joten huomioni oli liian hajanaista. Agentti löysi kertoimia terävöittääkseen sitä, mikä viittasi tulevaan työhön.
- Se havaitsi, että Value Embeddingit todella pitävät regularisoinnista, enkä soveltanut mitään (hups).
- Se huomasi, että nauhakiinnitykseni oli liian konservatiivinen (unohdin virittää sen).
- Havaittiin, että AdamW-betat olivat kaikki sekaisin.
- Se sääti painon laskuaikataulua.
- Se viritti verkon alustumisen.
Tämä on kaiken sen virityksen lisäksi, jonka olen jo tehnyt pitkän ajan kuluessa. Tarkka sitoutuminen löytyy täältä, tästä automaattisen tutkimuksen "kierroksesta 1". Aloitan "kierroksen 2", ja samanaikaisesti tarkastelen, miten useat agentit voivat tehdä yhteistyötä rinnakkaisuuden avaamiseksi.
Kaikki LLM:n rajalaboratoriot tekevät tämän. Se on viimeinen pomotaistelu. Se on tietysti paljon monimutkaisempi mittakaavassa – ei ole vain yhtä junaa. Py-tiedosto viritettäväksi. Mutta sen tekeminen on "vain insinöörityötä" ja se tulee toimimaan. Käynnistät joukon agentteja, saat heidät virittämään pienempiä malleja, edistät lupaavimpia ideoita yhä suurempiin mittakaavoihin ja ihmiset (vapaaehtoisesti) osallistuvat reunoihin.
Ja yleisemmin, *mikä tahansa* mittari, josta välität ja joka on kohtuullisen tehokas arvioida (tai jolla on tehokkaampia välitysmittareita, kuten pienemmän verkon kouluttaminen), voidaan automaattisesti tutkia agenttiparvella. Kannattaa miettiä, kuuluuko ongelmasi myös tähän ryhmään.

280
Tämä on paras ja ahdistunein hetki.
Kuukausimaksu tekoälytyökaluista kallistuu, GPT-5.4 on todella hyvä varsinaisen testin jälkeen, joten päivitin suoraan, Claude on varmaan Max 20x täyteen, Google tilasi myös Ultra-suunnitelman, pääasiassa käyttääkseen Antigravitya Claude Opus 4.6:n käyttöön.
Viime päivinä olen keskittynyt kehittämäni moniagenttikehyksen VibHQ:n optimointiin ja käyttänyt tätä kehystä luodakseni alustan, joka on yhteensopiva matkapuhelinten ja tietokoneiden välillä kaikkien CLI-agenttien hallintaan.
Olen käyttänyt tätä monissa projektitiimeissä, mukaan lukien PM Botin strategian optimointitiimissä, jossa tekoäly suunnittelee, toteuttaa ja tekee laadunvarmistuksen.
Yhden hengen yritys, jossa on kokonainen ammattimainen tekoälyinsinööritiimi.
310
Johtavat
Rankkaus
Suosikit
