1/ 答案是你無法做到——至少不便宜。驗證一篇論文是否為突破性成果所需的專業知識大致與產出一篇論文相同。生成的規模。驗證則不然。
Dwarkesh Patel
Dwarkesh Patel3月21日 04:00
如果 AI 科學家正在撰寫數百萬篇論文,其中許多都是粗糙的,有些則是漸進的進展,我們該如何識別出那一兩篇提出極具生產力的新想法的論文? 在 1948 年,香農是貝爾實驗室數百名工程師中的一員,他們正在研究如何在嘈雜的銅線上清晰地傳送語音信號。他的論文與有關減少靜電和建造更好濾波器的報告發表在同一技術期刊上。 你如何認識到他提出了這個非常通用的信息和通信通道思考框架,這在接下來的幾十年中將在從密碼學到遺傳學再到量子力學等各個領域中發揮巨大作用? 似乎需要幾十年的時間,才能讓各個領域認識到統一新概念的重要性。因為正是在這個時間尺度上,這些通用概念的成果導致了許多不同領域的新發現。 我們已經在一定程度上解決了人類科學家的同行評審問題。現在,我們需要在更大規模上解決將要面臨的 AI 科學的海量問題。
2/ 我們稱這為可測量性差距。任務的驗證難度相對於執行難度越高,您就越無法安全地自動化它。AI 科學是極端的例子:無限生成,固定的驗證帶寬。
3/ 我們將此正式化,並在第5節中映射驗證成為AI進步的約束條件的情況:
56