RIP 平面 RAG ☠️ 字节跳动刚刚开源了 OpenViking,它揭示了我们构建 AI 代理记忆的所有问题。 每个代理框架都错在哪里: 记忆存放在一个地方,资源在另一个地方,技能散落在各处。当你需要上下文时,你只能进行平面向量搜索,寄希望于好运。 这就是问题所在。OpenViking 用一个想法解决了所有问题:将代理上下文视为文件系统。 一切都在统一的 viking:// 协议下。记忆、资源、技能都以独特的 URI 组织在目录中。代理可以像开发者在终端中工作一样 ls、查找和导航上下文。 但真正的突破是分层加载: → L0:快速查找的一句话摘要 → L1:约 2k 令牌的概述,用于规划决策 → L2:仅在实际需要时加载完整细节 大多数代理将所有内容都倒入上下文中,然后祈祷。OpenViking 只在需要时加载所需内容。令牌成本降低,准确性提高。 而且检索现在真的有意义了。它不是进行一次平面的语义搜索,而是首先进行目录级定位,然后在高分目录内进行递归细化。你可以直观地观察检索轨迹,不再是黑箱。 自我进化的部分也很疯狂。在每个会话结束时,它会自动提取学习并更新代理和用户记忆。代理使用得越多,变得越聪明。 9K 星。13 位贡献者。由自 2019 年以来一直在运行向量基础设施的字节跳动 Viking 团队构建。 100% 开源。Apache 2.0。 链接在评论中。