记录技术学习、博客写作和自我感想随笔。
记录大模型推理、搜索、验证和 test-time compute 相关问题。
LLM / 推理
记录推理系统、性能、工具链和静态发布相关的工程问题。
系统 / 工程
整理 test-time compute 的基本方法、收益和局限。
一篇关于让语言模型通过搜索式思考解决问题的论文。
paper / LLM / 推理 / 搜索
围绕大模型、推理和系统工程整理的一组长期笔记。
1 篇文章