记录大模型推理、搜索、验证和 test-time compute 相关问题。
整理 test-time compute 的基本方法、收益和局限。
LLM / 推理
一篇关于让语言模型通过搜索式思考解决问题的论文。
paper