跳到正文
LouisJiang

大模型推理

记录大模型推理、搜索、验证和 test-time compute 相关问题。

阅读路径

  1. 先从 test-time compute 的基本方法开始。
  2. 比较采样、搜索和验证器方法的差异。
  3. 持续记录成本、延迟和可靠性之间的权衡。

文章

资源

Tree of Thoughts

一篇关于让语言模型通过搜索式思考解决问题的论文。

paper