大模型应用

大模型应用开发，本质上是在在一个充满随机性的模型之上，构建出一套具备确定性的工程架构（Harness Engine）。

记忆层^?

编排层

执行层

反馈层

大模型越强^? 记忆层与编排层就可以越薄，执行层与反馈层的就可以越简单。

提示词工程和上下文工程融入在每个环节中,例如rule文件就属于提示词工程，Skill文件就属于上下文工程。

📄️Transformer🔨

伟大无需多言。

为了更好的了解当下模型性能，我列举了几个模型排名网站：

大模型刚出现时，提示词工程铺天盖地，RAG成为企业追逐的热点。现在随着系统化的Harness Engine概念的提出，我们将提示词工程和RAG等对选择性加载到模型上下文的工作统称为上下文工程。

在提示词的阶段我们就知道，由于模型的分词器和训练语料的不同，最佳实践的提示词自然也是不同的。模型的脾气，模型的厂商最清楚，因此顶级模型厂商会提供最佳实践的Harness Engine。例如：Claude Code 、 Codex 、 Gemini cli 。