模型社区
传统企业的AI应用遵循内部数据不外发的原则,高度依赖纯本地模型,主要来自大厂的开源模型或社区微调模型。
开源模型社区
开源模型社区是指围绕大型深度学习模型构建的开放协作平台和生态系统,除了开源模型还提供:数据集、教程、体验等功能。这些社区由研究人员、开发者、数据科学家、工程师及爱好者组成,他们共同致力于大模型的研究、开发、优化和应用。
社区具有明显的马太效应,即头部效应明显,头部模型拥有最多的资源,最新的技术,最多的用户。
所谓“开源模型”,通常指公开以下两个核心部分:
- 模型架构(Framework):即网络结构设计,如 Transformer 层堆叠方式、注意力机制等;
- 参数权重(Weights):训练完成后保存的数值,决定模型的实际能力。
早期代表性开源模型如 LLaMA(Meta)、Qwen(通义)、ChatGLM(智谱)等,均完整发布架构代码和权重文件,推动了社区快速发展。这些模型的设计大多基于经典论文《Attention Is All You Need》提出的 Transformer 架构,成为当今绝大多数大模型的技术基石。