Llama.cpp

新公司要搞AI 增加产品竞争力，但是又没有GPU服务器，研究了一下Llama.cpp 应该可以满足要求。

Llama.cpp 由 Georgi Gerganov 开发。它以高效的 C/C++ 实现了 Meta 的 Llama 架构,以其通用兼容性、综合功能集成和专注的优化而脱颖而出.

Llama.cpp 的主干是原始的 Llama 模型，它也基于 Transformer 架构:

Llama 架构与 Transformer 架构的主要区别：

架构图

开始使用 Llama.cpp 的先决条件包括：

后续就可以从 GitHub 上克隆 Llama.cpp 的仓库，并按照官方文档进行安装运行。