1. 国际开源主流
(最常用)
- Llama 系列(Meta)
- Mistral / Mixtral(法国)
- Falcon(阿联酋)
特点:
- 性能强
- 社区活跃
- 工具链完善(vLLM / llama.cpp)
Llama 3 70B 能力水平
- 接近 GPT-3.5 / 部分场景接近 GPT-4
- 在 benchmark 上表现很强
特点:
- 多语言(含中文)
- 编程能力强
- 推理能力明显提升
2. 国内主流模型
(中文更强)
- 通义千问(Qwen)
- DeepSeek(很火)
- ChatGLM
- 百川(Baichuan)
特点:
- 中文能力强
- 更适合企业知识库
- 私有化支持更友好
3. 轻量模型(本地跑)
- Phi-2 / Phi-3(微软)
- Mistral 7B
- Llama 3 8B
特点:
- 单卡 GPU 就能跑
- 适合:
- 个人
- 小企业
- 边缘设备
4. 超大模型(企业级)
- Llama 70B / 405B
- Qwen 72B
- Mixtral 8x7B(MoE)
特点: - 能力接近 GPT-4
- 需要:
- GPU 集群
- 推理框架(TensorRT / vLLM)
场景 推荐
中文客服 Qwen / DeepSeek
代码助手 Llama 70B / Mixtral
知识库问答 Llama 13B / Qwen 14B
高端 AI 应用 70B 以上
如果你是个人 / 小团队:
硬件 推荐模型
3090 / 4090 7B / 13B
双卡 30B
多卡服务器 70B
