wsl-docs

❯

❯

AI 模型与推理基础设施

❯

LLaMA Factory：大模型微调与推理工具集

LLaMA-Factory：大模型微调与推理工具集

发布日期：2026-02-224分钟阅读

摘要

一句话总结

LLaMA-Factory 是一个开源的统一高效大模型微调框架，支持通过零代码界面对 100 多种大型语言模型（LLMs）和多模态模型（VLMs）进行微调。

关键点

项目影响力：基于 Python 开发，采用 Apache License 2.0 协议，在 GitHub 拥有超 6.7 万 Stars，已被 Amazon、NVIDIA 和阿里云等企业采用（相关成果发表于 ACL 2024）。
广泛的模型支持：支持 LLaMA、Qwen3、DeepSeek、Gemma、GLM 等 100+ 模型，并对前沿模型（如 Qwen3、Gemma 3）提供 Day-0 或 Day-1 级别的微调支持。
丰富的训练方法：集成了连续预训练、多模态监督微调（SFT）、奖励建模（RM）、PPO、DPO、KTO 和 ORPO 等多种训练策略。
高效微调与量化：支持 16-bit 全量微调、冻结微调、LoRA，以及基于 AQLM、AWQ、GPTQ 等多种方案的 2/3/4/5/6/8-bit QLoRA。
前沿算法与优化技巧：内置 GaLore、BAdam、DoRA、LongLoRA 等高级算法，并支持 FlashAttention-2、Unsloth、Liger Kernel 和 KTransformers 等加速与显存优化技术。
多任务与多模态能力：适用任务广泛，涵盖多轮对话、工具调用、图像理解、视觉定位、视频识别和音频理解等。
易用性与推理部署：提供零代码的 CLI 和 Web UI（LlamaBoard），支持本地与云端训练，并可通过 vLLM 或 SGLang worker 提供 OpenAI 风格的 API 实现快速推理。

功能与定位

Unified Efficient Fine-Tuning of 100+ LLMs & VLMs (ACL 2024)

典型使用场景

用于模型训练、微调、推理或文档解析等基础能力建设。
作为上层 AI 应用的数据与模型基础设施。

核心功能

提供模型/推理相关核心能力。
支持与主流 AI 工具链协同。
兼顾实验验证与工程落地场景。

特色与差异点

仓库长期活跃，最近更新时间为 2026-02-22T12:07:14Z。
项目创建于 2023-05-28T10:09:12Z，具备持续迭代与社区沉淀。
以 Python 为主语言，聚焦该技术栈的工程实践。

使用方式概览

阅读仓库 README 与官方文档，确认适配场景与依赖条件。
按项目推荐方式完成安装与初始化，再从示例或最小流程开始验证。
在生产使用前补齐权限控制、日志监控和版本固定策略。

限制与注意事项

使用前应先核对许可证、项目维护状态与安全边界。

链接

仓库：https://github.com/hiyouga/LLaMA-Factory
官网：https://llamafactory.readthedocs.io
README：https://raw.githubusercontent.com/hiyouga/LLaMA-Factory/main/README.md
Releases：https://github.com/hiyouga/LLaMA-Factory/releases

关联主题

AI
llm
lora
multimodal
llmops
github
cli
tool

关系图谱

摘要
一句话总结
关键点
功能与定位
典型使用场景
核心功能
特色与差异点
使用方式概览
限制与注意事项
链接
关联主题

Created with Quartz v4.5.2 © 2026

GitHub