ArcFace PyTorch 实现

基于PyTorch实现的ArcFace（加性角度间隔损失）人脸识别项目，包含完整的训练和评估流程。

English | 简体中文

🎯 实验结果

我们训练的模型在LFW人脸验证测试上达到86%准确率，具体配置：

100个人物类别，1,624张训练图片（经过精心平衡的子集）
ResNet-18骨干网络（轻量级，97MB模型）
ArcFace + Focal Loss训练
CPU训练，耗时2小时

┌─────────────────────────────────────┐
│        LFW 验证测试结果              │
├─────────────────────────────────────┤
│ 准确率:         86.00%              │
│ 测试配对数:     6,000对             │
│ 最佳阈值:       0.1254              │
│ 判别间距:       0.3086 (优秀)       │
│                                     │
│ 同一人相似度:   0.31 ± 0.20         │
│ 不同人相似度:   0.01 ± 0.10         │
└─────────────────────────────────────┘

特性

完整流程：数据筛选 → 模型训练 → 性能评估
平衡数据集：从LFW智能采样（避免类别不平衡）
多种架构：ResNet-18/34/50，可选SE模块
先进损失函数：ArcFace、CosFace、Focal Loss、Softmax
LFW标准评估：使用6,000个配对的标准人脸验证协议
详细报告：全面的模型性能分析

安装

# 克隆仓库
git clone https://github.com/your-repo/arcface-pytorch.git
cd arcface-pytorch

# 安装依赖
pip install -r requirements.txt

快速开始

1. 准备数据

# 下载并解压LFW数据集到 data/datasets/lfw/lfw-align-128/

# 创建训练数据列表（自动选择平衡子集）
python create_train_list.py

2. 训练模型

# 使用默认配置训练（ResNet-18 + ArcFace + Focal Loss）
python train.py

3. 评估模型

# LFW配对快速验证
python validate_model.py

# 详细评估和特征分析
python evaluate_model.py

配置说明

编辑 config.yaml 自定义训练参数：

model:
  backbone: 'resnet18'      # resnet18/resnet34/resnet50
  metric: 'arc_margin'      # ArcFace损失 (s=30, m=0.5)
  use_se: false             # Squeeze-Excitation模块
  num_classes: 100

loss:
  type: 'focal_loss'        # focal_loss 或 cross_entropy
  gamma: 2                  # Focal loss的gamma参数

training:
  batch_size: 32            # 批次大小（越大越快但占用更多内存）
  max_epoch: 100
  lr: 0.001                 # 初始学习率
  lr_step: 20               # 每N轮衰减一次
  optimizer: 'sgd'          # SGD优化器，momentum=0.9
  weight_decay: 0.0005

paths:
  checkpoints_path: 'checkpoints'
  test_model_path: 'checkpoints/resnet18_best.pth'

项目结构

arcface-pytorch/
├── config/
│   └── yaml_config.py         # YAML配置加载器
├── data/
│   └── dataset.py             # 数据加载和预处理
├── models/
│   ├── resnet.py             # ResNet-18/34/50架构
│   ├── metrics.py            # ArcFace/CosFace度量
│   └── focal_loss.py         # Focal Loss实现
│
├── config.yaml               # 训练配置
├── train_list.txt            # 训练数据列表（1,624张图片）
├── lfw_test_pair.txt         # LFW验证配对（6,000对）
│
├── create_train_list.py      # 生成平衡训练数据
├── train.py                  # 训练脚本（ArcFace + Focal Loss）
├── validate_model.py         # 快速LFW验证
├── evaluate_model.py         # 详细评估和特征分析
│
├── checkpoints/              # 模型检查点
│   ├── resnet18_best.pth    # 最佳模型（86% LFW准确率）
│   └── resnet18_epoch*.pth  # 定期检查点
│
└── validation_report.md      # 详细性能报告

数据准备

训练数据筛选

我们从LFW（Labeled Faces in the Wild）数据集中精心选择训练子集：

数据筛选标准：

类别筛选：选择图片数≥10的人物（158个符合条件）
平衡采样：每个类别最多20张图片（避免类别不平衡）
最终数据集：选择前100个类别 → 共1,624张训练图片
数据分布：
- 43个类别有20张图片
- 57个类别有10-19张图片
- 平均：每类16.2张图片

为什么这样做？

✓ 平衡：避免过拟合到多数类（如George_W_Bush在原始LFW中有530张）
✓ 充足：100类 × 16张 = 足够的训练信号
✓ 真实：模拟每人样本有限的实际场景
✓ 快速：小数据集支持快速实验（CPU训练2小时）

生成训练列表：

python create_train_list.py

此脚本会：

扫描LFW目录并统计每个人物的图片数
选择图片最多的100个人物（每人≥10张）
对每人最多采样20张图片
打乱数据并写入train_list.txt，格式为：人物名/图片.jpg 标签

LFW测试数据集

下载LFW数据集
人脸对齐到128×128
lfw_test_pair.txt包含6,000个配对：
- 3,000个正样本对（同一人）
- 3,000个负样本对（不同人）

训练流程

训练原理

训练过程结合ArcFace度量学习和Focal Loss实现鲁棒的人脸识别：

1. 模型架构

输入图片（128×128灰度图）
    ↓
ResNet-18骨干网络（特征提取）
    ↓
512维特征向量（L2归一化）
    ↓
ArcMargin积层（角度间隔分类器，s=30, m=0.5）
    ↓
100维类别logits
    ↓
Focal Loss（γ=2，聚焦困难样本）

2. 训练配置（config.yaml）：

model:
  backbone: resnet18          # 特征提取器
  metric: arc_margin          # ArcFace (s=30, m=0.5)
  num_classes: 100

loss:
  type: focal_loss            # γ=2（降低简单样本权重）

training:
  batch_size: 32
  max_epoch: 100
  lr: 0.001                   # 初始学习率
  lr_step: 20                 # 每20轮衰减一次
  optimizer: sgd              # SGD，momentum=0.9
  weight_decay: 0.0005

3. 训练过程（100轮，CPU约2小时）：

第1-20轮：学习基础特征（LR=0.001）
第21-40轮：精炼特征（LR=0.0001）
第41-60轮：微调间隔（LR=0.00001）
第61-80轮：打磨特征（LR=0.000001）
第81-100轮：最终收敛（LR=0.0000001）

4. 关键训练特性：

ArcMargin损失：在特征空间添加角度间隔以获得更好的类别分离

# 标准Softmax：cos(θ)
# ArcFace：cos(θ + m)，其中m=0.5
# 效果：强制类内紧凑和类间分离

Focal Loss：聚焦困难样本

FL(p) = -(1-p)^γ * log(p)，其中γ=2
# 降低简单样本权重，强调困难负样本

检查点保存：保存最佳模型，每10轮保存定期快照

5. 运行训练：

# 默认使用config.yaml
python train.py

# 监控训练进度（每10批次打印一次）：
# Epoch [1/100] Batch [0/50] Loss: 4.2156 Acc: 0.0312
# Epoch [1/100] Batch [10/50] Loss: 3.8934 Acc: 0.1250
# ...
# Epoch 1/100 完成 - 用时: 81.2秒
#   平均Loss: 3.5421
#   平均Acc: 0.2341 (23.41%)

支持的模型

ResNet-18：轻量级，快速训练（本实现使用）
ResNet-34：平衡性能
ResNet-50：最高准确率

损失函数

ArcFace：加性角度间隔损失（默认）
CosFace：余弦间隔损失
Focal Loss：处理类别不平衡（默认）
Cross Entropy：标准分类损失

评估流程

评估原理

模型使用LFW（Labeled Faces in the Wild）验证协议进行评估：

1. LFW验证协议：

输入：6,000个人脸配对
- 3,000个正样本对（同一人）
- 3,000个负样本对（不同人）
任务：判断每对是否为同一人
指标：最优阈值下的验证准确率

2. 评估过程：

对于每个图片对(img1, img2)：
    1. 加载和预处理图片（灰度化、归一化）
    2. 应用水平翻转增强（生成img1_flip, img2_flip）
    3. 提取特征：
       - feature1 = model(img1)        # 512维向量
       - feature1_flip = model(img1_flip)
       - feature2 = model(img2)
       - feature2_flip = model(img2_flip)
    4. 合并特征：
       - f1 = concat(feature1, feature1_flip)  # 1024维
       - f2 = concat(feature2, feature2_flip)
    5. 计算余弦相似度：
       - similarity = (f1 · f2) / (||f1|| × ||f2||)
    6. 与阈值比较：
       - same_person = (similarity >= threshold)

找到最大化准确率的最优阈值

3. 评估指标：

指标	数值	说明
LFW准确率	86.00%	整体验证准确率
最优阈值	0.1254	最佳余弦相似度截断点
判别间距	0.3086	同一人/不同人的分离度

相似度分布分析：

同一人（正样本对）：
  - 平均相似度：0.3148 ± 0.1988
  - 范围：[-0.18, 0.86]
  - 解释：同一人的照片具有较高相似度

不同人（负样本对）：
  - 平均相似度：0.0062 ± 0.1017
  - 范围：[-0.31, 0.43]
  - 解释：不同人的相似度接近零

判别间距：0.3148 - 0.0062 = 0.3086
  ✓ 优秀的特征质量（>0.20为优秀）

4. 运行评估：

# 快速评估（6000对配对，约2分钟）
python validate_model.py

# 输出：
# [1/4] 加载配置和模型...
#   ✓ 模型加载成功
# [2/4] LFW配对验证...
#   处理进度: 6000/6000
#   ✓ 处理完成: 6000个有效配对
# [3/4] 计算准确率...
#   最佳准确率: 86.00%
#   最佳阈值: 0.1254
# [4/4] 相似度分布分析...
#   判别间距: 0.3086
#   特征判别性: 优秀

# 详细评估和特征分析
python evaluate_model.py

5. 理解结果：

86%准确率：我们的轻量级模型正确验证了6,000对中的5,160对
对比SOTA：现代方法达到99%+，但使用了：
- 更大数据集（数百万图片 vs 我们的1,624张）
- 更深网络（ResNet-100 vs 我们的ResNet-18）
- 更长训练（GPU上数天 vs CPU上2小时）
我们的优势：快速训练、小模型（97MB）、适合学习/原型开发

6. 错误分析：

14%的错误率（840对）通常包括：

假阳性（约7%）：不同人被判定为同一人
- 原因：相似外貌、姿态、光照
假阴性（约7%）：同一人被判定为不同人
- 原因：外貌变化大（年龄、表情、光照）

性能表现

我们的实现

配置	LFW准确率	训练时间	模型大小
ResNet-18 + ArcFace	86.00%	2小时（CPU）	97.9 MB
100类，1,624张图片	阈值: 0.1254	100轮	512维特征

判别质量：

间距：0.3086（优秀✓）
无过拟合（在独立LFW测试集上验证）
最佳模型出现在第90轮

与SOTA对比

模型	数据集	LFW准确率	备注
传统方法（PCA+SVM）	LFW	~70%	经典机器学习基准
我们的ResNet-18	LFW子集	86%	有限数据，快速训练
DeepFace (2014)	4M图片	97.35%	Facebook，大数据集
FaceNet (2015)	200M图片	99.63%	Google，海量数据
ArcFace (2019)	MS1MV2	99.83%	当前最先进

差距原因？

数据：我们用1,624张 vs 数百万张
模型：ResNet-18 vs ResNet-100
资源：CPU训练 vs 多GPU集群
目的：教学/原型 vs 生产系统

使用示例

完整工作流程

步骤1：准备训练数据

# 从LFW生成平衡训练列表
python create_train_list.py

# 输出：
# [1/5] 扫描LFW数据集
#   总人物数: 5749
#   符合条件的人物数 (>=10张): 158
# [2/5] 选择类别
#   选择类别数: 100
# [3/5] 采样图片（每类最多20张）
# [4/5] 打乱数据
#   总训练样本数: 1624
# [5/5] 写入文件: train_list.txt
#   ✓ 成功写入 1624 条记录

步骤2：训练模型

# 使用默认配置训练（ResNet-18 + ArcFace + Focal Loss）
python train.py

# 训练进度：
# ============================================================
# 开始训练
# ============================================================
# 从 config.yaml 加载配置...
# 使用设备: cpu
#
# 加载训练数据...
# ✓ 训练数据: 1624 张图片
# ✓ 批次数: 50
#
# Epoch [1/100] Batch [0/50] Loss: 4.2156 Acc: 0.0312
# Epoch [1/100] Batch [10/50] Loss: 3.8934 Acc: 0.1250
# ...
# ============================================================
# Epoch 1/100 完成 - 用时: 81.2秒
#   平均Loss: 3.5421
#   平均Acc: 0.2341 (23.41%)
#   学习率: 0.001000
# ============================================================
# ✓ 保存最佳模型: checkpoints/resnet18_best.pth (准确率: 23.41%)

步骤3：验证模型

# LFW配对快速验证（6000对，约2分钟）
python validate_model.py

# 结果：
# ================================================================================
# [1/4] 加载配置和模型...
#   ✓ 模型加载成功
# [2/4] LFW配对验证...
#   处理进度: 6000/6000
#   ✓ 处理完成: 6000个有效配对
# [3/4] 计算准确率...
#   最佳准确率: 86.00%
#   最佳阈值: 0.1254
# [4/4] 相似度分布分析...
#   同一人 (正样本): 0.3148 ± 0.1988
#   不同人 (负样本): 0.0062 ± 0.1017
#   判别间距: 0.3086
#   特征判别性: 优秀
# ================================================================================

高级用法

监控训练进度：

# 实时查看训练日志
tail -f training.log

# 查看最新检查点
ls -lht checkpoints/ | head -5

评估特定检查点：

# 修改config.yaml
paths:
  test_model_path: 'checkpoints/resnet18_epoch50.pth'

# 运行验证
python validate_model.py

提取人脸特征：

import torch
from models import resnet_face18

# 加载模型
model = resnet_face18(use_se=False)
model.load_state_dict(torch.load('checkpoints/resnet18_best.pth'))
model.eval()

# 提取特征
with torch.no_grad():
    features = model(image_tensor)  # 返回512维向量

# 使用余弦相似度比较人脸
similarity = torch.nn.functional.cosine_similarity(feat1, feat2)
same_person = similarity > 0.1254  # 使用验证得到的阈值

预训练模型

下载LFW数据集：

链接：https://pan.baidu.com/s/1tFEX0yjUq3srop378Z1WMA
密码：b2ec
模型：ResNet-18（无SE模块）

数据集目录结构：

下载并解压LFW数据集后，请按照以下目录结构组织文件：

arcface-pytorch/
├── data/
│   └── datasets/
│       └── lfw/
│           ├── lfw-align-128/          # LFW对齐数据集（128×128）
│           │   ├── Aaron_Eckhart/      # 人物文件夹
│           │   │   ├── Aaron_Eckhart_0001.jpg
│           │   │   └── ...
│           │   ├── George_W_Bush/
│           │   │   ├── George_W_Bush_0001.jpg
│           │   │   └── ...
│           │   └── ...                 # 5749个人物文件夹
│           └── test/                   # （可选）测试数据集
│               ├── Aaron_Eckhart/
│               └── ...
├── train_list.txt                      # 训练数据列表（由create_train_list.py生成）
└── lfw_test_pair.txt                   # LFW测试配对（6000对）

说明：

lfw-align-128/：包含所有LFW数据集，每个人物一个文件夹，文件夹内包含该人物的所有人脸图片
训练脚本会从lfw-align-128/中读取数据
确保config.yaml中的路径设置为：train_root: './data/datasets/lfw/lfw-align-128'

预训练模型可参考 CosFace_pytorch项目：

链接：https://pan.baidu.com/s/1uOBATynzBTzZwrIKC4kcAA
密码：69e6

常见问题

CUDA内存不足：减小批次大小
找不到数据集：检查config.yaml中的路径
准确率低：确保数据预处理正确

系统要求

Python 3.7+
PyTorch 1.8+
CUDA 10.2+（GPU训练）
推荐8GB+显存

参考文献

许可证

MIT License

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
config		config
models		models
utils		utils
.gitignore		.gitignore
README.md		README.md
README_EN.md		README_EN.md
config.yaml		config.yaml
create_train_list.py		create_train_list.py
evaluate_model.py		evaluate_model.py
lfw_test_pair.txt		lfw_test_pair.txt
requirements.txt		requirements.txt
setup.py		setup.py
train.py		train.py
train_list.txt		train_list.txt
training_analysis_report.md		training_analysis_report.md
validate_model.py		validate_model.py
validation_report.md		validation_report.md

Folders and files

Latest commit

History

Repository files navigation

ArcFace PyTorch 实现

🎯 实验结果

特性

安装

快速开始

1. 准备数据

2. 训练模型

3. 评估模型

配置说明

项目结构

数据准备

训练数据筛选

LFW测试数据集

训练流程

训练原理

支持的模型

损失函数

评估流程

评估原理

性能表现

我们的实现

与SOTA对比

使用示例

完整工作流程

高级用法

预训练模型

常见问题

常见问题

系统要求

参考文献

许可证

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages