gitwithmch
diff --git a/‎docs/source/train.md‎
Lines changed: 72 additions & 5 deletions b/‎docs/source/train.md‎
Lines changed: 72 additions & 5 deletions
diff --git a/‎easy_rec/python/builders/loss_builder.py‎
Lines changed: 75 additions & 1 deletion b/‎easy_rec/python/builders/loss_builder.py‎
Lines changed: 75 additions & 1 deletion
diff --git a/‎easy_rec/python/compat/weight_decay_optimizers.py‎
Lines changed: 2 additions & 1 deletion b/‎easy_rec/python/compat/weight_decay_optimizers.py‎
Lines changed: 2 additions & 1 deletion
@@ -80,17 +80,21 @@ EasyRec支持两种损失函数配置方式：1）使用单个损失函数；2
 
 #### 使用单个损失函数
 
-| 损失函数                                       | 说明                                                         |
+| 损失函数                                       | 说明                                                     |
 | ------------------------------------------ | ---------------------------------------------------------- |
 | CLASSIFICATION                             | 分类Loss，二分类为sigmoid_cross_entropy；多分类为softmax_cross_entropy |
 | L2_LOSS                                    | 平方损失                                                       |
-| SIGMOID_L2_LOSS                            | 对sigmoid函数的结果计算平方损失                                        |
+| SIGMOID_L2_LOSS                            | 对sigmoid函数的结果计算平方损失                                   |
 | CROSS_ENTROPY_LOSS                         | log loss 负对数损失                                             |
 | CIRCLE_LOSS                                | CoMetricLearningI2I模型专用                                    |
 | MULTI_SIMILARITY_LOSS                      | CoMetricLearningI2I模型专用                                    |
-| SOFTMAX_CROSS_ENTROPY_WITH_NEGATIVE_MINING | 自动负采样版本的多分类softmax_cross_entropy，用在二分类任务中                  |
-| PAIR_WISE_LOSS                             | 以优化全局AUC为目标的rank loss                                      |
-| F1_REWEIGHTED_LOSS                         | 可以调整二分类召回率和准确率相对权重的损失函数，可有效对抗正负样本不平衡问题                     |
+| SOFTMAX_CROSS_ENTROPY_WITH_NEGATIVE_MINING | 自动负采样版本的多分类softmax_cross_entropy，用在二分类任务中        |
+| BINARY_FOCAL_LOSS                          | 支持困难样本挖掘和类别平衡的focal loss                             |
+| PAIR_WISE_LOSS                             | 以优化全局AUC为目标的rank loss                                    |
+| PAIRWISE_FOCAL_LOSS                        | pair粒度的focal loss, 支持自定义pair分组                          |
+| PAIRWISE_LOGISTIC_LOSS                     | pair粒度的logistic loss, 支持自定义pair分组                       |
+| JRC_LOSS                                   | 二分类 + listwise ranking loss                                  |
+| F1_REWEIGHTED_LOSS                         | 可以调整二分类召回率和准确率相对权重的损失函数，可有效对抗正负样本不平衡问题 |
 
 - 说明：SOFTMAX_CROSS_ENTROPY_WITH_NEGATIVE_MINING
   - 支持参数配置，升级为 [support vector guided softmax loss](https://128.84.21.199/abs/1812.11317) ，
@@ -148,9 +152,72 @@ EasyRec支持两种损失函数配置方式：1）使用单个损失函数；2
     - ![f_beta score](../images/other/f_beta_score.svg)
   - f1_beta_square 即为 上述公式中的 beta 系数的平方。
 
+- PAIRWISE_FOCAL_LOSS 的参数配置
+  - gamma: focal loss的指数，默认值2.0
+  - alpha: 调节样本权重的类别平衡参数，建议根据正负样本比例来配置alpha，  $\frac{\alpha}{1-\alpha}=\frac{#Neg}{#Pos}$
+  - session_name: pair分组的字段名，比如user_id
+  - hinge_margin: 当pair的logit之差大于该参数值时，当前样本的loss为0，默认值为1.0
+  - ohem_ratio: 困难样本的百分比，只有部分困难样本参与loss计算，默认值为1.0
+  - temperature: 温度系数，logit除以该参数值后再参与计算，默认值为1.0
+
+- PAIRWISE_LOGISTIC_LOSS 的参数配置
+  - session_name: pair分组的字段名，比如user_id
+  - hinge_margin: 当pair的logit之差大于该参数值时，当前样本的loss为0，默认值为1.0
+  - ohem_ratio: 困难样本的百分比，只有部分困难样本参与loss计算，默认值为1.0
+  - temperature: 温度系数，logit除以该参数值后再参与计算，默认值为1.0
+
+- PAIRWISE_LOSS 的参数配置
+  - session_name: pair分组的字段名，比如user_id
+  - margin: 当pair的logit之差减去该参数值后再参与计算，即正负样本的logit之差至少要大于margin，默认值为0
+  - temperature: 温度系数，logit除以该参数值后再参与计算，默认值为1.0
+
+备注：上述 PAIRWISE_*_LOSS 都是在mini-batch内构建正负样本pair，目标是让正负样本pair的logit相差尽可能大
+
+- BINARY_FOCAL_LOSS 的参数配置
+  - gamma: focal loss的指数，默认值2.0
+  - alpha: 调节样本权重的类别平衡参数，建议根据正负样本比例来配置alpha，  $\frac{\alpha}{1-\alpha}=\frac{#Neg}{#Pos}$
+  - ohem_ratio: 困难样本的百分比，只有部分困难样本参与loss计算，默认值为1.0
+  - label_smoothing: 标签平滑系数
+
+- JRC_LOSS 的参数配置
+  - alpha: ranking loss 与 calibration loss 的相对权重系数；不设置该值时，触发权重自适应学习
+  - session_name: list分组的字段名，比如user_id
+  - 参考论文：《 [Joint Optimization of Ranking and Calibration with Contextualized Hybrid Model](https://arxiv.org/pdf/2208.06164.pdf) 》
+
 排序模型同时使用多个损失函数的完整示例：
 [cmbf_with_multi_loss.config](https://github.com/alibaba/EasyRec/blob/master/samples/model_config/cmbf_with_multi_loss.config)
 
+##### 损失函数权重自适应学习
+
+多目标学习任务中，人工指定多个损失函数的静态权重通常不能获得最好的效果。EasyRec支持损失函数权重自适应学习，示例如下：
+
+```protobuf
+      losses {
+        loss_type: CLASSIFICATION
+        learn_loss_weight: true
+      }
+      losses {
+        loss_type: BINARY_FOCAL_LOSS
+        learn_loss_weight: true
+        binary_focal_loss {
+          gamma: 2.0
+          alpha: 0.85
+        }
+      }
+      losses {
+        loss_type: PAIRWISE_FOCAL_LOSS
+        learn_loss_weight: true
+        pairwise_focal_loss {
+          session_name: "client_str"
+          hinge_margin: 1.0
+        }
+      }
+```
+
+通过`learn_loss_weight`参数配置是否需要开启权重自适应学习，默认不开启。开启之后，`weight`参数不再生效。
+
+参考论文：《Multi-Task Learning Using Uncertainty to Weigh Losses for Scene Geometry and Semantics》
+
 ## 训练命令
 
 ### Local
 
@@ -4,6 +4,10 @@
 
 import tensorflow as tf
 
+from easy_rec.python.loss.focal_loss import sigmoid_focal_loss_with_logits
+from easy_rec.python.loss.jrc_loss import jrc_loss
+from easy_rec.python.loss.pairwise_loss import pairwise_focal_loss
+from easy_rec.python.loss.pairwise_loss import pairwise_logistic_loss
 from easy_rec.python.loss.pairwise_loss import pairwise_loss
 from easy_rec.python.protos.loss_pb2 import LossType
 
@@ -20,6 +24,7 @@ def build(loss_type,
           num_class=1,
           loss_param=None,
           **kwargs):
+  loss_name = kwargs.pop('loss_name') if 'loss_name' in kwargs else 'unknown'
   if loss_type == LossType.CLASSIFICATION:
     if num_class == 1:
       return tf.losses.sigmoid_cross_entropy(
@@ -35,8 +40,60 @@ def build(loss_type,
     logging.info('%s is used' % LossType.Name(loss_type))
     return tf.losses.mean_squared_error(
         labels=label, predictions=pred, weights=loss_weight, **kwargs)
+  elif loss_type == LossType.JRC_LOSS:
+    alpha = 0.5 if loss_param is None else loss_param.alpha
+    auto_weight = False if loss_param is None else not loss_param.HasField(
+        'alpha')
+    session = kwargs.get('session_ids', None)
+    return jrc_loss(
+        label, pred, session, alpha, auto_weight=auto_weight, name=loss_name)
   elif loss_type == LossType.PAIR_WISE_LOSS:
-    return pairwise_loss(label, pred)
+    session = kwargs.get('session_ids', None)
+    margin = 0 if loss_param is None else loss_param.margin
+    temp = 1.0 if loss_param is None else loss_param.temperature
+    return pairwise_loss(
+        label,
+        pred,
+        session_ids=session,
+        margin=margin,
+        temperature=temp,
+        weights=loss_weight,
+        name=loss_name)
+  elif loss_type == LossType.PAIRWISE_LOGISTIC_LOSS:
+    session = kwargs.get('session_ids', None)
+    temp = 1.0 if loss_param is None else loss_param.temperature
+    ohem_ratio = 1.0 if loss_param is None else loss_param.ohem_ratio
+    hinge_margin = None
+    if loss_param is not None and loss_param.HasField('hinge_margin'):
+      hinge_margin = loss_param.hinge_margin
+    return pairwise_logistic_loss(
+        label,
+        pred,
+        session_ids=session,
+        temperature=temp,
+        hinge_margin=hinge_margin,
+        ohem_ratio=ohem_ratio,
+        weights=loss_weight,
+        name=loss_name)
+  elif loss_type == LossType.PAIRWISE_FOCAL_LOSS:
+    session = kwargs.get('session_ids', None)
+    if loss_param is None:
+      return pairwise_focal_loss(
+          label, pred, session_ids=session, weights=loss_weight, name=loss_name)
+    hinge_margin = None
+    if loss_param.HasField('hinge_margin'):
+      hinge_margin = loss_param.hinge_margin
+    return pairwise_focal_loss(
+        label,
+        pred,
+        session_ids=session,
+        gamma=loss_param.gamma,
+        alpha=loss_param.alpha if loss_param.HasField('alpha') else None,
+        hinge_margin=hinge_margin,
+        ohem_ratio=loss_param.ohem_ratio,
+        temperature=loss_param.temperature,
+        weights=loss_weight,
+        name=loss_name)
   elif loss_type == LossType.F1_REWEIGHTED_LOSS:
     f1_beta_square = 1.0 if loss_param is None else loss_param.f1_beta_square
     label_smoothing = 0 if loss_param is None else loss_param.label_smoothing
@@ -46,6 +103,23 @@ def build(loss_type,
         f1_beta_square,
         weights=loss_weight,
         label_smoothing=label_smoothing)
+  elif loss_type == LossType.BINARY_FOCAL_LOSS:
+    if loss_param is None:
+      return sigmoid_focal_loss_with_logits(
+          label, pred, sample_weights=loss_weight, name=loss_name)
+    gamma = loss_param.gamma
+    alpha = None
+    if loss_param.HasField('alpha'):
+      alpha = loss_param.alpha
+    return sigmoid_focal_loss_with_logits(
+        label,
+        pred,
+        gamma=gamma,
+        alpha=alpha,
+        ohem_ratio=loss_param.ohem_ratio,
+        sample_weights=loss_weight,
+        label_smoothing=loss_param.label_smoothing,
+        name=loss_name)
   else:
     raise ValueError('unsupported loss type: %s' % LossType.Name(loss_type))
 
 
@@ -411,7 +411,7 @@ def __init__(self,
 
 
 try:
-  from tensorflow.python.training import AdamAsyncOptimizer
+  from tensorflow.train import AdamAsyncOptimizer
 
   @tf_export('contrib.opt.AdamAsyncWOptimizer')
   class AdamAsyncWOptimizer(DecoupledWeightDecayExtension, AdamAsyncOptimizer):
@@ -472,4 +472,5 @@ def __init__(self,
           use_locking=use_locking,
           name=name)
 except ImportError:
+  print('import AdamAsyncOptimizer failed when loading AdamAsyncWOptimizer')
   pass