10
10
'backbone_norm' : 'FrozeBN' ,
11
11
'res5_dilation' : False ,
12
12
'pretrained' : True ,
13
+ 'mae_pretrained' : False ,
13
14
'pretrained_weight' : 'imagenet1k_v1' ,
14
15
'max_stride' : 128 ,
15
16
'out_stride' : [8 , 16 , 32 , 64 , 128 ],
88
89
'backbone_norm' : 'FrozeBN' ,
89
90
'res5_dilation' : False ,
90
91
'pretrained' : True ,
92
+ 'mae_pretrained' : False ,
91
93
'pretrained_weight' : 'imagenet1k_v1' ,
92
94
'max_stride' : 128 ,
93
95
'out_stride' : [8 , 16 , 32 , 64 , 128 ],
166
168
'backbone_norm' : 'FrozeBN' ,
167
169
'res5_dilation' : False ,
168
170
'pretrained' : True ,
171
+ 'mae_pretrained' : False ,
169
172
'pretrained_weight' : 'imagenet1k_v1' ,
170
173
'max_stride' : 128 ,
171
174
'out_stride' : [8 , 16 , 32 , 64 , 128 ],
244
247
'backbone_norm' : 'FrozeBN' ,
245
248
'res5_dilation' : False ,
246
249
'pretrained' : True ,
250
+ 'mae_pretrained' : False ,
247
251
'pretrained_weight' : 'imagenet1k_v1' ,
248
252
'max_stride' : 128 ,
249
253
'out_stride' : [8 , 16 , 32 , 64 , 128 ],
322
326
'backbone_norm' : 'FrozeBN' ,
323
327
'res5_dilation' : False ,
324
328
'pretrained' : True ,
329
+ 'mae_pretrained' : False ,
325
330
'pretrained_weight' : 'imagenet1k_v1' ,
326
331
'max_stride' : 128 ,
327
332
'out_stride' : [8 , 16 , 32 , 64 , 128 ],
400
405
'backbone_norm' : 'FrozeBN' ,
401
406
'res5_dilation' : False ,
402
407
'pretrained' : True ,
408
+ 'mae_pretrained' : False ,
403
409
'pretrained_weight' : 'imagenet1k_v1' ,
404
410
'max_stride' : 128 ,
405
411
'out_stride' : [8 , 16 , 32 , 64 , 128 ],
479
485
'backbone_norm' : 'FrozeBN' ,
480
486
'res5_dilation' : False ,
481
487
'pretrained' : True ,
488
+ 'mae_pretrained' : False ,
482
489
'pretrained_weight' : 'imagenet1k_v2' ,
483
490
'max_stride' : 128 ,
484
491
'out_stride' : [8 , 16 , 32 , 64 , 128 ],
557
564
'backbone_norm' : 'FrozeBN' ,
558
565
'res5_dilation' : False ,
559
566
'pretrained' : True ,
567
+ 'mae_pretrained' : False ,
560
568
'pretrained_weight' : 'imagenet1k_v2' ,
561
569
'max_stride' : 128 ,
562
570
'out_stride' : [8 , 16 , 32 , 64 , 128 ],
635
643
'backbone_norm' : 'FrozeBN' ,
636
644
'res5_dilation' : False ,
637
645
'pretrained' : True ,
646
+ 'mae_pretrained' : False ,
638
647
'pretrained_weight' : 'imagenet1k_v2' ,
639
648
'max_stride' : 128 ,
640
649
'out_stride' : [8 , 16 , 32 , 64 , 128 ],
713
722
'backbone_norm' : 'FrozeBN' ,
714
723
'res5_dilation' : False ,
715
724
'pretrained' : True ,
725
+ 'mae_pretrained' : False ,
716
726
'pretrained_weight' : 'imagenet1k_v2' ,
717
727
'max_stride' : 128 ,
718
728
'out_stride' : [8 , 16 , 32 , 64 , 128 ],
784
794
'normalize_coords' : False ,
785
795
},
786
796
787
- # Real-time FCOS
788
- 'fcos_rt_r50_4x' :{
789
- # ----------------- Model-----------------
790
- ## Backbone
791
- 'backbone' : 'resnet50' ,
792
- 'backbone_norm' : 'FrozeBN' ,
793
- 'res5_dilation' : False ,
794
- 'pretrained' : True ,
795
- 'pretrained_weight' : 'imagenet1k_v1' ,
796
- 'max_stride' : 32 ,
797
- 'out_stride' : [8 , 16 , 32 ],
798
- ## Neck
799
- 'neck' : 'fcos_rt_pafpn' ,
800
- 'use_spp' : True ,
801
- 'spp_pooling_size' : 5 ,
802
- 'spp_act' : 'silu' ,
803
- 'spp_norm' : 'GN' ,
804
- 'depth' : 3 ,
805
- 'fpn_act' : 'silu' ,
806
- 'fpn_norm' : 'GN' ,
807
- 'fpn_depthwise' : False ,
808
- ## Head
809
- 'head' : 'fcos_head' ,
810
- 'head_dim' : 256 ,
811
- 'num_cls_head' : 4 ,
812
- 'num_reg_head' : 4 ,
813
- 'head_act' : 'silu' ,
814
- 'head_norm' : 'GN' ,
815
- ## Post-process
816
- 'train_topk' : 1000 ,
817
- 'train_conf_thresh' : 0.05 ,
818
- 'train_nms_thresh' : 0.65 ,
819
- 'test_topk' : 100 ,
820
- 'test_conf_thresh' : 0.5 ,
821
- 'test_nms_thresh' : 0.45 ,
822
- 'nms_class_agnostic' : True , # We prefer to use class-agnostic NMS in the demo.
823
- # ----------------- Label Assignment -----------------
824
- 'matcher' : 'simota' ,
825
- 'matcher_hpy' :{'soft_center_radius' : 2.5 ,
826
- 'topk_candidates' : 13 ,
827
- },
828
- # ----------------- Loss weight -----------------
829
- ## Loss hyper-parameters
830
- 'focal_loss_alpha' : 0.25 ,
831
- 'focal_loss_gamma' : 2.0 ,
832
- 'loss_cls_weight' : 1.0 ,
833
- 'loss_reg_weight' : 2.0 ,
834
- 'loss_ctn_weight' : 0.5 ,
835
- # ----------------- Training -----------------
836
- ## Training scheduler
837
- 'scheduler' : '4x' ,
838
- ## Optimizer
839
- 'optimizer' : 'sgd' ,
840
- 'base_lr' : 0.01 / 16 ,
841
- 'backbone_lr_ratio' : 1.0 / 1.0 ,
842
- 'momentum' : 0.9 ,
843
- 'weight_decay' : 1e-4 ,
844
- 'clip_max_norm' : - 1.0 ,
845
- ## LR Scheduler
846
- 'lr_scheduler' : 'step' ,
847
- 'warmup' : 'linear' ,
848
- 'warmup_iters' : 500 ,
849
- 'warmup_factor' : 0.00066667 ,
850
- ## Epoch
851
- 'max_epoch' : 48 , # 4x
852
- 'lr_epoch' : [32 , 44 ], # 4x
853
- # ----------------- Input -----------------
854
- ## Transforms
855
- 'train_min_size' : [320 , 352 , 384 , 416 , 448 , 480 , 512 , 544 , 576 , 608 , 640 ], # short edge of image
856
- 'train_min_size2' : [400 , 500 , 600 ],
857
- 'train_max_size' : 900 ,
858
- 'test_min_size' : 512 ,
859
- 'test_max_size' : 736 ,
860
- 'random_crop_size' : [320 , 608 ],
861
- ## Pixel mean & std
862
- 'pixel_mean' : [0.485 , 0.456 , 0.406 ],
863
- 'pixel_std' : [0.229 , 0.224 , 0.225 ],
864
- ## Transforms
865
- 'detr_style' : True ,
866
- 'trans_config' : None ,
867
- 'normalize_coords' : False ,
868
- },
869
-
870
797
}
0 commit comments