Concentration Inequalities for Two-Sample Rank Processes with Application to Bipartite Ranking - Equipe Signal, Statistique et Apprentissage Accéder directement au contenu
Article Dans Une Revue Electronic Journal of Statistics Année : 2021

Concentration Inequalities for Two-Sample Rank Processes with Application to Bipartite Ranking

Résumé

The ROC curve is the gold standard for measuring the performance of a test/scoring statistic regarding its capacity to discriminate between two statistical populations in a wide variety of applications, ranging from anomaly detection in signal processing to information retrieval, through medical diagnosis. Most practical performance measures used in scoring/ranking applications such as the AUC, the local AUC, the p-norm push, the DCG and others, can be viewed as summaries of the ROC curve. In this paper, the fact that most of these empirical criteria can be expressed as two-sample linear rank statistics is highlighted and concentration inequalities for collections of such random variables, referred to as two-sample rank processes here, are proved, when indexed by VC classes of scoring functions. Based on these nonasymptotic bounds, the generalization capacity of empirical maximizers of a wide class of ranking performance criteria is next investigated from a theoretical perspective. It is also supported by empirical evidence through convincing numerical experiments.
Fichier principal
Vignette du fichier
main_CleLimVay (1).pdf (4.1 Mo) Télécharger le fichier
1907f02b.pdf (47.85 Ko) Télécharger le fichier
fig_dist_v1.png (22.51 Ko) Télécharger le fichier
fig_roc_v1.png (23.12 Ko) Télécharger le fichier
locmww10.png (116.27 Ko) Télécharger le fichier
locmww10_zoom.png (85.14 Ko) Télécharger le fichier
locmww20.png (99.73 Ko) Télécharger le fichier
locmww20_zoom.png (75.35 Ko) Télécharger le fichier
locmww30.png (76.39 Ko) Télécharger le fichier
locmww30_zoom.png (62.74 Ko) Télécharger le fichier
locpol10.png (109.97 Ko) Télécharger le fichier
locpol10_zoom.png (83.66 Ko) Télécharger le fichier
locpol20.png (109.23 Ko) Télécharger le fichier
locpol20_zoom.png (76.22 Ko) Télécharger le fichier
locpol30.png (88.87 Ko) Télécharger le fichier
locpol30_zoom.png (65.59 Ko) Télécharger le fichier
locrocall10_RTB90.png (81.55 Ko) Télécharger le fichier
locrocall10_RTB90_zoom.png (83.41 Ko) Télécharger le fichier
locrocall20.png (78.49 Ko) Télécharger le fichier
locrocall20_zoom.png (69.59 Ko) Télécharger le fichier
locrocall30.png (71.84 Ko) Télécharger le fichier
locrocall30_zoom.png (66.74 Ko) Télécharger le fichier
locrtb9010.png (109.15 Ko) Télécharger le fichier
locrtb9010_zoom.png (76.37 Ko) Télécharger le fichier
locrtb9020.png (147.24 Ko) Télécharger le fichier
locrtb9020_zoom.png (82.9 Ko) Télécharger le fichier
locrtb9030.png (137.81 Ko) Télécharger le fichier
locrtb9030_zoom.png (73.34 Ko) Télécharger le fichier
locrtball20.png (82.49 Ko) Télécharger le fichier
locrtball20_zoom.png (87.68 Ko) Télécharger le fichier
locrtball30.png (76.68 Ko) Télécharger le fichier
locrtball30_zoom.png (68.56 Ko) Télécharger le fichier
losslocmww.png (17.08 Ko) Télécharger le fichier
losslocpol.png (18.4 Ko) Télécharger le fichier
losslocrtb90.png (23.74 Ko) Télécharger le fichier
lossscalemwwall.png (17.13 Ko) Télécharger le fichier
lossscalepolall.png (18.41 Ko) Télécharger le fichier
lossscalertb9all.png (19.99 Ko) Télécharger le fichier
main_CleLimVay.pdf (4.1 Mo) Télécharger le fichier
scale110all.png (70.64 Ko) Télécharger le fichier
scale110all_zoom.png (74 Ko) Télécharger le fichier
scale70all.png (71.65 Ko) Télécharger le fichier
scale70all_zoom.png (83.11 Ko) Télécharger le fichier
scale90all.png (75.5 Ko) Télécharger le fichier
scale90all_zoom.png (76.48 Ko) Télécharger le fichier
scalemww110.png (118.91 Ko) Télécharger le fichier
scalemww110_zoom.png (76.61 Ko) Télécharger le fichier
scalemww70.png (103.42 Ko) Télécharger le fichier
scalemww70_zoom.png (81.61 Ko) Télécharger le fichier
scalemww90.png (114.78 Ko) Télécharger le fichier
scalemww90_zoom.png (83.66 Ko) Télécharger le fichier
scalepol110.png (109.75 Ko) Télécharger le fichier
scalepol110_zoom.png (74.04 Ko) Télécharger le fichier
scalepol70.png (108.47 Ko) Télécharger le fichier
scalepol70_zoom.png (81.19 Ko) Télécharger le fichier
scalepol90.png (114.69 Ko) Télécharger le fichier
scalepol90_zoom.png (84.01 Ko) Télécharger le fichier
scalertb110.png (111.61 Ko) Télécharger le fichier
scalertb110_zoom.png (76.86 Ko) Télécharger le fichier
scalertb70.png (93.76 Ko) Télécharger le fichier
scalertb70_zoom.png (77.87 Ko) Télécharger le fichier
scalertb90.png (117.62 Ko) Télécharger le fichier
scalertb90_zoom.png (83.64 Ko) Télécharger le fichier
scalertball90_n70.png (56.5 Ko) Télécharger le fichier
scalertball90_n70_zoom.png (56.98 Ko) Télécharger le fichier
scoregenplot.png (33.34 Ko) Télécharger le fichier
scorephistatclass.png (40.79 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-03190532 , version 1 (06-04-2021)
hal-03190532 , version 2 (01-06-2022)
hal-03190532 , version 3 (08-11-2022)

Identifiants

Citer

Stéphan Clémençon, Myrto Limnios, Nicolas Vayatis. Concentration Inequalities for Two-Sample Rank Processes with Application to Bipartite Ranking. Electronic Journal of Statistics , 2021, 15 (2), pp.4659 -- 4717. ⟨10.1214/21-EJS1907⟩. ⟨hal-03190532v3⟩
369 Consultations
109 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More