Algorithmes d'apprentissage pour les grandes masses de données : Application à la classification multi-classes et à l'optimisation distribuée asynchrone

Doctorant: 
Bikash JOSHI
Date de soutenance: 
26 Sep 2017
co-encadrants: 
Nom: 
Massih-Reza Amini
Laboratoire de rattachement: 
LIG
Nom: 
Zaid Harchaoui
Laboratoire de rattachement: 
INRIA
Résumé: 

Le déluge de données (big data) auquel nous assistons ces dernières années bouleverse la vision traditionnelle en sciences et technologies de l'information, et en particulier en apprentissage statistique. Dans de nombreux problèmes réels, en particulier associés à la toile mais pas seulement, un flux massif de données est produit continuellement. Dans cette thèse, nous sommes intéressés à l'étude des algorithmes d'apprentissage qui peuvent passer à l'échelle; nous sommes plus particulièrement intéressés à la classification multi-classe et filtrage collaboratif. Ce dernier est couramment utilisé par les fournisseurs d'Internet comme Amazon, Netflix, Yahoo! et d'autres. Cependant, avec le nombre d'utilisateurs et d'articles en constante hausse, atteindre une prédiction de grande précision est un problème difficile. Ainsi, pour cette application, nous introduisons un cadre distribué asynchrone. En outre, nous proposons une nouvelle régularisation de la fonction objective qui tient compte des interactions utilisateurs / items similaires.