Enquête / source

Job offers collection and analysis system

Jocas

Face au développement des sites de recherche d'emploi en ligne, la Dares a décidé de collecter les offres d’emploi en ligne publiées sur une quinzaine de sites pour en faire une nouvelle base de données.

95 % des offres d'emploi ont été publiées en ligne en 2016, contre 53 % en 2005. Face au développement des sites de recherche d'emploi en ligne, la Dares a décidé de collecter les offres d’emploi en ligne publiées sur une quinzaine de sites pour en faire une nouvelle base de données.

Et pour cause, les millions d’offres d’emploi publiées en ligne chaque année permettent d’améliorer la compréhension du marché du travail. Il est effet, désormais possible d’accéder par ce biais à des informations nouvelles comme la description complète de l’offre ou les date et durée de mise en ligne.

La base Jocas vient ainsi s'ajouter aux sources de données habituellement utilisées sur les offres d’emploi et les emplois vacants, qu'elles soient administratives (STMT, DPAE, MMO) ou issues d'enquêtes statistiques (Acemo, BMO, EEC).

Comment ça marche ?

  • la Dares utilise le webscraping : des scripts récupèrent automatiquement avec l’accord des sites concernés les offres d'emploi mises en ligne ; 
  • elles sont catégorisées (par lieu, métier, contrat) notamment grâce à un algorithme de machine learning ;
  • les données récoltées sont utilisées dans les publications de la Dares.

Caractéristiques de la source

Périodicité Quotidienne
Champ statistique

Les offres d'emploi publiées sur 14 sites internet choisis de manière à  créer un ensemble couvrant tout le territoires, tous les types de métiers, de contrats et de qualifications. Ces sites : 

  • ont un stock journalier d’au moins 5 000 offres pour les sites spécifiques et 10 000 pour les sites généralistes ;
  • sont édités par des organismes dont le siège social est en France.

La base Jocas 2019 est constituée de plus de 5 millions d’offres dédupliquées et exploitables à
comparer aux 3,3 millions directement collectées par Pôle emploi en 2019.

Champ géographique France hors Mayotte.
Mode de collecte

La Dares a développé un outil ad hoc de scraping d’offres d’emploi en Python. 

Calendrier

Les offres publiées par un panel restreint mais diversifié de job boards français ont commencé a être collectées en septembre 2018.Depuis, d’autres sites ont été inclus : deux sites spécialisés sur les offres de cadre (en mars 2019 pour l’un et en octobre 2019 pour l’autre) et un site spécialisé dans les métiers du numérique (en octobre 2019). Ce panel de 14 sites n’est pas figé et est amené à évoluer.