La route vers la cartographie intelligente

Comment choisir les meilleures données géospatiales? Étape 2

Comment choisir les meilleures données géospatiales? Étape 2

Étape 2: la recherche de données géospatiales

Pour revenir à l’étape 1, voir le premier GéoBillet de cette série: L’analyse des besoins

La recherche de données géospatiales n’est pas une tâche facile car il n’existe pas encore de portail unique de découverte de données géospatiales ou géorépertoire pour accéder à l’ensemble des données géospatiales disponibles malgré les efforts des infrastructures nationales de données géospatiales. Avant de débuter cette recherche, il est nécessaire d’avoir en tête les résultats de l’analyse des besoins préalablement réalisée (voir mon précédent billet) correspondant à:

  • ce que l’on cherche, la sémantique des objets → Quoi,
  • l’étendue spatiale → ,
  • l’étendue temporelle → Quand,
  • les analyses et les usages → Pourquoi, qui permettra de préciser le Quoi pertinent et définir Comment doivent être les données,
  • le genre de document (vectoriel, matriciel, MNT, etc.), les plages d’échelles ou de résolution spatiale et temporelles utilisées lors de la production des données, le système de coordonnées, le format des données, les critères de qualité recherchés, … → Comment sont les données,
  • les ressources monétaires et humaines dont on dispose → les Moyens.

Les portails de découverte de données géospatiales permettent de rechercher les données géospatiales à l’aide du Quoi et du Où. Certains portails permettent de raffiner cette recherche en offrant le Quand, une partie du Comment (genre de document et l’échelle de production ou résolution spatiale) et les moyens monétaires (gratuit ou non). Voyons maintenant plus en détail ces critères.

  • Quoi : Critère qui nous aiguille vers un portail particulier dans le cas où les thèmes recherchés sont très spécifiques comme des peuplements forestiers et le type de sol. Pour des thèmes plus génériques comme les routes et l’hydrographie, pratiquement tous les portails décriront ces types de données. Plusieurs portails utilisent des thésaurus (liste de termes synonymes et englobés/englobants) qui facilitent la recherche du Quoi.
  • : Critère qui aidera également à identifier les portails de recherche. Par exemple, pour une couverture mondiale, le portail Natural Earth offre des jeux de données gratuits sur plusieurs thèmes. Ce portail remplace le serveur de données Digital Chart of the World dont le contenu n’est plus tenu à jour. Pour une couverture canadienne, l’infrastructure canadienne de données géospatiales (ICDG) est une bonne porte d’entrée, puisqu’elle décrit près de 700 jeux de données vectoriels ou matriciels, disponibles sous différents formats. Au niveau provincial, le portail Québec géographique présente toutes les cartes, atlas et produits d’information géographique disponibles dans les ministères et organismes du gouvernement du Québec. On retrouve également des données géospatiales auprès de compagnies privées telles que NAVTEQ (couverture mondiale) et DMTI (couverture canadienne) qui les vendent. Le s’interroge par mot clé de lieu, par coordonnées, par numéro de feuillets cartographiques ou images satellitaires ou en délimitant une région sur une carte.
  • Quand : Critère facilement identifiable dans les jeux de données matricielles qui représentent l’état du territoire à une date précise ou une plage de dates précises dans le cas de plusieurs images. Il en est de même pour la plupart des jeux de données à grande échelle ayant pu être acquis sur une courte période de temps. Par contre, pour les jeux de données à petite échelle ou couvrant une grande étendue spatiale tel que le réseau routier national (RRN sur le site GéoBase), l’étendue temporelle pour le jeu de données complet peut être très grande (de 2003 à 2011 pour le RRN actuellement). Dans ces cas, le Quand est très dépendant du Où, du Quoi et du Comment, i.e. qu’il variera d’un endroit à l’autre, selon la couche d’information et selon la technique d’acquisition de données utilisée (image satellite, photographie aérienne, relevé terrestre, etc.). Dans ces conditions, le Quand devra être analysé plus en détail. Il n’est pas toujours possible d’effectuer une recherche sur le Quand dans les géorépertoires; la collecte de données historiques peut donc s’avérer plus laborieuse.
  • Comment : Le comment se compose de plusieurs critères. Certains sont faciles à identifier et font parfois partie des critères de recherche (type de document, échelle de production), alors que d’autres sont variables en fonction du temps et de l’espace (précision spatiale, complétude, précision thématique) et devront être analysés plus en détail dans les prochaines étapes afin de s’assurer qu’ils correspondent aux besoins.
  • Moyens monétaires : Certains portails s’annoncent comme étant des distributeurs de données gratuites tels que Géogratis et Open Street map. D’autres portails comme celui de l’ICGD et Statistique Canada permettent facilement de distinguer les données gratuites des données payantes. La Géoboutique quant à elle distribue des données payantes, de même que les compagnies privées. On retrouve aussi des données géospatiales dans certains ministères et municipalités mais la majorité ne diffusent pas d’information sur leurs données et n’ont pas de portail qui en permet la découverte. Il est alors nécessaire de les contacter pour savoir si les données peuvent être diffusées et si oui, s’il y un coût qui y est rattaché. Les risques que peuvent courir les producteurs en cas de mauvais usages de leurs données sont méconnus aujourd’hui et la plupart d’entre eux sont prudents face à la diffusion de leurs données car leur responsabilité peut être mise en jeu.
  • Cette collecte des données peut également permettre de conclure qu’il n’existe pas de jeux de données satisfaisant nos besoins ou ceux d’un client. Nous discuterons plus en détail de cette situation dans le Géobillet Étape 5 : Choix des meilleures sources de données.

    Suite à cette recherche, il maintenant nécessaire d’analyser plus en profondeur les jeux de données retenus afin de s’assurer qu’ils répondent aux besoins. Pour les jeux de données payants, il est souvent possible de se procurer un échantillon. Nous analyserons donc plus en profondeur le Quoi dans mon prochain GéoBillet Étape 3: Sélection des données géospatiales en 5 étapes - Évaluation du contenu des jeux de données retenus et le Comment et le Pourquoi dans le GéoBillet : Étape 4: Sélection des données géospatiales en 5 étapes - Évaluation de la qualité.

Ce billet est également disponible en: Anglais

Comments are closed.