Data-set cleansing practices and hydrological regionalization: is there any valuable information among outliers? - Archive ouverte HAL Access content directly
Journal Articles Hydrological Sciences Journal Year : 2010

Data-set cleansing practices and hydrological regionalization: is there any valuable information among outliers?

Pratiques de nettoyage de jeu de données et régionalisation : y a-t-il de l'information valuable parmi les horsains ?

(1) , (1) , (1) , (2)
1
2

Abstract

In hydrological regionalization studies, where one attempts to transfer information from gauged (donor) stations to ungauged (target) ones, the problem of data quality and reliability is often raised. Should all the available data be used? Or should some donor stations be considered unreliable for some reason and therefore discarded? In this article, we address these questions by proposing a new method to detect potentially undesirable stations: this method to identify outliers is based on the detection of catchments which do not fit in their neighbourhood. We apply this approach to a case of simple regionalization involving reference flows and compare it with the traditional outlier detection method. As expected, different outlier definitions lead to considerably different results, and the proposed method appears to perform noticeably better than the traditional one.
En régionalisation hydrologique, où l'on essaie de transférer de l'information de stations jaugées (donneuses) à des stations non jaugées (cibles), la question de la qualité et de la fiabilité des données est souvent posée. Faut-il utiliser toutes les stations donneuses disponibles? Ou faut-il au contraire écarter certaines stations que l'on considérerait comme douteuse pour une raison ou une autre? Dans cet article, nous abordons cette question en proposant une nouvelle approche pour détecter des stations potentiellement indésirables: cette méthode d'identification des horsains est fondée sur la détection des bassins versants incohérents avec leur voisinage. Cette approche est appliquée dans un cas de régionalisation simple (débits de référence), et nous la comparons avec l'approche de détection des horsains traditionnelle. Comme nous l'attendions, les différentes définitions de horsains donnent des résultats variés; la méthode proposée ici apparaît significativement meilleure.

Keywords

Not file

Dates and versions

hal-02594583 , version 1 (15-05-2020)

Identifiers

Cite

G. Boldetti, M. Riffard, Vazken Andréassian, L. Oudin. Data-set cleansing practices and hydrological regionalization: is there any valuable information among outliers?. Hydrological Sciences Journal, 2010, 55 (6), pp.941-951. ⟨10.1080/02626667.2010.505171⟩. ⟨hal-02594583⟩
14 View
0 Download

Altmetric

Share

Gmail Facebook Twitter LinkedIn More