Application de la distribution de Poisson-Tweedie dans l’analyse des données de fréquence de crash

Jan 20, 2022
admin

Cet article décrit une étude qui applique la distribution de Poisson-Tweedie dans le développement de modèles de fréquence de crash. La distribution de Poisson-Tweedie offre un cadre unifié pour modéliser des données de comptage surexpersées, sous-dispersées, gonflées à zéro, spatiales et longitudinales, ainsi que de multiples variables de réponse de types similaires ou mixtes. La forme de sa fonction de variance est simple, et peut être spécifiée comme la moyenne ajoutée au produit de dispersion et la moyenne portée à la puissance P. La flexibilité de la distribution de Poisson-Tweedie réside dans le domaine de P, qui inclut des valeurs réelles positives. Les cas particuliers des modèles de distribution de Poisson-Tweedie incluent la forme linéaire du modèle binomial négatif (NB1) avec P égal à 1,0, le modèle géométrique de Poisson (GeoP) avec P égal à 1,5, la forme quadratique du modèle binomial négatif (NB2) avec P égal à 2.0, et le modèle Gaussien Inverse de Poisson (PIG) avec P égal à 3,0. Une série de modèles ont été développés dans cette étude en utilisant la distribution de Poisson-Tweedie sans aucune restriction sur la valeur du paramètre de puissance ainsi qu’avec des valeurs spécifiques du paramètre de puissance représentant les modèles NB1, GeoP, NB2 et PIG. Les effets des paramètres de dispersion fixes et variables (c.-à-d. la dispersion en fonction des covariables) sur la variance et les estimations de fréquence de crash prévues ont également été examinés. Trois années (2012-2014) de données sur les collisions provenant d’intersections urbaines à contrôle d’arrêt à trois jambes et d’intersections urbaines à signalisation à quatre jambes dans l’État de Floride ont été utilisées pour développer les modèles. Les modèles de Poisson-Tweedie ou les modèles GeoP se sont avérés plus performants lorsque le paramètre de dispersion était constant ou fixe. Avec le paramètre de dispersion variable, les modèles NB2 et PIG se sont avérés plus performants, les deux étant également performants. De plus, les valeurs des paramètres de dispersion fixes se sont avérées plus petites dans les modèles avec une valeur plus élevée du paramètre de puissance. La variation entre les modèles dans leurs estimations du facteur de poids, de la fréquence prévue des collisions et du potentiel d’amélioration de la sécurité des sites dangereux sur la base de la méthode empirique de Bayes a également été discutée.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.