Modèle de régression binomial négatif

Cela indique que le nombre de victimes connues pour les blancs est distribué en tant que poisson avec une moyenne et une variance égales à 0,09, tandis que le nombre de victimes connues pour les noirs est distribué en tant que poisson avec une moyenne et une variance égales à 0,52. Nous savons déjà, de notre analyse exploratoire, que les écarts observés étaient beaucoup plus importants, donc nous ne devrions pas être trop satisfaits des écarts estimés du modèle. Si nous examinons les comtes ajustées, nous verrons encore plus de preuves pour le manque d`ajustement: nous avons deux résidus normalisés de Pearson qui ne sont pas dans la fourchette, dont l`un a un effet de levier élevé. Nous rappelons également que la variable n-c n`était pas significative. Peut-être que le modèle sera amélioré si nous supprimons la version. Tout ce qui est nécessaire est de supprimer le type de version de la matrice de conception, supprimer la valeur de départ correspondante de la commande de maximisation, et exécuter le modèle à nouveau. Nous obtenons les statistiques d`évaluation suivantes et les valeurs résiduelles normalisées pour le modèle révisé avec le type de version de l`étude. Pour les occurrences d`événements discrets «contagieux», comme les flambées de tornades, les distributions polyA peuvent être utilisées pour donner des modèles plus précis que la distribution de poisson en permettant à la moyenne et à la variance d`être différentes, contrairement au poisson. Les événements «contagieux» ont positivement corrélé les occurrences causant une variance plus grande que si les occurrences étaient indépendantes, en raison d`un terme positif de covariance. Poursuivons notre description des variables dans ce jeu de données. Le tableau ci-dessous montre le nombre moyen de jours absents par type de programme et semble suggérer que le type de programme est un bon candidat pour prédire le nombre de jours absents, notre variable de résultat, parce que la valeur moyenne du résultat semble varier par Prog.

Les écarts à l`intérieur de chaque niveau de PROG sont plus élevés que les moyennes à l`intérieur de chaque niveau. Ce sont les moyens conditionnels et les variances. Ces différences suggèrent que la surdispersion est présente et qu`un modèle Binomiial négatif serait approprié. Hilbe recommande de tracer les résidus normalisés de Pearson versus, avec un ajustement de modèle médiocre indiqué par les résidus qui sont en dehors de l`intervalle lorsque l`effet de levier est élevé. Pour obtenir de plus amples informations sur notre modèle binomiial négatif, utilisons ses paramètres pour simuler des données et comparer les données simulées aux données observées. Ci-dessous nous chargeons le paquet de magrittr pour l`accès à l`opérateur de%>% qui nous permet de «enchaîner» des fonctions. Une approche qui aborde ce problème est la régression binomiale négative. La distribution binomiale négative, comme la distribution de poisson, décrit les probabilités de l`occurrence de nombres entiers supérieurs ou égaux à 0. Contrairement à la distribution de poisson, la variance et la moyenne ne sont pas équivalentes. Cela suggère qu`il pourrait servir d`approximation utile pour les dénombrements de modélisation avec une variabilité différente de sa moyenne.

La variance d`une distribution binomiale négative est une fonction de sa moyenne et a un paramètre supplémentaire, k, appelé le paramètre de dispersion. Disons que notre nombre est aléatoire variable Y à partir d`une distribution binomiale négative, lorsque la variance de Y est Supposons que Y est une variable aléatoire avec une distribution binomiale avec des paramètres n et p. Supposons p + q = 1, avec p, q ≥ 0. Ensuite, le théorème binomiale implique que les variables prédictives sont données et que les coefficients de régression de la population doivent être estimés. Les statistiques d`ajustement de modèle couramment utilisées comprennent la probabilité logarithmique, la déviance, la dispersion du Khi-carré de Pearson, le critère d`information d`Akour (AIC) et le critère d`information Bayésien (BIC). où sont le nombre d`échecs, k est le nombre de succès, et p est la probabilité de succès.

adminblog

Add your Biographical Info and they will appear here.