Comment déterminer le type de loi de probabilité pour les données

Lorsque vous avez recueilli des données sur votre système ou d'un processus, la prochaine étape est de déterminer quel type de distribution de probabilité dont on dispose. Les types de distributions de probabilité sont: uniformes discrète, Bernoulli, binomiale, binomiale négative, Poisson, géométrique, uniformes continue, (courbe en cloche) normale, exponentielle, gamma et bêta distributions. Rétrécissement même quelques-uns de la liste des possibilités permet de déterminer qui est la valeur la plus proche R carré beaucoup plus rapide.

Choses que vous devez

  • logiciel graphique
  • Moyens de calcul de la valeur R carré (meilleure __gVirt_NP_NN_NNPS<__ analyse ajustement)

Instructions

  1. Tracer les données pour une représentation visuelle du type de données.

  2. Une des premières étapes pour déterminer ce que la distribution des données on a - et donc le type d'équation à utiliser pour modéliser les données - est d'exclure ce qu'elle ne peut pas être.

    • Si il ya des pics dans l'ensemble de données, il ne peut pas être une distribution uniforme discrète.




    • Si les données ont plus d'un pic, il est pas Poisson ou binomial.

    • Si elle a une seule courbe, pas de pics secondaires et a une pente lente de chaque côté, il peut être de Poisson ou une distribution gamma. Mais il ne peut pas être une distribution uniforme discrète.

    • Si les données sont uniformément répartie, et il est sans aucun biais vers un côté, il est sûr d'exclure un gamma ou de la distribution de Weibull.




    • Si la fonction a une distribution uniforme ou un pic au milieu des résultats en graphique, il est pas une distribution géométrique ou une distribution exponentielle.

    • Si la présence d'un facteur varie d'une variable d'environnement, il est probablement pas une distribution de Poisson.

  3. Après le type de distribution de probabilité a été réduit, faire une R carré analyse de chaque type possible de distribution de probabilité. L'un avec la plus haute valeur R carré est le plus susceptible correcte.

  4. Eliminer un point de données aberrantes. Puis recalculer R carré. Si le même type de distribution de probabilité qui se présente comme le match le plus proche, alors il ya un degré de confiance élevé que ce soit la distribution de probabilité correcte à utiliser pour l'ensemble de données.

Conseils & Avertissements

  • Si les données montrent de multiples pics une large dispersion, il est possible que deux processus distincts sont en cours ou le produit est échantillonné est mixte. Rappelez les données et puis re-analyser.
» » » » Comment déterminer le type de loi de probabilité pour les données