Keď ste zhromaždili údaje o vašom systéme alebo procese, ďalším krokom je určiť, aký typ distribúcie pravdepodobnosti má. Typy rozdelenia pravdepodobnosti sú: diskrétna rovnorodosť, Bernoulliho, binomická, negatívna binomická, Poissonova, geometrická, kontinuálna jednotná, normálna (zvonovitá krivka), exponenciálna, gama a beta distribúcia. Zúženie niektorých zo zoznamu možností umožňuje oveľa rýchlejšie určiť, ktorá je najbližšia hodnota R na štvorčeku.
Položky, ktoré budete potrebovať
-
Grafický softvér
-
Prostriedky výpočtu hodnoty načítanej hodnoty R (najlepšia analýza)
Vytvorte údaje na vizuálne zobrazenie dátového typu.
Jeden z prvých krokov na určenie toho, čo má dátová distribúcia - a teda aj typ rovnice, ktorý sa používa na modelovanie dát - je vylúčiť to, čo to nemôže byť. • Ak sú v dátovom súbore nejaké špičky, nemôže to byť diskrétne rovnomerné rozdelenie. • Ak má dáta viac ako jeden vrchol, nie je to Poisson alebo binomický. • Ak má jednu krivku, žiadne sekundárne špičky a pomalý sklon na každej strane, môže to byť Poisson alebo gama distribúcia. Ale nemôže to byť diskrétne rovnomerné rozloženie. • Ak sú dáta rovnomerne rozložené a bez sklonu smerom k jednej strane je bezpečné vylúčiť distribúciu gama alebo Weibullu. • Ak má funkcia rovnomerné rozloženie alebo vrchol v strede grafov, nie je to geometrická distribúcia alebo exponenciálna distribúcia. • Ak sa výskyt faktora líši s environmentálnou premennou, pravdepodobne nejde o distribúciu Poissona.
Po tom, ako bol typ rozdelenia pravdepodobnosti zúžený, vykonajte R štvorcovú analýzu každého možného typu rozdelenia pravdepodobnosti. Najpravdepodobnejšia je tá s najvyššou hodnotou načítanej hodnoty R.
Odstráňte jeden nadbytočný dátový bod. Potom prepočítajte R na štvorcový. Ak sa vyskytuje ten istý typ distribúcie pravdepodobnosti ako najbližšia zhoda, potom existuje vysoká istota, že toto je správne rozdelenie pravdepodobnosti, ktoré sa má použiť pre súbor údajov.
Tipy
-
Ak údaje vykazujú rozdielne špičky so širokým rozptylom, je možné, že sa odohrávajú dva samostatné procesy alebo sa produkt, z ktorého sa odoberajú vzorky, zmieša. Zozbierajte údaje a potom znova analyzujte.
Výstraha
Overenie rovníc generovaných s neskoršími dátovými súbormi potvrďte, že sú pre daný súbor údajov stále presné. Je možné, že environmentálne faktory a drift procesu spôsobili, že súčasné rovnice a modely sú nesprávne.