PRELUCRARE STATISTICA A SIRURILOR DE DATE ELIMINAREA VALORILOR ABERANTE A. Scopul lucrarii: Se urmarete realizarea urmatoarelor obiective: - prezetarea metodelor de aaliza i vederea depitarii şi elimiarii valorilor aberate; - prezetarea idicatorilor tatitici eceari aplicării metodelor de aaliza critica a irurilor de date; - prezetarea otiuilor geerale legate de geerarea irurilor de date utilizad oftware-ul Excel; - prezetarea uei aplicaţii; B. Notiui de baza: Daca i curul uei mauratori repetate e obti rezultate care ut mult diferite fata de celelalte marea majoritate a rezultatelor ete de preupu ca -au iregitrat erori. Itrucat rezultatele diparate (aberate) pot avea o iflueta diproportioat de mare aupra valorii medii, e impue ca de idata ce au fot cotatate, a e verifice daca coditiile de efectuare a mauratorilor ut corepuzatoare. Atuci cad u au fot eizate ituatii deoebite (defecte tehologice), i curul mauratorilor ete ecear a e aalizeze oportuitatea elimiarii datelor aberate i faza de prelucrare tatitica a rezultatelor. Aceata operatie ete poibila pe baza uor tete care impu alegerea uei probabilitati fuctie de care e ia decizia de patrare au elimiar a lor. Aceata verificare a irurilor de date/ a eatioului obtiut poarta deumirea de aaliza critica a datelor, iar metodele care e aplica ut: tetul IRWIN, tetul GRUBBS i tetul ROMANOWSKI.. Tetul IRWIN (tetul λ) Daca irul de date e ordoeaza i e crecator au decrecator, valorile uceptibile a fi aberate ut cele de la extremitatile irului. Petru verificarea valorii upecte e calculeaza valoarea: x x 0 0 (3.) Ude: x 0 ete valoarea uceptibila a fi aberata iar ete abaterea medie patratica a irului celor x, x,, x date, determiata cu relatia: (3.) = Diperia fiid data la radul au de relatia: (3.3) = = ( x)
64 Lucrarea 3 Valorile critice ale metodelor de aaliza critica a irurilor ale aplicatiilor cel mai frecvet utilizate, tabilite petru u ivel de icredere/ ric propu, e gaec tabelate i tabelul 3.. Atfel, comparad valoarea lui λ cu valoarea critica λ critic (tabilita i tabelul 3.), valoarea x 0 e elimia di irul de date daca: λ λ critic (3.4) I caz cotrar u ut motive uficiete petru aceata. Daca valoarea x 0 a fot elimiata e recalculeaza abatera medie patratica petru cele - valori ramae i tetul e aplica di ou, proceul cotiuad paa cad u e mai elimia date ale irului. Obervatie: tetului IRWIN u ete uficiet i cazul care, i cadrul irului de date exita mai multe valori upecte, iar valoarea diperiei ete mare, i acet caz fiid eceara aplicarea celorlalte metode.. Tetul GRUBBS (tetul u) Acet tet e aplica i geeral irurilor mari de date (>00), metoda de elimiare cotad i compararea valorii diparate x 0 cu valoarea medie x, calculata cu expreia: Se va determia raportul: = x x (3.6) Comparad valoarea u cu valoarea critica u critic (di tabelul 3.) petru u ivel de icredere propu, valoarea x e elimia di irul de date daca: u u critic (3.7) I caz cotrar, e impue cocluzia ca u exita motive uficiete de elimiare a valorii x 0. 3. Tetul ROMANOWSKI (tetul t) Acet tet preupue de aemeea o metoda de elimiare ce cota i compararea valorii diparate x 0 cu valoarea medie x, corepuzatoare celorlalte - valori di irul de rezultate, el aplicadu-e petru u ir de valori, <00. I acet caz, calculul valorii medii x, e realizeaza cu formula: x + x + K + x (3.8) x = De aemeea ete ecear a e calculeze abaterea medie patratica, eglijadu-e valoarea diparata x 0, (petru - valori). I cotiuare e determia raportul: x 0 x Rezultatul acetui raport e compara cu valorile critice (tabelul 3.) tabilite petru u ric propu, iar daca valoarea t depaete valoarea t critic : t t critic (3.0) (3.5) (3.9)
Prrelucrarea tatitica a irurilor de date Elimiarea valorilor aberate 65 atuci rezultatul x 0 poate fi elimiat cu o igurata a cocluziei de cel puţi cea propua. I caz cotrar, e impue cocluzia ca u exita motive uficiete de elimiare a valorii x 0. Tab.3. Deumirea tetului IRWIN GRUBBS ROMANOVSKI Expreia aalitica a tetului x x 0 x Numarul datelor Nivelul de icredere/ Ric (%) irului 0.95 0.98 0.99 0.95 0.98 0.99 0.95 0.98 0.99 3 4 5 6 7 8 9 0 3 4 5 6 7 8 9 0.79.64.5.39.3.4.0.8.4..09.07.06.05.04.03.03.03.7.05.93.8.69.57.5.46.43.4.39.37.35.33.3.9.8.7.90.75.60.45.30.6.09.03.00.97.94.9.88.86.84.8.8.80 4.93 3.56 3.04.78.6.5.43.37.33.9.6.4..0.8.7.6.5 8.04 5.08 4. 3.64 3.36 3.8 3.05.96.89.83.78.74.7.68.66.64.6.60 9.46 6.53 5.04 4.36 3.96 3.7 3.54 3.4 3.3 3.3 3.7 3. 3.08 3.04 3.0 3.00.95.93.4.7.9.07.8.7.35.4.47.5.56.60.64.67.70.73.75.78.4.7.96.3.7.37.46.54.6.66.7.76.80.84.87.90.93.96.4.73.97.6.3.43.53.6.69.75.8.86.9.95.98 3.0 3.05 3.08 Obervatie: Am prezetat i cadrul Lucrarii, Itroducerea i programul Excel. Achizitii de date şi reprezetari grafice, itroducerea diferitelor tipuri de date (care pot fii de tip text, cifre, date caledaritice, ore, formule, fuctii). Aceta i cazul i care avem datele repective obtiute i urma mauratorilor. Excel ofera i plu şi poibilitatea geerarii uui ir de date, petru aceata fiid eceari parcurgerea urmatorilor pai: 3 0 4 5 Fig..7: Geerarea de iruri de date 6 7 8 9 - electati optiuea Tool, Data Aalyi (Itrumete, Aaliza datelor..);
66 Lucrarea 3 - electati di caeta de dialog care -a dechi optiuea Radom Number Geeratio (Geerarea irurilor de umere); 3- executati clic aupra butoului ok; I caeta de dialog care e dechide electati: 4- Number of Variable (Numarul variabilelor); 5- Number of Radom Number (Numarul radurilor de geerare); 6- Ditributio, Normal (Ditributia, Normala); 7- Mea (Media); 8- Stadard Deviatio (Abaterea tadard); 9- Output Rage (Afiarea geerarii), electatd/itroducad domeiul (radul/coloaa) ude dorim a fie afiat irul de date geerat; 0- Executati clic aupra butoului ok. C. Defaurarea lucrarii:. Tema: Maurad reziteta la rupere a uui material e efectueaza o erie de mauratori obtiadu-e următoarele valori (i dan): 64, 69, 76, 7, 67, 67, 79, 76, 89, 49, 8, 84, 7, 7, 74, 69, 74, 76, 74. - a e verifice datele aberate; - a e realizeze aaliza critica a datelor, aplicadu-e cele trei metodele de aaliza; - a e prezite decizia petru ricul propu; ivelul de icredere adoptat fiid de 0.95% (ric de 5%).. Prelucrarea rezultatelor: Pe baza relatiilor prezetate i lucrare vom determia:.- verificarea datelor aberate, u criteriu implu fiid acela de ortare a valorilor irului; determiarea valorilor de miim, x mi şi a celor de maxim, x max, utilizad optiuile de ortare (Sort) oferite de Excel, parcurgad paii: - electati optiuea Data, Sort... (Date, Sortare); - electati di cauta de dialog care e dechide optiuea de ortare Acedig (Crecator); atfel pe prima pozitie/celula a irului e va vizualiza valoarea de miim, x mi, iar pe ultima pozitie/celula valoarea de maxim, x max, a irului. I cazul otru: x mi = 49 iar x max = 89; Se oberva ca valoarea x mi e ideparteaza foarte mult de retul valorilor, exitad poibilitatea ca aceata a fie o valoare aberata petru ivelul de icredere adoptat, ricul de 5%... - realizarea aalizei critice a datelor, aplicadu-e cele trei metodele de verificare, aceata preupuad: - determiarea mediei aritmetica, diperiei şi a abaterii medie patratica; - determiarea valorilor λ, u şi t, i cazul celor trei metode de aaliza critica a datelor;...- determiarea mediei aritmetica, diperiei şi a abaterii medie patratica, utilizad formulele (3.5), (3.3), (3.): Media aritmetica. I cazul determiarii mediei aritmetice avem: Utilizad Excel, relatia e va crie: x =
Prrelucrarea tatitica a irurilor de date Elimiarea valorilor aberate 67 =SUM($A$:$A$9)/9 obtiad atfel valoarea x =7.84 Aceata ocupad i cotiare adrea D4, i cadrul foii de calcul Excel. Diperia. Petru valorile x, x,.., x diperia e obtie cu relatia: = = ( x) I calculul diperiei (şi implicit i i calculul valorii abaterii medii patratice), i fuctie de metoda de aaliza critica a datelor, luam au u i calcul valoarea aberata aalizata. Atfel vom avea:. cazul tetului IRWIN. Avad rezultatele aterioare (adică valoarea mediei aritmetice M[, care e afla la adrea D4), e va aplica fuctia: =(SUM(POWER(($A$:$A$8-$D$4),)))/9, obtiad valoarea = =0.777 valoare ce va ocupa i cotiuare adrea D5.. cazul tetului GRUBBS şi ROMANOWSKI, ude e va aplica fuctia: =(SUM(POWER(($A$:$A$8-$D$4),)))/8, obtiad valoarea = =0.80 (deoarece i cazul otru valoarea aberata ocupa prima pozitie di irul de valori, şi deci implicit, prima adrea: A), valoare ce va ocupa i cotiuare adrea E5. Abaterea medie patratica, e calculeaza cu formula. = Utilizad fuctiile Excel vom avea: =POWER($D$5,/) şi =POWER($E$5,/) obtiad cele doua valori petru fiecare caz i parte. Atfel vom avea valoarea D [] x ==0.88, i cazul tetului IRWIN (valoare ce va ocupa i cotiuare adrea D6) şi valoarea D [] x ==0.906, i cazul tetului GRUBBS şi ROMANOWSKI (valoare ce va ocupa adrea E6)....- determiarea valorilor λ, u şi t, i cazul celor trei metode de aaliza critica a datelor, e va realiza utilizad formulele (3.), (3.6), (3.9) şi valorile aterior determiate (valorile mediei aritmetice, diperiei i valorile abaterii medii patratice):. cazul tetului IRWIN 0 Utilizad Excel avem: = ABS(($A$-$A$)/$D$6), obtiad valoarea λ=7.07, valoare ce va ocupa adrea D8;. cazul tetului GRUBBS. Se va determia raportul: x atfel: =ABS($A$-$D$4)/$E$6, obtiad valoarea u=6.38, valoare ce va ocupa adrea D9;. cazul tetului ROMANOWSKI. Se determia raportul: Raport care utilizad Excel e va ota: x x 0 x
68 Lucrarea 3 =ABS($A$-$D$4)/($E$6*POWER(9/8,/)), obtiad valoarea t=5.65, valoare ce va ocupa adrea D0;.3.-prezetarea deciziei petru ricul propu; Di tabelul 3. vom lua valorile critice petru cele trei metode de aaliza critica a datelor, petru ivelul de icredere propu de 95% (ric de 5%). Atfel e vor gai valorile: λ critic =.03, u critic =.6, t critic =.75 Se vor utiliza i cotiuare relatiile (3.4), (3.7), (3.0), petru a compara valorile critice tabilite i tabel petru ivelul de icredere propu şi valorile calculate. Utilizad fuctiuile Excel aceata calculatie e va realiza utilizad expreiile: =MAX ($D$8,$F$8) obtiad ca valoare maxima valoarea adreei $D$8, λ=7.07; Atfel ca: λ λ critic, ude 7.07>.03 I cazul compararii valorilor obtiute i cazul tetului GRUBBS, vom avea: =MAX ($D$9,$F$9) obtiad ca valoare maxima valoarea adreei $D$9, u=6.38; Adică: u u critic, ude 6.38>.6 I cazul tetului ROMANOWSKI, comparatia e va realiza utilizad expreia: =MAX ($D$0,$F$0) obtiad ca valoare maxima valoarea adreei $D$0, t=5.65; Altfel pu: t t critic, ude 5.65>.75 Se impue atfel cocluzia ca exita motive uficiete de elimiare a valorii aberate x 0, cocluzie prezetata i tabelar, tabelul 3.: Tab.3. TESTUL IRWIN TESTUL GRUBBS TESTUL ROMANOWSKI x = = 7.84 x = = 7.84 x = = 7.84 = = ( x) = = ( x) = = ( x) x x S = 0.777; S = 0.88 S = 0.80; S = 0.906 S = 0.80; S = 0.906 λ49 = 7.07 u49 = 6.38 t49 = 5.65 λcritic =.03 ucritic =.6 tcritic =.75 7.07 >.03 6.38 >.6 5.65 >.75 49 e elimia 49 e elimia 49 e elimia 3. Tema: Utilizad fuctiuile oferite de catre oftware-ul Excel geerati u ir de date, =50, i cadrul căruia itroduceti aleator o valoare diparata. - a e verifice datele aberate; - a e realizeze aaliza critica a datelor, aplicadu-e cele trei metodele de aaliza; - a e prezite decizia petru ricul propu;
Prrelucrarea tatitica a irurilor de date Elimiarea valorilor aberate 69 ivelul de icredere adoptat fiid de 0.99% (ric de %). 4. Prelucrarea rezultatelor:.- Pe baza celor eutate aterior e va iteroduce u ir de date, =50, utilizad oftware-ul Excel, şi aume: - electati optiuea Tool, Data Aalyi (Itrumete, Aaliza datelor..); - electati di caeta de dialog care -a dechi optiuea Radom Number Geeratio (Geerarea irurilor de umere); 3- executati clic aupra butoului ok; I caeta de dialog care e dechide electati: 4- Number of Variable (Numarul variabilelor): 50; 5- Number of Radom Number (Numarul radurilor de geerare): ; 6- Ditributio, Normal (Ditributia, Normala): 7- Mea (Media): 0; 8- Stadard Deviatio (Abaterea tadard): 0.; 9- Output Rage (Afiarea geerarii), electatd/itroducad domeiul (radul/coloaa) ude dorim a fie afiat irul de date geerat; 0- Executati clic aupra butoului ok. Se va itroduce apoi aleator o valoare diparata, de exemplu valorarea: 0, urmad ca şi i cazul aterior pe baza relatiilor prezetate i lucrare a determiam:.- verificarea datelor aberate, u criteriu implu fiid acela de ortare a valorilor irului; determiarea valorilor de miim, x mi şi a celor de maxim, x max, utilizad optiuile de ortare (Sort) oferite de Excel, parcurgad paii: 3- electati optiuea Data, Sort... (Date, Sortare); 4- electati di cauta de dialog care e dechide optiuea de ortare Acedig (Crecator); atfel pe prima pozitie/celula a irului e va vizualiza valoarea de miim, x mi, iar pe ultima pozitie/celula valoarea de maxim, x max, a irului. I cazul otru: x mi = 9.944 iar x max = 0; Se oberva ca valoarea x max e ideparteaza foarte mult de retul valorilor, exitad poibilitatea ca aceata a fie o valoare aberata petru ivelul de icredere adoptat, ricul de %..3. - realizarea aalizei critice a datelor, aplicadu-e cele trei metodele de verificare, aceata preupuad: - determiarea mediei aritmetica, diperiei şi a abaterii medie patratica; - determiarea valorilor λ, u şi t, i cazul celor trei metode de aaliza critica a datelor;.3..- determiarea mediei aritmetica, diperiei şi a abaterii medie patratica, utilizad formulele (3.5), (3.3), (3.): Media aritmetica. I cazul determiarii mediei aritmetice avem: Utilizad Excel, relatia e va crie: = x =SUM($A$:$EU$)/5 obtiad atfel valoarea x =0.084 Aceata ocupad i cotiare adrea D6, i cadrul foii de calcul Excel. Diperia. Petru valorile x, x,.., x diperia e obtie cu relatia: = = ( x)
70 Lucrarea 3 La fel ca şi i cazul aterior, i calculul diperiei (şi implicit i i calculul valorii abaterii medii patratice), i fuctie de metoda de aaliza critica a datelor, luam au u i calcul valoarea aberata aalizata. Atfel vom avea:. cazul tetului IRWIN. Avad rezultatele aterioare (adică valoarea mediei aritmetice M[, care e afla la adrea D6), e va aplica fuctia: =(SUM(POWER(($A$:$EU$-$D$6),)))/5, obtiad valoarea = =0.5 valoare ce va ocupa i cotiuare adrea D7.. cazul tetului GRUBBS şi ROMANOWSKI, ude e va aplica fuctia: =(SUM(POWER(($A$:$ET$-$D$6),)))/50, obtiad valoarea = =0.058 (deoarece i cazul otru valoarea aberata ocupa ultima pozitie di irul de valori, şi deci implicit, adrea: EU), valoare ce va ocupa i cotiuare adrea E7. Abaterea medie patratica, e calculeaza cu formula. = Utilizad fuctiile Excel vom avea: =POWER($D$7,/) şi =POWER($E$7,/) obtiad cele doua valori petru fiecare caz i parte. Atfel vom avea valoarea D [] x ==0.389, i cazul tetului IRWIN (valoare ce va ocupa i cotiuare adrea D8) şi valoarea D [] x ==0.40, i cazul tetului GRUBBS şi ROMANOWSKI (valoare ce va ocupa adrea E8)....- determiarea valorilor λ, u şi t, i cazul celor trei metode de aaliza critica a datelor, e va realiza utilizad formulele (3.), (3.6), (3.9) şi valorile aterior determiate (valorile mediei aritmetice, diperiei i valorile abaterii medii patratice):. cazul tetului IRWIN 0 Utilizad Excel avem: =ABS(($EU$-$ET$)/$D$8), obtiad valoarea λ=5,43 ce ocupa adrea D0;. cazul tetului GRUBBS. Se va determia raportul: x atfel: =ABS($ET$-$D$6)/$E$8, obtiad valoarea u=4,347 valoare ce va ocupa adrea D;. cazul tetului ROMANOWSKI. Se determia raportul: x Raport care utilizad Excel e va ota: =ABS($ET$-$D$6)/($E$8*POWER(5/50,/)), obtiad valoarea t=4,0 valoare ce va ocupa adrea D;.3.-prezetarea deciziei petru ricul propu; Di tabelul 3. vom lua valorile critice petru cele trei metode de aaliza critica a datelor, petru ivelul de icredere propu de 99% (ric de %). Atfel e vor gai valorile: x
Prrelucrarea tatitica a irurilor de date Elimiarea valorilor aberate 7 λ critic =.03, u critic =3.4, t critic =.6 Se vor utiliza i cotiuare relatiile (3.4), (3.7), (3.0), petru a compara valorile critice tabilite i tabel petru ivelul de icredere propu şi valorile calculate. Utilizad fuctiuile Excel aceata calculatie e va realiza utilizad expreiile: =MAX ($D$0,$F$0) obtiad ca valoare maxima valoarea adreei $D$0, λ=5.43; Atfel ca: λ λ critic, ude 5.43 >.03 I cazul compararii valorilor obtiute i cazul tetului GRUBBS, vom avea: =MAX ($D$,$F$) obtiad ca valoare maxima valoarea adreei $D$, u=7.58; Adică: u u critic, ude 4.347 >3.4 I cazul tetului ROMANOWSKI, comparatia e va realiza utilizad expreia: =MAX ($D$,$F$) obtiad ca valoare maxima valoarea adreei $D$, t=7.35; Altfel pu: t t critic, ude 4.0 >.6 Se impue atfel cocluzia ca exita motive uficiete de elimiare a valorii aberate x 0, cocluzie de aemeea prezetata i tabelar, tabelul 3.3: Tab.3.3 TESTUL IRWIN TESTUL GRUBBS TESTUL ROMANOWSKI x = = 0.063 x = = 7.84 x = = 7.84 = = ( x) = = ( x) = = ( x) S = 0.5; S = 0.389 λ0 = 5,43 λcritic =.030 5.43 >.030 0 e elimia S x 0 x = 0.058; S = 0.40 u0 = 4.347 ucritic = 3.40 4.347 > 3.40 0 e elimia S x = 0.058; S = 0.40 t0 = 4.0 tcritic =.60 4.0 >.60 0 e elimia D. Prezetarea rezultatelor: Rezultatele vor fi prezetate ub forma uui raport (vezi Aexa3) ce cupride: - reprezetarea datelor primare, irul de date: - reprezetarea tabelara a valorilor idicilor tatitici: media aritmetica, diperia, abaterea medie patratica; - reprezetarea tabelara a valorilor calculate i cazul celor trei metode de aaliza critica a datelor: λ, u şi t; - prezetarea deciziei petru ricul propu; E. Bibliografie: [] Apotolecu, N., Taraza, D., Bazele cercetării experimetale a maiilor termice, Editura Didactica şi Pedagocica, Bucureti, 974.
7 Lucrarea 3 [] Bulgaru, M., Bolboaca, L., Igieria calitatii.magemetul calitatii, tatitica şi cotrol, maurari i 3D, Alma Mater, Cluj-Napoca 00, ISBN 973-8553-0-0 [3] Cathy, K., Excel petru Widow tm 95 i 503 imagii, Teora, Bucureti, 999, ISBN 973-60-457-6 [4] Faithe, W., Microoft Office 97 Profeioal 6i, Teora, Bucureti, 998, ISBN 973-60-907- [5] Taaecu I Cotrolul tatitic al proceelor i produelor, Editura didactica i pedagogica, Bucureti, 987. [6] *** Colectie de tadarde, Maagemetul şi aigurarea calitatii, Editura tehica, Bucureti, 996