GREUTATE INALTIME IMC TAS TAD GLICEMIE

Similar documents
Reprezentări grafice

VISUAL FOX PRO VIDEOFORMATE ŞI RAPOARTE. Se deschide proiectul Documents->Forms->Form Wizard->One-to-many Form Wizard

GRAFURI NEORIENTATE. 1. Notiunea de graf neorientat

Pasul 2. Desaturaţi imaginea. image>adjustments>desaturate sau Ctrl+Shift+I

Modalităţi de redare a conţinutului 3D prin intermediul unui proiector BenQ:

4 Caracteristici numerice ale variabilelor aleatoare: media şi dispersia

10 Estimarea parametrilor: intervale de încredere

Biostatistică Medicină Generală. Lucrarea de laborator Nr Intervale de încredere. Scop: la sfârşitul laboratorului veţi şti:

EPI INFO. - Cross-tabulation şi testul 2 -

Ghid de instalare pentru program NPD RO

Consideraţii statistice Software statistic

Parcurgerea arborilor binari şi aplicaţii

Platformă de e-learning și curriculă e-content pentru învățământul superior tehnic

Anexa 2. Instrumente informatice pentru statistică

SUBIECTE CONCURS ADMITERE TEST GRILĂ DE VERIFICARE A CUNOŞTINŢELOR FILIERA DIRECTĂ VARIANTA 1

Split Screen Specifications

Mail Moldtelecom. Microsoft Outlook Google Android Thunderbird Microsoft Outlook

Asocierea variabilelor discrete

Click pe More options sub simbolul telefon (în centru spre stânga) dacă sistemul nu a fost deja configurat.

Microsoft Excel partea 1

Aplicatii ale programarii grafice in experimentele de FIZICĂ

Exerciţii Capitolul 4

Teoreme de Analiză Matematică - II (teorema Borel - Lebesgue) 1

1. Ecuaţii diferenţiale de ordinul întâi

Application form for the 2015/2016 auditions for THE EUROPEAN UNION YOUTH ORCHESTRA (EUYO)

INTRODUCERE : Ce este econometria? 1. Scurt istoric privind apariţia econometriei. 2. Definiţia econometriei

22METS. 2. In the pattern below, which number belongs in the box? 0,5,4,9,8,13,12,17,16, A 15 B 19 C 20 D 21

AMINELE BIOGENE-IMPLICATII IN PATOLOGIA UMANA

Curs 3 Word 2007 Cuprins

PREZENTARE INTERFAŢĂ MICROSOFT EXCEL 2007

Capitolul V MODELAREA SISTEMELOR CU VENSIM

Ghid de Instalare Windows Vista

2. PORŢI LOGICE ( )

ARHITECTURA SISTEMELOR DE CALCUL ŞI SISTEME DE OPERARE. LUCRĂRILE DE LABORATOR Nr. 12, 13 şi 14


Hama Telecomanda Universala l in l

Sistemul de operare Windows (95, 98) Componenta My Computer

Rigla şi compasul. Gabriel POPA 1

Split Screen Specifications

1. Funcţii speciale. 1.1 Introducere

Ghidul administratorului de sistem

PROBLEME DE TEORIA NUMERELOR LA CONCURSURI ŞI OLIMPIADE

Paradoxuri matematice 1

GHIDUL UTILIZATORULUI DE REŢEA

Algoritmică şi programare Laborator 3

Conferinţa Naţională de Învăţământ Virtual, ediţia a IV-a, Graph Magics. Dumitru Ciubatîi Universitatea din Bucureşti,

O VARIANTĂ DISCRETĂ A TEOREMEI VALORII INTERMEDIARE

CAPITOLUL XI METODA DIRECT - COSTING

LESSON FOURTEEN

PREVIZIUNI ÎN ECONOMIE BAZATE PE MODELELE ECONOMETRICE UTILIZÂND EViews 5. ECONOMIC FORECASTS BASED ON ECONOMETRIC MODELS USING EViews 5

6. MPEG2. Prezentare. Cerinţe principale:

PREZENTARE CONCURSUL CĂLĂRAŞI My joy is my sorrow unmasked. 1

GHIDUL UTILIZATORULUI DE REŢEA

CAPITOLUL 2. PROIECTAREA MODELULUI RELAŢIONAL AL DATELOR PRIN NORMALIZARE

Biraportul în geometria triunghiului 1

Manual de utilizare QL-700. Imprimantă de etichete

OPTIMIZAREA GRADULUI DE ÎNCĂRCARE AL UTILAJELOR DE FABRICAŢIE OPTIMIZING THE MANUFACTURING EQUIPMENTS LOAD FACTOR

riptografie şi Securitate

Universitatea din Bucureşti. Facultatea de Matematică şi Informatică. Şcoala Doctorală de Matematică. Teză de Doctorat

Cu ce se confruntă cancerul de stomac? Să citim despre chirurgia minim invazivă da Vinci

directorul ATESTAT de pe desktop.

Utilizarea eficientă a factorilor de producţie

OLIMPIADA INTERNAŢIONALĂ DE MATEMATICĂ FORMULA OF UNITY / THE THIRD MILLENIUM 2014/2015 RUNDA A DOUA ADDENDUM

OLIMPIADA DE MATEMATIC ¼A ETAPA JUDEŢEAN ¼A 3 martie 2007

INTRODUCERE DEMONSTRATIVĂ LECŢIE OPERATOR CALCULATOR

STUDIUL FACTORILOR DE RISC CARDIOVASCULAR LA POPULAŢIA SUPRAPONDERALĂ

Curs 10: Analiza seriilor de timp. Data mining - Curs 10 1

MANUAL DE UTILIZARE. 2. Nomenclator Curs Produse Clienti Introducere Facturi

Platformă de e-learning și curriculă e-content pentru învățământul superior tehnic

Ghid de utilizare a platformei e-learning

CONSIDERAŢII ASUPRA UTILITǍŢII EXAMENULUI HOLTER ECG ÎN EVALUAREA DISFUNCŢIEI VEGETATIVE ŞI A ANOMALIILOR ELECTROCARDIOGRAFICE DIN CIROZA HEPATICǍ

MANUAL DE INSTRUCTIUNI AD 70H

Pagini Web prin Microsoft Frontpage. Crearea de pagini web. Introducere

Programa analitică. Verificare 2.7 Regimul disciplinei OBL

DEMONSTRAREA CONCURENŢEI ŞI COLINIARITĂŢII UTILIZÂND METODA FASCICULELOR CONVERGENTE NECULAI STANCIU 1

OLIMPIADA INTERNAŢIONALĂ DE MATEMATICĂ FORMULA OF UNITY / THE THIRD MILLENIUM 2014/2015 RUNDA A DOUA

Manual de utilizare. Oricând aici pentru a vă ajuta HMP5000. Întrebare? Contactaţi Philips

Capitolul 1. Noţiuni de bază

Calcule de regresie privind convergenţa economică şi evidenţierea contribuţiei factorului instituţional

Olimpiada Naţională de Matematică 2015 Testele de Selecţie Juniori IV şi V

Fall Spring. PPVT EVT SSRS - Parents. SSRS - Teachers. Acest studiu a fost realizat de Național Institute on Out-of- School Time (NIOST)

Ghid de configurare fără fir

Clasele de asigurare. Legea 237/2015 Anexa nr. 1

BAZE DE DATE SI PRELUCRARI STATISTICE

TTX260 investiţie cu cost redus, performanţă bună

Operaţiile de sistem de bază

COMPORTAREA UNOR SOIURI DE GRÂU DE TOAMNĂ LA S.C.D.A. PITEŞTI

Press review. Monitorizare presa. Programul de responsabilitate sociala. Lumea ta? Curata! TIMISOARA Page1

Aspecte geometrice ale unei rozete asociate unui triunghi

ANALIZA COMPARATIVĂ A UNOR PARAMETRI DIN SEDIMENTUL URINAR LA SUBIECŢI DE SEX FEMININ ŞI MASCULIN

Raionul Şoldăneşti la 10 mii locuitori 5,2 4,6 4,4 4,8 4,8 4,6 4,6 Personal medical mediu - abs,

TRACK NAVI. wireless. wireless. wireless. log. barometric GPS BIKE COMPUTER

Geometrie euclidian¼a în plan şi în spaţiu. Petru Sorin Botezat

Universitatea de Medicină şi Farmacie Carol Davila Facultatea de Medicină Generală TEZĂ DE DOCTORAT

Universitatea din Bucureşti Facultatea de Matematică şi Informatică. Matematică (Varianta 4) b este: A b 2 a B b a C b+ a D a b

Universitatea din Bucureşti Facultatea de Matematică şi Informatică. Matematică (Varianta 1)

MODULUL 2 UTILIZAREA SISTEMULUI DE OPERARE WINDOWS XP CURSUL UTILIZAREA CALCULATORULUI PERSONAL; APLICAREA TIC ÎN ŞCOALĂ ŞI AFACERI

COSTUL DE OPORTUNITATE AL UNUI STUDENT ROMÂN OPPORTUNITY COST OF A ROMANIAN STUDENT. Felix-Constantin BURCEA. Felix-Constantin BURCEA

Alexandrina-Corina Andrei. Everyday English. Elementary. comunicare.ro

ACADEMIA DE STUDII ECONOMICE FACULTATEA DE FINANŢE, ASIGURĂRI, BĂNCI şi BURSE de VALORI

Transcription:

Corelaţii Obiective: - Coeficientul de corelaţie Pearson - Graficul de corelaţie (XY Scatter) - Regresia liniară Problema 1. Introduceţi în Excel următorul tabel cu datele a 30 de pacienţi aflaţi în atenţia centrului de diabet şi boli de nutriţie. COLESTEROL inainte de tratament COLESTEROL dupa tratament VARSTA GREUTATE INALTIME IMC TAS TAD GLICEMIE 59 95 170 140 100 100 210 180 68 85 156 150 100 103 327 220 70 54 157 160 80 99 281 256 29 74 169 110 60 84 174 174 29 61 159 120 70 82 223 183 52 82 189 120 80 72 183 153 43 67 164 130 80 89 183 153 47 86 172 140 100 80 211 190 30 69 157 110 50 76 179 159 47 107 180 130 90 108 244 200 41 84 183 110 80 85 195 175 41 104 175 110 70 122 262 244 60 60 158 120 70 80 277 244 67 74 163 160 90 93 177 156 73 61 153 160 80 95 223 200 68 77 172 140 80 104 185 172 49 109 169 160 100 89 171 171 50 88 166 130 90 123 169 155 40 64 179 120 80 68 148 148 48 78 173 140 80 93 133 133 38 60 165 90 40 73 179 166 44 108 171 140 100 89 120 120 26 75 173 110 60 89 118 118 47 87 180 120 80 87 209 150 26 96 176 130 90 81 210 215 29 83 175 120 70 85 202 180 33 83 175 100 70 71 174 154 41 81 167 120 90 90 183 173 52 73 168 140 100 88 141 141 43 90 163 100 70 82 210 183 a. Calculaţi coeficientul de corelaţie Pearson dintre Varsta şi Greutate cu ajutorul funcţiei CORREL. Greutate b. Calculaţi indicele de masă corporală IMC după formula IMC 2 Inaltime(m)

c. Calculaţi coeficientul de corelaţie Pearson dintre IMC şi TAS cu ajutorul pachetului Data Analysis Correlation. d. Calculaţi matricea de corelaţii a variabilelor: Varsta, Greutate, IMC, TAS, TAD, Glicemie şi Colesterol înainte şi după tratament cu ajutorul Data Analysis Correlation. e. Reprezentaţi grafic dependenţa (corelaţia) dintre Vârstă şi IMC, adăugaţi pe grafic dreapta de regresie asociată, calculaţi coeficientul de determinare d şi ecuaţia dreptei de regresie. f. Calculaţi coeficientul de determinare prin metoda grafică pentru Varsta şi TAS. g. Reprezentaţi grafic corelaţia dintre Colesterol înainte şi după tratament. h. Reprezentaţi grafic dependenţa (corelaţia) dintre TAS şi TAD, adăugaţi pe grafic dreapta de regresie asociată, calculaţi coeficientul de determinare d şi ecuaţia dreptei de regresie. i. Calculaţi coeficienţii dreptei de regresie prin metoda grafică dintre Varsta şi Glicemie. j. Interpretaţi graficele, dreapta de regresie şi coeficientul de determinare în cateva cuvinte realizând o prezentare Power Point cu fiecare grafic pe un slide, urmat de interpretarea lui pe slide-ul următor. k. Determinaţi coeficienţii dreptei de regresie liniară pentru variabila dependentă Glicemie şi variabila independentă Greutate cu Regression din Data Analysis. Instrucţiuni Pentru punctul a. Coeficientul de corelaţie Pearson este un indice numeric ce dă o măsură a relaţiei dintre două variabile cantitative continue sau discrete (!!! Nu se calculează pentru altfel de variabile). 1. Copiaţi Vârsta şi Greutatea în Sheet 2. 2. Introduceţi în Sheet 2 următorul tabel: 3. Selectaţi celula unde vom calcula coeficientul de corelaţie. 4. Din meniul Insert alegeţi opţiunea Function. 5. Alegeţi din lista Or select a category categoria Statistical.

6. Căutaţi funcţia Correl în lista cu funcţii. Selectaţi funcţia Correl. Clic pe butonul OK. 7. In rubrica Array1 introduceţi referinţele domeniului unde se găseşte variabila Varsta: A2:A31. In rubrica Array2 introduceţi referinţele domeniului unde se găseşte variabila Greutate: B2:B31. Clic pe OK.

8. Rezultatul întors de funcţia Correl este -0,14, coeficient care poate fi interpretat ca între Varstă şi Greutate nu există corelaţie. Pentru punctul b. Calculaţi indicele de masă corporală IMC Greutate Introduceţi formula adaptată la Excel IMC 2 Inaltime(m) în coloana D. Calculaţi pentru primul pacient şi apoi umpleţi coloana folosind Fill-Down (instrucţiuni pentru adaptarea formulei la Excel în Laborator 3).!!! Atenţie trebuie să efectuaţi transformarea înălţimii din cm în m. Pentru punctul c. Calculaţi coeficientul de corelaţie Pearson dintre IMC şi TAS 1. Copiaţi IMC în Sheet 3 în coloana A cu Paste Special (din meniul Edit) unde selectaţi Values:

2. Copiaţi TAS în Sheet 3 în coloana B. 3. Pentru a folosi pachetul Data Analysis el trebuie instalat. Pentru aceasta verificaţi dacă nu a fost instalat deja: deschideţi meniul Tools. Dacă opţiunea Data Analysis este prezentă atunci se trece la pasul următor. Dacă opţiunea Data Analysis nu este prezentă, atunci din meniul Tools se alege opţiunea Add-Ins. Va apărea o fereastră asemănătoare celei de mai jos în care se va bifa prima opţiune Analysis ToolPak. Apăsaţi butonul Ok. 4. Alegeţi opţiunea Data Analysis din meniul Tools.

5. Din fereastra care apare clic pe Correlation. Apoi Ok. 6. La Input Range selectaţi domeniul unde se găsesc valorile variabilelor IMC şi TAS: A1:B31. Grouped by: se va selecta Columns dacă fiecare variabilă este introdusă într-o coloană sau Rows dacă fiecare variabilă este introdusă într-o linie. În cazul nostru vom bifa Columns. Labels in first row. Antetul de coloană sau linie poate să fie selectat sau poate lipsi. Dacă selectăm şi antetul de coloană, atunci în pagina de rezultate va apărea acel antet, adică numele variabilei. In acest caz trebuie să bifăm Labels in first row. Dacă nu bifăm funcţia va întoarce eroarea: Input range contents non numeric data, deoarece se consideră şi antetul de coloană ca fiind una dintre valorile variabilei. In cazul în care nu selectăm antetul de coloană, ar trebui să nu bifăm nici Labels in first row. Dacă bifăm Labels in first row atunci prima valoare a variabilei va fi luată drept antet de coloană şi rezultatele vor fi greşite. In cazul nostru selectăm Labels in first row. Opţiunile Output se referă la locul amplasării coeficientului de corelaţie. Selectaţi opţiunea Output Range, iar în rubrica de lângă introduceţi D2. Coeficientul de corelaţie va fi afişat începând cu celula D2 pe aceeaşi pagină cu tabelul. Mai jos aveţi fereastra Correlation cu setările descrise mai sus. Clic pe Ok.

7. Rezultatul va fi o matrice de corelaţii de 2x2: 8. Corelaţia dintre IMC şi TAS este 0,25, valoare care corespunde unei corelaţii acceptabile. Valorile 1 corespund corelaţiilor dintre IMC cu IMC şi TAS cu TAS, corelaţii perfecte. Pentru punctul d. Calculaţi matricea de corelaţii a variabilelor: Varsta, Greutate, IMC, TAS, TAD, Glicemie şi Colesterol înainte şi după tratament 1. Inseraţi o nouă pagină Sheet 4 din Insert Worksheet. 2. Copiaţi variabilele din listă în Sheet 4. Atenţie: IMC se copiază cu Paste Special - Values 3. Alegeţi opţiunea Data Analysis din meniul Tools. 4. Din fereastra care apare clic pe Correlation. Apoi Ok.

5. La Input Range selectaţi domeniul unde se găsesc valorile variabilelor Varsta, Greutate, IMC, TAS, TAD,Glicemie şi Colesterol: A1:H31. 6. Grouped by: se va selecta Columns. 7. Labels in first row. Selectăm Labels in first row. 8. Opţiunile Output se referă la locul amplasării coeficientului de corelaţie. Selectaţi opţiunea Output Range, iar în rubrica de lângă introduceţi J2. Matricea de corelaţii va fi afişatǎ începând cu celula J2. Mai jos aveţi fereastra Correlation cu setările descrise mai sus. Clic pe Ok. 9. Rezultatul va fi o matrice de corelaţii de 7x7:

10. Alcătuiţi următorul tabel în Sheet 4: Coeficientul de corelatie Pearson Corelatie VARSTA GREUTATE -0,14 slaba VARSTA IMC 0,05 inexistenta VARSTA TAS 0,72 VARSTA TAD 0,46 VARSTA GLICEMIE 0,41 VARSTA COLESTEROL inainte 0,40 VARSTA COLESTEROL dupa 0,32 GREUTATE IMC 0,85 GREUTATE TAS 0,07 GREUTATE TAD 0,49 GREUTATE GLICEMIE 0,36 GREUTATE COLESTEROL inainte -0,05 GREUTATE COLESTEROL dupa -0,06 IMC TAS 0,25 IMC TAD 0,51 IMC GLICEMIE 0,47 IMC COLESTEROL inainte 0,13 IMC COLESTEROL dupa 0,09 TAS TAD 0,72 TAS GLICEMIE 0,39 TAS COLESTEROL inainte 0,17 TAS COLESTEROL dupa 0,16 TAD GLICEMIE 0,35 TAD COLESTEROL inainte 0,08 TAD COLESTEROL dupa 0,02 GLICEMIE COLESTEROL inainte 0,31 GLICEMIE COLESTEROL dupa 0,30 COLESTEROL inainte COLESTEROL dupa 0,90 11. Completaţi interpretarea Coeficientului de corelaţie pe coloana corelaţie conform regulilor lui Colton:

Coeficientul de corelaţie sau coeficientul Pearson Este un indicator independent de unităţile de măsură ale celor două variabile coeficientul Pearson COV ( X, Y ) r Sx Sy unde S X şi S Y reprezintă abaterile standard pentru seriile X şi respectiv Y. Dintre proprietăţile coeficientului de corelaţie menţionăm: Coeficientul de corelaţie este un număr cuprins între -1 şi 1. Cu cât coeficientul de corelaţie se apropie de 1 în valoare absolută cu atât mai mult "intensitatea" relaţiei liniare între cele două variabile va fi mai mare. Când r este pozitiv relaţia între variabilele X şi Y este "pozitivă", adică o creştere a lui X determină în general o creştere a lui X. Când r < 0 relaţia între cele două variabile este "negativă" adică o creştere a lui X are în general ca şi consecinţă o diminuare a lui Y. Colton (1974) sugerează următoarele reguli empirice privind interpretarea coeficientului de corelaţie: 1. un coeficient de corelaţie de la -0,25 la 0,25 înseamnă o corelaţie slabă sau nulă, 2. un coeficient de corelaţie de la 0,25 la 0,50 (sau de la -0,25 la -0,50) înseamnă un grad de asociere acceptabil 3. un coeficient de corelaţie de la 0,5 la 0,75 (sau de la -0,5 la -0,75) înseamnă o corelaţie moderată spre bună 4. un coeficient de corelaţie mai mare decât 0,75 (sau mai mic decât -0,75) înseamnă o foarte bună asociere sau corelaţie Instrucţiuni e, f, g, h şi i Pentru punctul e, f, g, h şi i. realizaţi un grafic XY Scatter (instrucţiuni în Laborator 4) cu variabilele cerute la fiecare subpunct. Toate graficele trebuie să aibă dreapta de regresie, ecuaţia dreptei de regresie şi coeficientul de determinare. Executaţi fiecare grafic pe o pagină nouă. Enunţurile: e. Reprezentaţi grafic dependenţa (corelaţia) dintre Vârstă şi IMC, adăugaţi pe grafic dreapta de regresie asociată, calculaţi coeficientul de determinare d şi ecuaţia dreptei de regresie. f. Calculaţi coeficientul de determinare prin metoda grafică pentru Varsta şi TAS. g. Reprezentaţi grafic corelaţia dintre Colesterol înainte şi după tratament. h. Reprezentaţi grafic dependenţa (corelaţia) dintre TAS şi TAD, adăugaţi pe grafic dreapta de regresie asociată, calculaţi coeficientul de determinare d şi ecuaţia dreptei de regresie. i. Calculaţi coeficienţii dreptei de regresie prin metoda grafică dintre Varsta şi Glicemie.

Pentru punctul j Interpretaţi graficele, dreapta de regresie şi coeficientul de determinare în cateva cuvinte realizând o prezentare Power Point cu fiecare grafic pe un slide, urmat de interpretarea lui pe slide-ul următor. Coeficientul de determinare este pătratul coeficientului de corelaţie r, adică d = r 2. Dreapta Y(X) Valoarea coeficientului de determinare exprimă o intensitate a relaţiei liniare între cele două variabile. Sau răspunde la întrebarea: cât la sută din variaţia lui Y se poate explica prin relaţia liniară cu X. Dreapta de regresie a variabilei Y în funcţie de variabila X: y=a+bx. Valorile lui a şi b sunt date prin formulele: COV ( X, Y ) b S X a Y b X Ecuaţia dreptei de regresie ne permite prezicerea (exprimarea) valorilor uneia dintre variabile în funcţie de valorile celeilalte. Prezicerea este semnificativă dacă coeficientul de corelaţie este suficient de mare sau dacă probabilitatea calculată în regresia liniară este p<0,05 semnificativă. Diagrama de dispersie (Norul de puncte) In acest sens, o idee ceva mai precisă privind relaţia între cele două caracteristici se obţine împărţind diagrama de dispersie în patru cadrane prin două drepte perpendiculare care trec prin punctul ( X, Y ), având coordonatele egale cu mediile celor două variabile. Y II III Dacă există o relaţie liniară între cele două variabile atunci punctele diagramei se vor X I IV repartiza preferenţial în anumite cadrane (II şi IV sau I şi III).

Exemplu de interpretare: Corelatia dintre Varsta si TAS Tas 180 160 140 120 100 80 60 40 20 y = 0,9935x + 81,633 R 2 = 0,5123 0 0 10 20 30 40 50 60 70 80 Varsta Diagrama de dispersie are o tendinţă crescătoare. Dependenţa dintre TAS şi Vârstă este pozitivă: o creştere a Vârstei implică o creştere a TAS. 51% din variaţia TAS se datorează relaţiei liniare. Variaţia reziduală a TAS este 49%. Dreapta de regresie are un trend ascendent. Punctele diagramei sunt repartizate în cadranele I şi III. Pentru punctul k Determinaţi dreapta de regresie liniară pentru variabila dependentă TAS şi variabila independentă Vârsta cu Regression din Data Analysis. Determinarea coeficienţiilor dreptei de regresie, precum şi a intervalului de încredere pentru fiecare dintre aceştia, poate fi realizată utilizând opţiunea Regression din modulul Data Analysis: 1. Reveniţi pe pagina Sheet6, acolo unde ati copiat Varsta si TAS 2. Alegeţi Regression din opţiunile din fereastra Data Analysis 3. Selectaţi domeniul valorilor variabilei TAS, de exemplu B1:B20 ca variabilă dependentă (Input Y Range), selectaţi variabila Vârstă, de exemplu A1:A20 ca variabilă independentă

(Input X Range), bifaţi Labels, pentru obţinerea intervalelor de încredere bifaţi opţiunea Confidence Level (cu nivelul de semnificaţie de 95%), Rezultatele: Interpretare (cu albastru interpretările, iar cu negru explicaţiile): Multiple R = 0,71 este coeficientul de corelaţie multiplu, dar în cazul nostru cu o singură variabilă independentă Multiple R este coeficientul de corelaţie Pearson. R Square = 0,51 este coeficientul de determinare multiplu R 2 reprezintă proporţia variaţiei lui Y explicată de relaţia liniară cu X. In cazul nostru R 2 = r 2 = 0,51, deci 51% din variaţia TAS se poate explica prin relaţia liniară cu Vârsta. Adjusted R Square coeficientul de determinare corectat

Standard error = 13,54 este eroarea standard estimată şi este interpretată ca media erorii în predicţia lui Y cu ecuaţia de regresie. In cazul nostru eroarea standard este în medie 13,54 şi reprezintă media erorii predicţiei TAS cu ecuaţia de regresie. Observations Numărul total de subiecţi intraţi în studiu, în cazul nostru 30. Anova - analiza de regresie include şi un test cu ipoteza nulă: panta dreptei este egala cu 0 (adică nu există corelaţie între variabila dependentă şi cea independentă luate în studiu). Dacă panta este semnificativ diferită de 0 (acest lucru se întamplă dacă la Significance F avem o valoare p<0,05) tragem concuzia că există o relaţie liniară între X şi Y. In cazul nostru p=0,0000087 este mai mic decat 0,05, deci panta dreptei de regresie este semnificativ diferită de 0, deci există corelaţie semnificativă între TAS şi Vârstă. Regression variaţia lui Y care se explică în funcţie de X Residual variaţia lui Y care nu se explică în funcţie de X (valoarea reziduală este de preferat să fie cât mai mică) Total este variaţia totală, adică suma variaţiei regresiei cu variaţia reziduală df gradele de libertate. SS suma de pătrate. MS media sumei de pătrate MS=SS/df F este parametrul testului F = MS(regression)/MS(residual). Significance F = 0,0000087 în acest caz se respinge ipoteza nulǎ (p-value<0,05), adică corelaţia dintre cele două variabile este semnificativă. Coefficients pentru Intercept (constanta) valoarea este 81,6327, iar pentru coeficientul a valoarea este 0,993539. Deci dreapta de regresie Y=aX+b în cazul nostru este Y=0,993539X-81,6327 Intercept - constanta T stat este un test statistic cu ipoteza nulă: constanta (intercept) nu este diferită semnificativ de zero. P-value este rezultatul testului. Dacă p-value<0,05, atunci se refuză ipoteza nulă şi se acceptă ipoteza alternativă: constanta este semnificativ diferită de zero. Lower 95% şi Upper 95% formează un interval de confidenţă de 95% în jurul constantei. Iar Lower 90% şi Upper 90% formează un interval de confidenţă de 90% în jurul constantei. In cazul nostru p=0,34 deci constanta nu este semnificativ diferită de zero. Varsta (X) Panta dreptei de regresie (coeficientul a) este 162,79. T stat este un test statistic cu ipoteza nulă: panta nu este diferită semnificativ de zero. P-value este rezultatul testului. Dacă p- value<0,05 atunci se refuză ipoteza nulă şi se acceptă ipoteza alternativă: panta este semnificativ

diferită de zero. Lower 95% şi Upper 95% formează un interval de confidenţă de 95% în jurul pantei. Iar Lower 90% şi Upper 90% formează un interval de confidenţă de 90% în jurul pantei. Problema 2 Pentru a se studia hipercolesterolemia au fost luate în studiu două eşantioane: 187 de pacienţi şi 255 de indemni de boală. Pentru aceşti subiecţi au fost înregistraţi următorii parametrii biologici: Varstă, Greutate, Inălţime, Colesterol, Trigliceride, HDL colesterol, Glicemie. Datele se găsesc în fişierul Biost2.xls. Realizaţi: i) Sortaţi crescător datele cu cheia de sortare LOT (meniul Data Sort, alegeţi LOT). ii) Calculaţi IMC (indice de masă corporală) cu formula: IMC=Greutate/Inălţime(m) 2 iii) Calculaţi indicatorii de centralitate (media aritmetică, mediana), indicatorii de localizare (quartilele), indicatorii de dispersie (amplitudinea, variaţia, abaterea standard, coeficientul de variaţie, boltirea şi asimetria) pentru Varstă, IMC, Colesterol, TG, Glicemie şi HDL separat la lotul 1 şi la lotul 2. iv) Pentru lotul de bolnavi (LOT=1) calculaţi matricea de corelaţie. v) Pentru lotul de indemni de boală (LOT=2) calculaţi coeficientul de corelaţie Pearson r pentru TG şi IMC, Glicemie şi IMC, TG şi HDL, IMC şi Colesterol (utilizaţi funcţia CORREL). Interpretaţi statistic rezultatele. vi) Reprezentaţi grafic corelaţiile, realizaţi dreapta de regresie asociată, calculaţi coeficientul de determinare d şi ecuaţia dreptei de regresie pentru parametrii între care există corelaţie bună şi foarte bună (r obţinut la iii) şi iv) peste >0,5 sau sub <-0,5). vii) Determinaţi dreapta de regresie liniară pentru variabila dependentă TG şi variabila independentă BMI cu Regression din Data Analysis numai pentru pacienţii din LOT=1.