Statistika je naziv kílkísny opis i vimír podíy, pojave, objekti. Lutaju kao galuz praktična aktivnost(odabir, analiza i analiza podataka o masovnim pojavama), kao budala znanja, tobto. posebna znanstvena disciplina, i, kao zbirka slika, pod-bag digitalni zasloni, odabrani da okarakteriziraju je li ili ne galerija suspílnyh fenomena.
Statistika je znanost koja podučava pravilnosti masovnih pojava na način koji pojačava dokaze.
Medicinska statistika je neovisna i održiva znanost koja kílkísny bík masovyh suspílnyh yavisch na neeksplozivnoj vezi sa svojom kiselom stranom, što dopušta metodom prediktivnih indikacija prisjetiti se redovitosti ovih pojava, najvažnijih procesa u gospodarskom, društvenom životu društva, zdravstva, sustava organizacije medicinske pomoći stanovništvu.
Statističke metode - cijeli proces uzimanja materijala čuvara mase, na koji se nalaze: grupiranje, združivanje, brisanje indikacija, pa i njihova statistička analiza.
Statističke metode u medicini koriste se za:
Distribuirana medicinska statistika:
Kako bi baza podataka bila prikladna za daljnju obradu, slijedite nekoliko jednostavnih načela:
1) Optimalni program za izradu baza podataka je MS Excel. Podaci iz Excela mogu se jednostavno prenijeti u druge specijalizirane statističke pakete, kao što su Statistica, SPSS i drugi za složenije manipulacije. Međutim, do 80-90% analiza može se ručno provesti u samom Excelu uz analizu analize podataka.
2) Gornji red tablice s bazom podataka izrađen je kao šešir, gdje su upisani nazivi tihih indikatora, kao da su osigurani na tom stompcu. Ljutnju nije potrebno pobijediti u sredini (može se dotjerati do cijele baze), tako da uz puno operacija postaje neprihvatljivo. Dakle, nemojte varto stvarati "dvostruki" šešir, u gornjem redu označavate naziv grupe sličnih displeja, a donjem - specifične displeje. Za grupiranje sličnih displeja, bolje ih je označiti jednobojnom ispunom ili uz njihovo ime uključiti grupni znak u lukove.
Na primjer, ne ovako:
GLAVNA ANALIZA KRVI | ||
ER | LEU | TR |
ER (UAC) | LEU (UAC) | TR(UAC) |
u preostaloj varijanti također je osigurana ujednačena površina kape, a ujednačenost trapera je potpuna (sve se smrdi prije naznaka OVK).
3) Prilikom prvog stomptsi, trebate dodijeliti serijski broj pacijenta u ovoj bazi podataka, bez povezivanja s prethodnim s preostalim indikacijama. Tse omogućiti udaljenu sigurnost jednostavan put do poretka pacijenata u bilo kojoj fazi, nakon numeričkog sortiranja popisa.
4) Drugi stovpeti pozivaju na imena (ili P.I.B.) pacijenata.
5) Kílkísní pozniki (tí, scho vimiryuyuyutsya brojevi, na primjer - rast, vaga, arterijski porok, otkucaji srca tanki) uklapaju se u tablicu u numeričkom formatu. Vrijedilo bi i tako je bilo jasno, zapamtite da su u Excelu, počevši od verzije iz 2007., razlomke vrijednosti označene točkom: 4.5. Ako broj zapišete kroz zarez, on će se uzeti kao tekst i morat ćete ga prepisati.
6). One od njih, ako postoje dvije moguće vrijednosti (tzv. binarne vrijednosti: Tak-Ni, Ê-Vidsutnya, Cholovichy-Zhínochiy), bolje je prevesti u dvíykovu sustav: 0 i 1. Vrijednost 1 je dodijeljen pozitivnoj vrijednosti (Tak, Ê) 0 - negativnoj (Ní, Vídsutnya).
7) Yakísní pokazniki, scho mayut kílka znachen, scho vídíznyayutsya za stupanj virazhennosti, jednak izgledu (Slab-Srednji-Jaki; Hladno-Toplo-Vruće) može biti u rasponu i, vidpovídno, također preveden na broj. Najniža razina izgleda trebala bi imati najniži rang - 0 ili 1, sljedeći koraci su naznačeni vrijednostima redova redova. Na primjer: Infekcija tijekom dana - 0, blagi stupanj težine -1, srednji stupanj - 2, teški stupanj - 3.
8) U slučaju jednog jaki pokanika, papalini se daje vrijednost. Primjerice, u rubrici "Popratna dijagnoza" za očitost nekoliko bolesti želim reći kroz koga. Robiti nije tako jednostavno, ali je obrada takvih podataka puno teža i ne može se automatizirati. Stoga je bolje niknuti kílka stovptsív s određenim skupinama bolesti („CCC bolest“, „ShKT infekcija“ itd.) ili nozologijama pjesama („kronični gastritis“, „IXC“ itd.), u ovim podacima je upisuje se u binarnom, dvostrukom izgledu: 1 (što znači "Ovo je bolest") - 0 ("Ne postoji takva bolest").
9) Da biste razlikovali četiri skupine indikativa, možete ih aktivno obojiti: na primjer, stovptovi s indikativom OVK vide se crvenim bojama, koje daje OAM - žutom, itd.
10) Jedan red tablice može se dati kožnom pacijentu.
Ovakav dizajn baze podataka omogućuje ne samo da se značajno pojednostavi proces statističke obrade, već i da se lakše završi u fazi odabira materijala.
Osim toga, kako se svi podaci prikupljaju, prije skin izvješća postoji izbor najnaprednije metode statističke obrade. I nije iznenađujuće: današnja statistika sve je veća u broju različitih kriterija i metoda. Svi smradovi mogu imati svoje osobitosti, mogu i ne moraju biti prikladni za dvije, čini se, slične situacije. U ovom članku pokušat ćemo sistematizirati sve glavne, najšire metode Statistička analiza za njihovo priznanje.
Prote malo više od toga, yakí buvayut statističke podatke, oskílki najvjerojatnije deponirati najizvodljiviju metodu analize.
Ispod sata praćenja u jedinici opreza kože prikazuju se vrijednosti različitih znakova. Ovisno o razmjeri smrada, svi znakovi se dijele na kílkísníі yakísní. Yakísní pokazniki u doslídzhenny rozpodílyayutsya za tzv. nominalni mjerilo. Osim toga, prikazi se mogu prikazati prema rangiranje mjerilo.
Na primjer, potrebno je provesti pokadnyannya pokaznikív sertsevaí̈ íyalností u sportaša i osíb, yakí voditi malorohlivy način života.
Istovremeno su se u doslidžuvanima pojavili sljedeći znakovi:
Sljedeći obrok, budući da je potrebno odabrati statističku metodu, računa se u broj agregata, jer se u okviru praćenja može izjednačiti.
Važna je i prehrana normalnost rozpodílu doslídzhuvanih sukuppities. Víd tsogo za depozit, chi može zastosovuvati metode parametarska analiza chi tilki neparametarski. Umovi, kao dužnost da se dopru do normalno rastavljenih brakova, ê:
Nakon označavanja svih predznaka koje smo dodijelili, predznak preostalih agregata može se ubrzati sljedećom tablicom za odabir najoptimalnije metode statističke analize.
Metoda | Ljestvica bodovanja indikacija | Kílkíst porívnjuvanih suupnosti | Svrha obrade | Rozpodíl danih |
Studentov t-test | kílkísna | 2 | normalan | |
Studentov t-test s Bonferonijevom korekcijom | kílkísna | 3 i više | dogovaranje nedosljednosti | normalan |
Studentov t-test | kílkísna | 2 | normalan | |
Jednosmjerna analiza varijance (ANOVA) | kílkísna | 3 i više | dogovaranje nedosljednosti | normalan |
Jednosmjerna analiza varijance (ANOVA) iz ponovljenih vimera | kílkísna | 3 i više | porívnyannya pov'yazanih grešnost | normalan |
Mann-Whitney U test | kílkísna, čin | 2 | dogovaranje nedosljednosti | be-jak |
Q-test za Rosenbauma | kílkísna, čin | 2 | dogovaranje nedosljednosti | be-jak |
Kruskell-Wallisov test | kílkísna | 3 i više | dogovaranje nedosljednosti | be-jak |
Wilcoxonov kriterij | kílkísna, čin | 2 | porívnyannya pov'yazanih grešnost | be-jak |
G-test znakova | kílkísna, čin | 2 | porívnyannya pov'yazanih grešnost | be-jak |
Fridmanov kriterij | kílkísna, čin | 3 i više | porívnyannya pov'yazanih grešnost | be-jak |
Kriterij χ 2 Pearson | nominalni | 2 i više | dogovaranje nedosljednosti | be-jak |
Fisherov točan test | nominalni | 2 | dogovaranje nedosljednosti | be-jak |
McNemar test | nominalni | 2 | porívnyannya pov'yazanih grešnost | be-jak |
Q-test Cochran | nominalni | 3 i više | porívnyannya pov'yazanih grešnost | be-jak |
Vidljivi rizik (omjer rizika, RR) | nominalni | 2 | paritet nedosljednosti u kohortnim zapisima | be-jak |
Omjer vjerojatnosti, OR | nominalni | 2 | izjednačavanje neispravljenih brakova u slučajevima za kshtalt “vipadok-kontrola”. | be-jak |
Pearsonov koeficijent korelacije | kílkísna | 2 reda vimiriva | normalan | |
Spirmanov koeficijent korelacije ranga | kílkísna, čin | 2 reda vimiriva | vyyavlennya zv'yazku mizh znakove | be-jak |
Kendalov koeficijent korelacije | kílkísna, čin | 2 reda vimiriva | vyyavlennya zv'yazku mizh znakove | be-jak |
Koeficijent konkordancije Kendall | kílkísna, čin | 3 i više reda vimiriva | vyyavlennya zv'yazku mizh znakove | be-jak |
Naknada prosječnih vrijednosti (M) i prosječnih pomilovanja (m) | kílkísna | 1 | statistika opisa | be-jak |
Omjer medijana (Me) i percentila (kvartila) | rang | 1 | statistika opisa | be-jak |
Razrahunok vídnosnyh vrijednosti (P) i prosječne oproste (m) | nominalni | 1 | statistika opisa | be-jak |
Kriterij Shapiro-Vilka | kílkísna | 1 | analiza rozpodílu | be-jak |
Kolmogorov-Smirnov kriterij | kílkísna | 1 | analiza rozpodílu | be-jak |
Kriterij ω 2 Smirnov-Kramer-von Mises | kílkísna | 1 | analiza rozpodílu | be-jak |
Kaplan-Meierova metoda | be-yaka | 1 | analiza preživljavanja | be-jak |
Model proporcionalnih rizika prema Coxu | be-yaka | 1 | analiza preživljavanja | be-jak |
27. veljače 1857. rođen je Karl Pirson - veliki engleski matematičar, statističar, biolog i filozof; utemeljitelj matematičke statistike, jedan od utemeljitelja biometrije.
Nakon što je 27 godina bio profesor primijenjene matematike na London University Collegeu, Karl Pearson je počeo proučavati statistiku, usvojivši je kao temeljni znanstveni alat, koji je svojevrsna potpora neopćeprihvaćenim razmišljanjima o potrebi sigurnosti. .
Glavnim zaslugama Pirsona u statistici može se dodati razvoj temelja teorije korelacije i sukcesije predznaka, uvođenje “Pearsonovih krivulja” za opisivanje empirijskih distribucija i, posebno, važnog kriterija hi- kvadrata, kao i preklapanje velikog broja statističkih tablica. Pirson je zastosovuvao statističku metodu, a posebno teoriju korelacije u mnogim područjima znanosti.
Os je jedna od joge: "Prvom amateru u promicanju modernih statističkih metoda, znanost se odupire tipičnoj znevi. Pa ipak, poživjevši sat vremena, ako se puno njih počelo znojiti i zastosovuvati te iste metode, uboli su smrad."
Ja sam već 1920. god. Pirson je napisao bilješku, navodeći da metabiometrijska škola "pretvara statistiku u laž primijenjene matematike, zagalnite, odbacite ili opstruira bijedne metode stare škole političkog i socijalna statistika, i, u trenu, prepraviti statistiku ovog sporta-maydanchika za amatere i natjecatelje u ozbiljnom umu znanosti. Bilo je potrebno kritizirati nedovršene i često opraštajuće metode u medicini, antropologiji, kraniometriji, psihologiji, kriminologiji, biologiji, sociologiji, kako bi se znanost osigurala novim i težim metodama. Bitka je trajala možda dvadesetak godina, a onda se pojavio bogat znak da je mnogo proricanja zaostalo i posvuda su usvojene nove metode.
Karla Pearsona inspirirali su različiti interesi: studirao je fiziku u Heidelberzu, proučavao je društvenu i ekonomsku ulogu religije i čitao je predavanja o njemačkoj povijesti i književnosti u Cambridgeu i Londonu.
Mala je činjenica da je u gradu 28 godina, Karl Pearson, pročitavši predavanja o "ženskoj hrani" i zaspavši, Klub muškaraca i žena, koji je, probudivši se prije 1889., u kojem je slobodno i bezrezervno raspravljao o svemu što bi vrijedilo za žene, uključujući žene .
Klub je formiran od jednakog broja ljudi i žena, uglavnom liberalnih predstavnika srednje klase, socijalistica i feministica.
Predmet razgovora za klub bila je prehrana najšireg spektra: seksi vidnosin u blizini starogrčke Atene do logora budističkih crnih kuća, od kapaka do problema prostitucije. Naime, "Klub muškaraca i žena" je bacivši tvit odavno uspostavio norme međusobnih odnosa muškaraca i žena, kao i izjave o "ispravnoj" seksualnosti. U doba viktorijanske Engleske, koji su bogato prihvaćali seksualnost kao da su “niski” i “kreature”, a nedržavnost statusa države bila je posvuda šire, rasprava o takvoj hrani bila je doista radikalna.
Godine 1898. str. Pirsona je Kraljevska udruga nagradila Darwinovom medaljom, na što je bio nadahnut, poštujući da nagradu “mogu vidjeti mladi ljudi da ih žele”.
Florence Nightingale (1820.-1910.) je sestra milosrđa, ta velika đakonica Velike Britanije, na čiji dan rođenja danas slavimo Međunarodni dan medicinskih sestara.
Vaughn je rođen u Firenci u bogatoj aristokratskoj obitelji, dobio je svjetlucavo svjetlo, znao je šest jezika. Od mladosti je sanjala da postane sestra milosrđa, 1853. godine primila je sestrinsko posvećenje u zajednici sestara pastora Flendera u Kaiserwerthu i postala važna mala privatna pića u Londonu.
U isto vrijeme 1854., tijekom Krimskog rata, Florence je od 38 djevojaka odjednom uništila seksualne bolnice na Krimu. Organizirajući nadzor nad ranjenima, dosljedno je provodila načela sanitacije i higijene u životu. Kao rezultat toga, stopa smrtnosti u bolnicama smanjena je sa 42% na 2,2%, manje nego jednom!
Postavivši je zaduživši reformu medicinske službe u vojsci, Nightingale je postigla da bolnice budu opremljene ventilacijskim i kanalizacijskim sustavima; medicinsko osoblje je prošlo potrebnu obuku. Organizirana je Vojno-medicinska škola, a među vojnicima i časnicima proveden je ružičnjak o važnosti prevencije bolesti.
Velike zasluge Florence Nightingale u medicinskoj statistici!
Godine 1859. str. Bula je izabran za člana Royal Statistical Fellowship i te godine postao počasni član Američkog statističkog udruženja.
⠀Dana 30. travnja 1777. godine u gradu Braunschweigu rođen je veliki njemački matematičar, mehaničar, fizičar, astronom, geodet i statističar Johann Karl Friedrich Gauss.
Vin se smatra jednim od najvećih matematičara svih vremena, "kraljem matematičara". Dobitnik medalje Koplí (1838.), strani član Švedske (1821.) i Ruske (1824.) akademije znanosti, Engleske kraljevske udruge.
U posljednje tri godine Karl je naučio čitati i pisati, kako bi ispravio pomilovanja oca. Prema legendi, srednjoškolski profesor matematike, da dugo zaokuplja djecu, nagovarajući ih da riješe zbroj brojeva od 1 do 100. Junius Gauss, pošto je poštovao da su parovi zbroja suprotnih brojeva isti : 1 + 100 = 101, 2 + 99 = 101 samo. itd., a mittevo uzimajući rezultat: 50 101 \u003d 5050. Do starosti izračunava se zvuk većine djela u Dumi.
Glavne znanstvene zasluge Karla Gausa u statistici i stvaranju metode najmanjih kvadrata koji su u osnovi regresijske analize.
Također, nakon što je navodno završena proširenja u prirodi, normalni zakon je podijeljen, čiji se graf često naziva Gaussovim. Pravilo tri sigme (Gaussovo pravilo), koje opisuje normalnu distribuciju, steklo je široku popularnost.
Na 75. stijeni Peremoga kod Velikog Vytchiznyanoi ratŽelio bih nagađati i pričati o čudesnom znanstveniku, jednom od utemeljitelja medicinske i sanitarne statistike u SRSR - Levu Semenoviču Kaminskom (1889-1962).
Vin je rođen 27. svibnja 1889. u blizini Kijeva. Nakon završetka sa znakom 1918.g Medicinski fakultet Petrogradskog sveučilišta Kaminski je bio na lavi Červonoj armije od travnja 1919. do kraja 1920. godine. prigrlivši stanicu glavnog liječnika 136. zvijezde evakuacijske bolnice fronta Pvdenno-Skhidny.
Z 1922. godine Lev Semenovič bio je šef sanitarno-epidemiološkog odjela medicinske i sanitarne službe Pivnično-Zahidnoja. zaliznitsi. Na Stjenu je znanstvena djelatnost Kaminskog započela uz slavlje prof. S.A.Novoselsky. Statistički materijal o ljudskoj potrošnji u ratovima različitih vojski svijeta od 1756. do 1918. analiziran je u njihovoj zajedničkoj temeljnoj praksi “Potrošnja u prošlim ratovima”. Na udaljenim robotima Kaminsky Bulo razroblen i pripremljena nova, točnija klasifikacija vojnih troškova.
Na monografiji " Narodne jedenje i zdravlje ljudi“ (1929.) detaljno je ispitan sanitarno-higijenski aspekt utjecaja rata na zdravo stanovništvo, kao i ishrana liječničke organizacije za pomoć stanovništvu te vojske u ratnim stijenama.
Od 1935. do 1943. Rick Lev Semenovich bio je vrlo odgovoran za sanitarnu (od 1942. - medicinsku) statistiku Narodnog komesarijata zdravstva SRSR. Žovtni rođen 1943. godine Prof. Kamínskiy postao je voditelj Odjela za medicinsko-medicinsku statistiku Vijskovo-medicinske akademije nazvane po. S.M.Kirova, a od 1956. god zauzeo je mjesto profesora Odsjeka za statistiku i izgled na Lenjingradskom državnom sveučilištu.
Lev Semenovič se zalagao za široko promicanje metoda računanja u praksi sanitarne i medicinske statistike. Imaju 1959 r. Osim toga, autorstvo početnog priručnika "Statistička obrada laboratorijskih i kliničkih podataka: razvoj statistike u znanstvenom i praktičnom radu liječnika", koji je dugo vremena postao jedan od najboljih votchisnyanyh podruchnikov u medicinskoj statistici. L.S. Kaminsky je imenovao vođu:
“... Ovdje smo važni, da su liječnici znali kako se zauzeti za pravo, mogli su odabrati i dopuniti točne brojeve, dodatke za poravnanje i postavu.”
Studentov t-test uobičajen je naziv za klasu metoda za statističku provjeru hipoteza (statistički testovi) temeljenih na Studentovom rozpodílí. Najčešće fluktuacije u t-testu bile su povezane s ponovnom procjenom srednjih vrijednosti u dva uzorka.
Tsey kriterij buv dezintegracije William Sili Dergeset
Studentov t-test pobjeđuje statističku značajnost srednjih vrijednosti. Može stagnirati i u slučajevima varijacije samostalnih proširenih vena (na primjer, skupine bolesti za dijabetes i zdrave skupine), i u slučaju varijanse suženja jajnika (na primjer, prosječna brzina pulsa u samih ovih bolesnica prije i nakon uzimanja antiaritmijski lijek). Istovremeno, t-test muškog studenta
Za provjeru valjanosti Studentovim t-testom potrebno je da su izlazni podaci manji od normalne distribucije. Također, moguć je i značaj jednakosti varijanci (podijeljenih) jednakih skupina (homoskedastičnost). Kod neravnomjernih disperzija koristi se t-test Welchove modifikacije (Welch "s t).
Za postojanje normalne raspodjele podpodjela bodovanja, bodovanje Studentovog t-testa temelji se na analognim metodama i neparametarskim statistikama, među najčešće korištenim U-kriterij Mann - Vitni.
Za izjednačavanje prosječnih vrijednosti, Studentov t-test se izračunava prema sljedećoj formuli:
de M 1- aritmetička sredina prvog parnog braka (skupine), M 2- aritmetička sredina drugog por_vnyuvanoí̈ braka (skupine), m 1- srednji oprost prve aritmetičke sredine, m2- Srednji oprost je još jedna aritmetička sredina.
Vrijednost Studentovog t-testa treba ispravno protumačiti. Za koje nam je potrebno znati broj pacijenata u skupini kože (n1 i n2). Znamo broj koraka slobode f iza napredne formule:
F \u003d (n 1 + n 2) - 2
Stoga je kritična vrijednost određena Studentovim t-testom za traženu razinu značajnosti (na primjer, p = 0,05) i za broj stupnjeva slobode f iza stola (razd. ispod).
Odabrane su dvije skupine bolesnika s anemijom kako bi se ispitala učinkovitost novog lijeka sline. U prvoj skupini bolesnika uzimao se novi lijek kroz dva razdoblja, a u drugoj skupini placebo. Nakon toga je provedena održivost hemoglobina u perifernoj krvi. U prvoj skupini prosječna razina hemoglobina bila je 115,4±1,2 g/l, au drugoj skupini 103,7±2,3 g/l (ovi podaci su prikazani u M±m formatu); Za jednu je broj prve skupine bio 34, a za drugu - 40 pacijenata. Potrebno je istražiti brkove o statističkoj značajnosti oduzimanja nalaza i učinkovitosti novog fiziološkog pripravka.
Riješenje: Za procjenu važnosti pobjeda Studentov t-test, koji se izračunava kao razlika prosječnih vrijednosti, dijeli se sa zbrojem oprosta na kvadrat:
Nakon povećanja u analizi, vrijednost t-testa bila je jednaka 4,51. Poznat je broj koraka slobode (34 + 40) - 2 = 72. Vrijednost Studentovog t-testa 4,51 jednaka je kritičnoj vrijednosti pri p = 0,05, koja je dodijeljena tablici: 1,993. Dakle, kako je vrijednost kriterija veća od kritične, robimo visnovki o onima koji su značajni, koji se čuvaju, statistički su značajni (razina značajnosti p<0,05).
Upareni Studentov t-test jedna je od modifikacija Studentove metode koja je korištena za određivanje statističke značajnosti uparenih (ponovljenih) testova.
t-test od Williama Holdseta za ocjenu kvalitete piva u tvrtki Guinness. Na poveznici s gušavošću ispred tvrtke nedostajalo je otkrivanje poslovnih tajni, članak Derzhsetu objavljen je 1908. u časopisu "Biometrics" pod pseudonimom "Student" (Student).
Upareni Studentov t-test je pobjednički za izjednačavanje dvije uparene (uparene) vibracije. Lažna područja su vimiryuvannya, vikonaní u tišini samih pacijenata, ali u drugom satu, na primjer, arterijski tlak u bolestima za hipertenzivne bolesti prije i nakon uzimanja antihipertenzivnog lijeka. Nul hipoteza je da se govori o prisutnosti identiteta između uparenih vibracija, alternativa je prisutnost statistički značajnih identiteta.
Glavni mentalni faktor je ustajalost vibracija, tako da se vrijednosti mogu oduzeti pacijentu pri ponovljenom bodovanju jednog parametra kod samih pacijenata.
Što se tiče izjednačavanja neovisnih vibracija, za dvostruki t-kriterij potrebno je da izlazni podaci budu manje normalni. Kod podcjenjivanja cijena koristite metode neparametarske statistike, kao npr G-test znakova ili T-test za Wilcoxona.
Moški t-test može pobijediti manje ako su parovi jednaki. U pravilu je potrebno izjednačiti tri i više ponovljenih vimiriv, sljedeću pobjedu jednosmjerna analiza varijance (ANOVA) za ponovljene testove.
T-test mladog Studenta izračunava se prema sljedećoj formuli:
de M d- aritmetička sredina razlike indikacija, umrlih do tog dana, σd- Srednja kvadratna razlika indikacija, n- Broj praćenja.
Interpretacija vrijednosti uzete iz uparenog Studentovog t-testa ne odgovara rezultatu t-testa za nepodudarne populacije. Nasampered, potrebno je znati broj koraka slobode f iza napredne formule:
F = n - 1
Ako je tako, kritična vrijednost određena je Studentovim t-testom za traženu razinu značajnosti (na primjer, p<0,05) и при данном числе степеней свободы f iza stola (razd. ispod).
Možda kritičnije od vrijednosti kriterija:
Kako bismo procijenili učinkovitost nove hipoglikemijske metode, proveli smo ispitivanje razine glukoze u krvi pacijenata koji boluju od dijabetesa, prije toga nakon uzimanja lijeka. Kao rezultat, uzeti su sljedeći podaci:
Riješenje:
1. Određivanje razlike u vrijednosti opklade na kožu (d):
Pacijent N | Razina glukoze u krvi, mmol/l | Vrijednost varijacije (d) | |
prije uzimanja lijeka | nakon uzimanja lijeka | ||
1 | 9.6 | 5.7 | 3.9 |
2 | 8.1 | 5.4 | 2.7 |
3 | 8.8 | 6.4 | 2.4 |
4 | 7.9 | 5.5 | 2.4 |
5 | 9.2 | 5.3 | 3.9 |
6 | 8.0 | 5.2 | 2.8 |
7 | 8.4 | 5.1 | 3.3 |
8 | 10.1 | 6.9 | 3.2 |
9 | 7.8 | 7.5 | 2.3 |
10 | 8.1 | 5.0 | 3.1 |
2. Znamo aritmetičku sredinu razlike za formulu:
3. Poznajemo srednju kvadratnu razliku srednje razlike prema formuli:
4. Razrahuemo muški Studentov t-test:
5. Jednako oduzmite Studentovu vrijednost t-testa od 8,6 od vrijednosti tablice, na primjer, s brojem koraka slobode f 10 - 1 = 9 i jednakim značajem p = 0,05 postaje 2,262. Budući da je vrijednost veća od kritične, važno je uočiti prisutnost statistički značajne razine glukoze u krvi prije i nakon uzimanja novog lijeka.
Mann-Whitneyev U-test je neparametarski statistički test koji pobjeđuje za izjednačavanje dva nezavisna odabira za predznake jednakosti, pobjednički. Metoda se temelji na određivanju hoće li se dobiti mala vrijednost zone koja se siječe između dva varijacijska reda (rangiranje sljedeće vrijednosti parametra u prvom odabiru i iste u drugom odabiru). Što je manja vrijednost kriterija, to je bolje, razlika između vrijednosti parametra u odabirima je pouzdana.
Dansku metodu otkrivanja razlika između vibratora predložio je 1945. američki kemičar i statističar. Frank Wilcoxon.
Godine 1947. roci vin buv sažeo je transformacije i proširenja matematičara H.B. Mann(H.B. Mann) ta D.R. Vítní(D.R. Whitney), za imena onih koji se danas zovu.
Mann-Whitneyjev U-kriterij je pobjednički za ocjenjivanje razlika između dva neovisna glasa za jednako je li to značajan znak.
Mann-Whitney U-test je neparametarski test Studentov t-test
U-kriterij je prikladan za izjednačavanje malih vibracija: vibracije kože mogu imati najmanje 3 vrijednosti predznaka. Dopušteno je da su u jednom izboru bile 2 vrijednosti, a u drugom svibnju nije bilo manje od pet.
Umovoy za zastosuvannia U-kriterij Mann-Whitney ê vídsutníst u porívnyuvanih skupinama znachenie znakove da zbígayutsya (vaši brojevi - razní) ili čak manji broj takvih zbígív.
Analog Mann-Whitneyjevog U-kriterija za podudaranje tri i više skupina Kruskal-Wallisov test.
Zbraja se hrpa obje uparene vibracije jedan poredak, na neki način stavljanje usamljenosti iza koraka povećanja znakova i dodjeljivanja niže vrijednosti nižeg ranga. U različitim jednakim vrijednostima, od znakova nekoliko kožnih od njih se očekuje da budu aritmetička sredina uzastopnih vrijednosti činova.
Na primjer, dva samca, jak, koji zauzimaju 2 i 3 mjesta (rang) u jednom rangiranom redu, mogu imati istu vrijednost. Također, očekuje se da će koža od njih biti jednaka (3 + 2) / 2 = 2,5.
Presavijeni red s jednim rangom ima broj rangova jednak rangu:
N = n 1 + n 2
de n 1 - broj elemenata u prvom odabiru, a n 2 - broj elemenata u drugom odabiru.
Opet smo dali jedan redak za rangiranje po dva, koji se zbrajaju do jednog prvog i drugog odabira, pamteći vrijednost rangova za jedinicu kože. Pídrakhovuêmo okremo zbroj rangova, sho ispustio dio elemenata prve selekcije, a okremo - dio elemenata druge selekcije. Pokazano je da je najveći od dva zbroja ranga (T x) izbor n x elemenata.
Nareshti, znamo vrijednost Mann-Whitneyjevog U-kriterija za formulu:
Smanjenje vrijednosti U-kriterija jednako je tablici za obrnutu razinu statističke značajnosti (p=0,05 ili p=0,01) s kritičnim vrijednostima U kada se specificira broj jednakih uzoraka:
Kriterij Vílkokson za viborovy vibery (T-Criteri Vílkoxon, Criteri Vílkoxon, Criteriy Rangiv Vílkoxon, Criteriy Sumi Rangiv Vílkoxon) - neparametarski statistički kriterij, Shaho Wickingist za Porívnynnya Two-scale the Orizhnaya Two-The-Frizhnaya Two.
Bit metode je da se apsolutne vrijednosti manifestacije štete određuju u onom što je izravno. Za koji red se rangiraju sve apsolutne vrijednosti štete, a zatim se rangiraju. Ako je uništenje tog chi ínshiy bík vydbuvayutsya vipadkovo, tada zbroj njihovih redova vyyavlyaetsya približno jednak. Ako je intenzitet destrukcije u jednom smjeru veći, tada će zbroj rangova apsolutnih vrijednosti destrukcije u proliferativnom području biti znatno niži, manji bi mogao biti s obrnutim promjenama.
Test viših proponacija 1945. od strane američkog statističara i kemičara Franka Wilcoxona (1892-1965). U istom znanstvenom robotu autor je opisao još jedan kriterij koji stagnira u različitim redovima neovisnih vibracija.
Wilcoxonov t-kriterij je pobjednički za ocjenu održivosti između dva niza pobjeda, pobjeda za jedan te isti broj žena, ili u različitim umovima ili u različitom satu. Danski test zgrade otkriva izravnost i očitovanje promjena - zato su pokazatelji u jednoj pravoj liniji više izlomljeni, u drugoj niži.
Klasični kraj situacije, u kojem se slučaju Wilcoxonu T-kriterij za razmetanje brakova produžuje "prije zadnjeg", ako se naznake ispravljaju do zadnjeg od posljednjeg. Primjerice, prema učinkovitosti antihipertenzivne terapije, arterijski tlak ovisi o prije i nakon uzimanja lijeka.
Ovim redoslijedom, Wilcoxonov T-kriterij za vezivanje vibracija dodjeljuje se za sljedeću formulu:
de ΣRr - zbroj rangova koji odgovaraju netipičnim promjenama pokazatelja.
Razlika između vrijednosti Wilcoxonovog T-testa jednaka je kritičnoj prema tablici za smanjenu razinu statističke značajnosti ( p=0,05 ili p=0,01) s danim brojem odabira n:
Farmaceutska tvrtka provodi praćenje novog lijeka iz skupine nesteroidnih protuupalnih lijekova. Za to je odabrana skupina od 10 volontera koji boluju od GRVI s hipertermijom. Imali su tjelesnu temperaturu do te nakon 30 minuta nakon uzimanja novog lijeka. Potrebno je podići visnovkas o značaju smanjenja tjelesne temperature nakon uzimanja lijeka.
N | prizvische | t tijelo prije uzimanja lijeka | t tíla nakon uzimanja lijeka | Razlika prikaza, d | |d| | Rang |
1. | Ivanov | 39.0 | 37.6 | -1.4 | 1.4 | 7 |
2. | Petrov | 39.5 | 38.7 | -0.8 | 0.8 | 5 |
3. | Sidoriv | 38.6 | 38.7 | 0.1 | 0.1 | 1.5 |
4. | Popov | 39.1 | 38.5 | -0.6 | 0.6 | 4 |
5. | Nikolajev | 40.1 | 38.6 | -1.5 | 1.5 | 8 |
6. | Kozliv | 39.3 | 37.5 | -1.8 | 1.8 | 9 |
7. | Ignatijev | 38.9 | 38.8 | -0.1 | 0.1 | 1.5 |
8. | Semenov | 39.2 | 38.0 | -1.2 | 1.2 | 6 |
9. | Egorov | 39.8 | 39.8 | 0 | — | — |
10. | Aleksijev | 38.8 | 39.3 | 0.5 | 0.5 | 3 |
T = ΣRr = 3 + 1,5 = 4,5
Kriterіy χ 2 Pіrsona - tse neparametrijskim Postupak YAKY dozvolyaє otsіniti znachuschіst vіdmіnnostey mіzh factically (viyavlenoyu u rezultatі doslіdzhennya) kіlkіstyu rezultatіv ABO yakіsnih karakteristike vibіrki scho potraplyayut u kožni kategorіyu da theoreticity kіlkіstyu, jak mozhna ochіkuvati u skupini znan vivchayutsya na spravedlivostі nultu hipotezu. Na jednostavniji način, metoda omogućuje procjenu statističke značajnosti dvaju ili više važnih pokazatelja (učestalosti, učestalosti).
Kriterij hi-kvadrat za analizu tablice uspjeha cijepanja i predlaganja 1900. engleskih matematičara, statističara, biologa i filozofa, utemeljitelja matematičke statistike i jednog od utemeljitelja biometrije Karl Pearson(1857-1936).
Za analizu se može koristiti kriterij hi-kvadrat tablica uspjeha Kako izmjeriti učestalost rezultata u ugari uz prisutnost faktora rizika
Vikend je (1) | Nema izlaza (0) | Usyogo | |
Riziku chinnik ê (1) | A | B | A+B |
Chinnik riziku vídsutníy (0) | C | D | C+D |
Usyogo | A+C | B+D | A+B+C+D |
Kako svaki dan ispuniti takvu tablicu? Pogledajmo mali primjer.
Provesti doslidzhennya infuziju piletine na rizik od razvoja hipertenzije. Za ovu bulo odabrane su dvije grupe maturanata - prvoj je otišlo 70 bodova, tako da danas popuše ni manje ni više nego 1 kutiju cigareta, a prijatelj ima 80 ne-kratica istih godina. U prvoj skupini, 40 slučajeva pokazalo je trzanje arterija. U drugom se sumnjalo na arterijsku hipertenziju u 32 slučaja. Očigledno, normalni arterijski tlak u skupini kurtsív bio je u 30 slučajeva (70 - 40 = 30), au skupini ne-kurtsív - u 48 (80 - 32 = 48).
Ispunimo podatke chotiripole tablicom uspjeha:
U otrimaniy tablici konjugacije koža, red pjevaju grupe dosledzhuvanih. Stovptsí - pokazuju broj simptoma zbog arterijske hipertenzije i normalnog arterijskog tlaka.
Zavdannya, kako se staviti ispred doslidnika: koje su statistički značajne razlike između učestalosti osiba s arterijskim tlakom srednjeg i ne-kursa? Moguće je ispraviti na lancu podizanjem kriterija Pearsonovog hi-kvadrata i podešavanjem vrijednosti, što se dogodilo, s kritičnom.
Za analizu kriterija x-kvadrata potrebno je:
Danski algoritam je zastosuêmo kao za chotiripole, tako bogate-poly tablice.
U tom slučaju, kao da je vrijednost kriterija χ 2 veća od kritične, postoje izvješća o prisutnosti statističke veze između faktora rizika, što se ispostavlja kao rezultat kada je značajnost jednaka.
Značajno je da statistička značajnost utjecaja faktora pušenja na učestalost arterijske hipertenzije opada prema donjoj tablici:
χ 2 = (40-33,6) 2 / 33,6 + (30-36,4) 2 / 36,4 + (32-38,4) 2 / 38,4 + (48-41,6) 2 / 41,6 \u003d 4,396.
Fisherov egzaktni kriterij je kriterij koji pobjeđuje za izjednačavanje dva izvanredna pokazatelja, koji karakterizira učestalost znakova pjevanja, koja može imati dvije vrijednosti. Ovisno o točnom Fisherovu egzaktnom testu, podaci su grupirani poput chotiripole tablice.
Prethodno je predložen kriterij Ronald Fisher u knjizi o jogi "Dizajn eksperimenata". Tse je postao sudbina 1935. I sam Fischer potvrdio je da je Yogo Muriel Bristol zakucala svaku pomisao. Početkom 1920-ih Ronald, Muriel i William Roach ostali su u Engleskoj na posljednjoj poljoprivrednoj stanici. Muriel je inzistirala, kao što možete vidjeti, da su joj u neku vrstu slijeda sipali čaj i mlijeko u šalicu. U tom trenutku nemoguće je poništiti ispravnost njezina vyslovlyuvannya.
To je dalo Fisherove ideje o "nultoj hipotezi". Metoda nije bila pokušati donijeti, scho Muriel može odabrati razliku između pripremljenih šalica čaja na drugačiji način. Virishen Bulo prostuvati hipotezu, scho izabrati ženu da opljačka um. Utvrđeno je da se nulta hipoteza ne može dokazati, niti utemeljiti. Natomist í̈is može se pozvati na sat eksperimentiranja.
Bulo je napravio 8 šalica. Na prvi čotiri u zdjelu se ulije mlijeko, a u druge čotire čaj. Šalice su bile razbijene. Bristol je potaknut da kuša čaj za okus i podijeli šalice prema načinu pripreme čaja. Kao rezultat toga, nije dovoljno udružiti se u dvije grupe. Povijest dokazuje da je eksperiment daleko.
Zavdyaki na Fischerov test, vrijednost onoga što je Bristol intuitivno je promijenjena na 0,01428. Tobto, moguće je ispravno označiti šalicu u jednoj vipadki od 70. Ali svejedno, nije moguće svesti na nulu šansu koju Madame smatra vipadkovom. Naučite kako povećati broj šalica.
Tsya ístoríya dala je post razvoj "nulte hipoteze". Slično je propagiran i točan Fisherov kriterij, čija je bit u razvrstavanju svih mogućih kombinacija ugarskih i neovisnih promjena.
Fisherov egzaktni kriterij važniji je od izjednačavanja malih odabira. Dva su razloga za to. Prije svega, kriteriji za izračun mogu biti glomazni i mogu potrajati puno vremena ili potreba za napornim proračunskim resursima. Na drugi način, kriterij je točan (koji ste trebali imenovati u svoje ime), što vam omogućuje da u prošlosti zabijete s malim brojem gardova.
Posebno relevantno za Fisherov točan test u medicini. Riječ je o važnoj metodi obrade medicinskih podataka, koja poznaje vlastiti zastoj u bogatim znanstvenim istraživanjima. Zavdyaki možete pratiti međuodnos sing faktora i rezultata, uravnotežiti učestalost patoloških stanja između dvije skupine slučajeva itd.
Analog Fisherovog točnog testa ê Pearsonov hi-kvadrat test, pri čemu Fisherov egzaktni kriterij može imati veći stupanj napetosti, posebno kada su male vibracije jednake, u vezi s čime može postojati razlika.
Doduše, prikazana je učestalost rađanja djece iz kongenitalnog razvoja (BVR) ovisno o kokošijem satu trudnoće majke. Za to su odabrane dvije skupine trudnica, od kojih je jedna eksperimentalna, koju čini 80 žena, onih koje su pušile u prvom tromjesečju trudnoće, a druga grupa žena, koja uključuje 90 žena, koje vode zdrav način života za dugo vremena. Broj epizoda VVR fetusa u eksperimentalnoj skupini bio je 10, u skupini s rupturom - 2.
Sastavili smo slučajnu tablicu uspjeha:
Fisherov točan kriterij pokriven je sljedećom formulom:
de N - ukupan broj preživjelih u dvije skupine; ! - faktorijel, koji je dodavanje broja nizu brojeva, čija je koža manja od prethodnog za 1 (na primjer, 4! \u003d 4 3 2 1)
Kao rezultat, poznato je da je P = 0,0137.
Prednost metode je valjanost uzetog kriterija točne vrijednosti jednake značajnosti p. Tobto, otrimane u primjeni vrijednost od 0,0137 i ê razina značajnosti razlika između skupina za učestalost razvoja kongenitalnih malformacija fetusa. Potrebno je uravnotežiti broj s kritično jednakim značajem, što je medicinskom dokumentacijom prihvaćeno za 0,05.
Naša guza P< 0,05, в связи с чем делаем вывод о наличии прямой взаимосвязи курения и вероятности развития ВПР плода. Частота возникновения врожденной патологии у детей курящих женщин статистически значимо выше, чем у некурящих.
Rezultat šanse je statistički pokazatelj (rusko ime joge smatra se kratkotrajnim poput ZOSH, a engleski naziv je OR u "odds ratio"), jedan od glavnih načina da se numerički opiše koliko puta dan, odnosno očitost rezultata pjesme, to je zbog prisutnosti faktora u danu u određenoj statističkoj skupini.
Izraz "šansa" došao je iz teorije kockanja, de za čiju je pomoć razumijevanje značilo prijenos dobitnih pozicija na one loše. U znanstvenoj medicinskoj literaturi pokazatelj šansi prvi se put naslućuje 1951. godine u djelu J. Cornfielda. Prošle godine objavljen je rad u kojem se navodi da je za promicanje šansi potrebno 95% intervala povjerenja. (Cornfield, J. A Method for Estimating Comparative Race from Clinical Data. Applications to Cancer of the Lung, Breast, and Cervix // Journal of the National Cancer Institute, 1951. - N.11. - P.1269-1275.)
Postavka šanse omogućuje procjenu odnosa između prvog rezultata i faktora rizika.
Postavljanje šansi omogućuje vam izjednačavanje skupina onih koji prate učestalost pojavljivanja raspjevanog referenta rizika. Važno je da je rezultat zastosuvannya vídnoshnja chancesív ê ne manje od statističke važnosti veze između faktora i rezultata, i íí̈ kílkísna otsínka.
Uvođenje šansi je vrijednost razlomka, za broj jedan to je šansa za pjevanje pod prvom grupom, a za standard slučaja ista pod drugom grupom.
prilikaê povećanje broja doslidzhuvanih, koji mogu imati jedan znak (izlaz ili faktor), do dosledzhuvanih, za koje se znak daje svaki dan.
Primjerice, odabrana je skupina pacijenata koji su operirani zbog nekroze gušterače, čiji je broj bio 100 slučajeva. Nakon 5 godina od posljednjeg dana, život je izgubilo 80 osoba. Očigledno, šansa za preživljavanje postaje 80 prema 20 ili 4.
Na ručni način, ê rozrahunok vídshennya vídshennya zí vídníním danih í í tabí 2h2:
Vikend je (1) | Nema izlaza (0) | Usyogo | |
Riziku chinnik ê (1) | A | B | A+B |
Chinnik riziku vídsutníy (0) | C | D | C+D |
Usyogo | A+C | B+D | A+B+C+D |
Za ovu tablicu šanse se izračunavaju prema sljedećoj formuli:
Također je važno ocijeniti statističku značajnost otkrivene veze između rezultata i faktora rizika. To je zbog činjenice da se u slučaju niskih vrijednosti šansi, blizu jedan, veza može pojaviti suttêvim i kriva za laž u statističkoj vysnovki. A, s druge strane, s velikim OR vrijednostima, pokazatelj se čini statistički beznačajnim, a također ga je moguće prevladati naglašenim zvukom.
Kako bi se procijenila važnost promjene, šanse se izračunavaju između 95% intervala pouzdanosti (kratica je 95% DI ili 95% CI na engleskom "interval pouzdanosti"). Formula za vrijednost gornje granice od 95% CI:
Formula za vrijednost donje granice od 95% CI:
Osim toga, statistička značajnost promjene šansi procjenjuje se na stanje kože općenito, ovisno o vrijednosti od 95% intervala povjerenja.
Zamislimo dvije skupine: persha se sastojala od 200 žena, u nekima je dijagnosticiran kongenitalni razvoj fetusa (Vihid +). Od njih pušio sat vremena trudnoće (Faktor+) - 50 osib (ALI), nepušači (Factor-) - 150 osib (S).
Druga grupa uključivala je 100 žena bez znakova kongenitalnih malformacija fetusa (Vihid -) među kojima su pušile sat vremena trudnoće (Faktor +) 10 osib (B), nije pušio (Factor-) - 90 osib (D).
1. Sastavljanje chotiripole tablice uspjeha:
2. Određivanje značenja šansi:
ILI = (A * D) / (B * C) = (50 * 90) / (150 * 10) = 3.
3. Znati između 95% CI. Vrijednost donje granice, koja je osigurana gornjom formulom, zbrojena je na 1,45, a gornja - 6,21.
Na taj način istraživanje je pokazalo da su šanse za pušače 3 puta veće među pacijentima s dijagnozom fetalne CM, a manje kod žena bez znaka fetalne CM. Pojava, koja se smatra, je statistički značajna, 95% CI rezultati ne uključuju 1, vrijednost donje i gornje vrijednosti između više od 1.
Rizik - svrha pojavljivanja pjesme rezultat, na primjer, bolesti i ozljede. Rizik može uzeti vrijednost od 0 (postoji trenutni rezultat do rezultata sljedećeg dana) do 1 (nepovoljan rezultat se boduje za sve pojave). U medicinskoj statistici, u pravilu, postoje promjene u riziku od posljedica ugare, bez obzira na bilo koji čimbenik. Pacijenti su mentalno podijeljeni u 2 skupine, jedna od njih se uklapa, a druga - ne.
Vdnosny risik - tse promijeniti učestalost rezultata u sredini cilja, za koji je faktor dodan, koji je povećan, na učestalost rezultata u sredini cilja, jer nije dodan faktoru drugi. U znanstvenoj literaturi naziv emisije često je kratkotrajan – OR ili RR (Relativni rizik).
Razrahunok od istaknutog rizika postavljanja medicinske statistike iz gospodarstva. Ispravna procjena utjecaja političkih, ekonomskih i društvenih čimbenika na potražnju za robom može dovesti do uspíhu, a podcjenjivanje tih čimbenika - do financijskih neuspjeha i bankrota pídpriêmstva.
Vídnosny rizik vikoristovuêtsya ymovírnosti rezultat zaleno víd nayavností chinnik riziku. Primjerice, u procjeni utjecaja pušenja na učestalost hipertenzivnih bolesti, prema učestalosti raka dojke u slučaju oralnih kontraceptiva i dr. Vídnosny rizik najvažniji je pokazatelj priznatih pjevačkih metoda istraživanja i istraživanja koja se provode zbog mogućih nuspojava.
Za rozrahunka dobrog rizika potrebno je:
Pokazatelj vanjskog rizika jednak je 1 kako bi se utvrdila priroda veze između faktora i rezultata:
Također, vrijednosti se procjenjuju između 95% intervala povjerenja. Osim toga, uvredljive vrijednosti - i donje, i gornje među - mjere se jedna po jedna od 1, ili, drugim riječima, interval pouzdanosti ne uključuje 1, postoji mnogo dokaza o statističkoj značajnosti otkrivena povezanost između faktora i rezultata pomilovanja<0,05.
Iako je donja granica između 95% DI manja od 1, a gornja veća, postoje dokazi o prisutnosti statističke značajnosti doprinosa faktora učestalosti rezultata, bez obzira na vrijednost pokazatelj RR (p>0,05).
Godine 1999. roci u Oklahomi proveo je praćenje bolesti ljudi na odvodu odvoda. Kao faktor koji dolazi u obzir, došlo je do redovitog porasta brze hrane. U prvoj skupini bilo je 500 ljudi, koji su stalno jeli švidko í̈zhey, u sredini kojih su dijagnosticirani u 96 slučajeva. U drugoj skupini odabrano je 500 zdravih prehrambenih navika, a u sredini je tuba dijagnosticirana kod 31 bolesnika. Vihodyachi z otrimanih danikh, bula potaknuo je sljedeću tablicu sreće:
Pearsonov korelacijski kriterij je metoda parametarske statistike koja omogućuje određivanje prisutnosti ili prisutnosti linearne veze između dva značajna pokazatelja, kao i procjenu točnosti i statističke značajnosti. Inače, Pearsonov korelacijski kriterij omogućuje vam da odredite što mijenja (promjenjuje rast) jedan pokazatelj u slučaju promjene drugih? U statističkim slučajevima i visnovkama koeficijent korelacije je označen kao r xy ili R xy.
Pearsonov korelacijski kriterij za cijepanje od strane tima britanskih znanstvenika Karl Pearson(1857.-1936.) 90-ih godina 19. stoljeća, radi jednostavnosti, analiza kovarijance dva vipadske vrijednosti. Zločin Karla Pearsona, testiran je i Pearsonov korelacijski kriterij Francis Edgeworthі Raphael Weldon.
Pearsonov kriterij korelacije omogućuje da se odredi koliko je čvrstoća (ili snaga) korelacije između dva pokazatelja, koji su slični Kilkysny ljestvici. Za pomoć dopunskih rozrachunkiv, može se također označiti, na temelju statistički značajnih manifestacija veza.
Tvrđava, na dodatnom Criterius Koretantsi Pírson, možete posjetiti Patten na Navodniyi, MÍZ TEETROUM TETO TEMISTY LUKOCITSIA U KRAY IN GOSTERIA SLIKARSTVO IINFECTSIA, MÍZHODNESS NA PLAĆU PAZIêNTA, MÍZ TEETROUM TETO TEMISTY LUKOCITSIA U KRAY IN GOSTERIA SLIKARSTVO IINFECTSIA, MÍZHODNESS NA PLAĆU PAZIêNTA, MÍZ TEETROUM TETO TEMISTY LUKOCITSIA.
Na primjer, rast djeteta da legne u njeno stoljeće, tobto chim starije dijete, tim vani. Ako uzmemo dvoje djece različite dobi, tada će s visokom razinom rasta starije dijete biti veće, mlađe će biti niže. Taj se fenomen naziva ustajalost, što prenosi uzročno-nasljednu vezu između pokazatelja. Razumljivo je da među njima postoji korelacija, što znači da promjenu jednog pokazatelja prati i promjena drugog pokazatelja.
U drugoj situaciji možemo vidjeti povezanost između rasta djeteta i učestalosti otkucaja srca (HR). Kao što vidite, vrijeđajuće vrijednosti leže neprekidno u sredini, do toga u većim godinama djeca veće dobi (a samim tim i starije dobi) imaju nižu vrijednost otkucaja srca. Tobto korelativno zv'yazyok posterigatimes i svibanj majka dosit visoka tísnotu. Međutim, kako uzimamo djecu iste dobi, alery rasta, tada je, više od svega, njihov broj otkucaja srca neprimjetan, u vezi s čime je moguće napraviti brkove o neovisnosti otkucaja srca u rastu.
Pokazujući stražnji dio, važno je razlikovati temeljnu statistiku i razumijevanje povezanosti i zapuštenosti naznaka za stvaranje najboljih vina.
Izračun Pearsonovog koeficijenta korelacije temelji se na sljedećoj formuli:
Vrijednosti Pearsonovog koeficijenta korelacije tumače se iz apsolutne vrijednosti. Moguće vrijednosti koeficijenta korelacije variraju od 0 do ±1. Što je veća apsolutna vrijednost r xy - to je preciznija veza između dvije vrijednosti. r xy = 0 da se govori o punoj prisutnosti poziva. r xy = 1 - ukazuje na prisutnost apsolutne (funkcionalne) veze. Čak se i vrijednost Pearsonovog korelacijskog kriterija pokazala većom za 1 ili manje od -1 - oprost je dopušten u rozrahunci.
Da biste procijenili točnost ili snagu korelacijske veze, koristite najšire prihvaćene kriterije, temeljene na apsolutnim vrijednostima r xy< 0.3 свидетельствуют о slab veza, r xy vrijednost víd 0,3 do 0,7 - o poveznici sredina točnost, r xy vrijednost > 0,7 - oko jaka zv'azku.
Točna procjena snage korelacijske veze može se uzeti kao usporedba s Chaddock tablicom:
Procjena statističke značajnosti koeficijenta korelacije r xy temelji se na dodatnom t-testu koji se temelji na sljedećoj formuli:
Razlika između vrijednosti t r jednaka je kritičnim vrijednostima za jednaku važnost broja koraka slobode n-2. Yakscho t r shift t crit, žuriti oko statističke važnosti otkrivene korelacijske veze.
Metoda istraživanja bila je otkriti, utvrditi točnost i statističku značajnost korelacije između dva značajna pokazatelja: jednakog testosteronu u krvi (X) i jednakom stotom dijelu mase m'yazovoi u tijelu (Y). Izlazni podaci za odabir, koji se zbrajaju od 5 dodatnih podataka (n = 5), prikazani su u tablici:
p align="justify"> Spirmanov koeficijent korelacije ranga je neparametrijska metoda koja pobjeđuje metodu statističkog usklađivanja između entiteta. Na ovom mjestu se naznačuje stvarni stupanj paralelnosti između dva velika reda znakova koji su uvrnuti, a uz pomoć kikišno izraženog koeficijenta daje se ocjena točnosti umetnute veze.
Ovaj je kriterij razvijen i predložen za provođenje korelacijske analize u rotacijama 1904. godine. Charles Edward Spirman, engleski psiholog, profesor na sveučilištima London i Chesterfield.
Koeficijent korelacije ranga Spirmen vikoristovuêtsya za otkrivanje i procjenu nepropusnosti veze između dva reda kílkísnih pokaznív, scho zístavlyayutsya. U tom slučaju, kako se rangovi pokazatelja, poredani po stupnju rasta ili pada, u većem stupnju mijenjaju (veća vrijednost jednog pokazatelja dobiva veću vrijednost drugog pokazatelja – npr. kada se ustanovi rast pacijenta , da se yogore može pojaviti), ravno korelacijske veze. Ako rangovi pokazatelja mogu biti proporcionalni izravnosti (veliki značaj jednog pokazatelja je manje značajan od drugog - na primjer, s danim stoljećem, taj je broj otkucaja srca brz), tada govorimo o reverzibilan zv'yazok mizh pokaznikami.
U vezi s činjenicom da je koeficijent metoda neparametarske analize, ponovna provjera normalnosti distribucije nije potrebna.
Loše indikacije mogu biti razmjerne s neprekinutom ljestvicom (na primjer, broj eritrocita u 1 µl krvi) i po redu (na primjer, rezultati od 1 do 5).
Učinkovitost i točnost procjene Spirmanovom metodom opada, jer je razlika između različite vrijednosti neke vrste vimiryuvanih vrijednosti za napraviti je super. Nije preporučljivo osvojiti Spearmanov koeficijent, jer je izračunata neujednačena vrijednost vrijednosti varijable.
Analiza koeficijenta rang korelacije Spirmana uključuje sljedeće faze:
Uz drugačiji koeficijent korelacije ranga, mentalno procijenite nepropusnost veze između znakova, uzimajući u obzir vrijednost koeficijenta manju od 0,3, što je znak slabe čvrstoće veze; vrijednost veća od 0,3, a manja od 0,7 znak je veze niske gustoće, a vrijednost 0,7 znak je velike debljine veze.
Također, da biste procijenili točnost veze, možete pobijediti Chaddock ljestvica.
Statistička značajnost uzetog koeficijenta procjenjuje se uz pomoć Studentovog t-testa. Ako je vrijednost t-kriterija manja od tablične vrijednosti za zadani broj koraka slobode, statistička je značajnost odnosa statistički značajna, koju treba čuvati - svaki dan. Ako je veći, tada se korelacijski link smatra statistički značajnom.
Kriterij Kolmogorov-Smirnov je neparametarski kriterij radi klasičnog obrazloženja reverifikacije jednostavnih hipoteza o valjanosti analizirane selekcije prema postojećem zakonu. Najčešća upotreba ovog kriterija za ponovnu provjeru postojećih sekvenci normalnosti je podijeljena.
Kolmogorov-Smirnov kriterij Andriyem Mikolayovich Kolmogorovі Mikola Vasilovič Smirnov.
Kolmogorov A.M. (1903-1987) - Heroj socijalističke Pratsí, profesor u Moskvi državno sveučilište Akademik Akademije znanosti SRSR - najveći matematičar 20. stoljeća, jedan od utemeljitelja moderne teorije moderne.
Smirnov N.V. (1900-1966) - dopisni član Akademije znanosti SRSR, jedan od tvoraca neparametarskih metoda u matematičkoj statistici i teorije graničnih podjela statistike reda.
Za godinu, kriterij za uspjeh Kolmogorov-Smirnov dopunjen je metodom zastosuvannya za ponovnu provjeru pravilnosti za normalnost koju je izvršio američki statističar, profesor na Sveučilištu George Washington. H'hubert Lilliefors(Hubert Whitman Lilliefors, 1928.-2008.). Profesor Lílíêfors buv jedan od pionira zastosuvannya računalna tehnologija u statističkim ružama.
Hubert LillieforsOvaj vam kriterij omogućuje procjenu valjanosti razlika između dviju potpodjela, uključujući mogućnost stosuvannya za procjenu otpornosti podjela na zakon uobičajene podjele.
Kolmogorov-Smirnov kriterij imenovanja za ponovnu provjeru normalnosti distribucije računskih podataka.
Za veću pouzdanost, uzimajući u obzir podatke analiza, selekcije se mogu učiniti velikim: n ≥ 50. Kada je veličina procijenjene ukupnosti 25 do 50 elemenata, Bilshovljeve korekcije se dodaju na ljestvicu.
Kriterij Kolmogorov-Smirnov dodjeljuje se za potporu posebnim statističkim programima. Temelji se na statistici uma:
de sup S- gornja granica množitelja S je točna, F n- funkcija rozpodílu doslídzhuvanoí̈ suupností, F(x)- funkcija normalne distribucije
Vrijednost mobilnosti, koja je izvedena, temelji se na prijemima, što je prosječni i standardni oporavak normalnog rozpodílu vídomí a priori, i ne procjenjuju se na temelju podataka.
Međutim, u praksi se parametri izračunavaju bez posrednih podataka. U ovom slučaju, kriterij normalnosti uključuje preklopnu hipotezu ("koliko uzeti D statistike dane ili veće važnosti, tako da leži u sredini i standardne devijacije, izračunate iz podataka") i induciraju Lilliefors (Lilliefors, 19)
Kako je značajna statistika Kolmogorov-Smirnov (str<0,05), то гипотеза о том, что соответствующее распределение нормально, должна быть отвергнута.
Metoda grupiranja također dopušta varijacija(minlivist, colivania) znak. Uz naizgled mali broj samaca, varijacija varijance pobjeđuje na ljestvici onih niskih, koji čine savršenstvo braka. Red se zove rangiran, yakscho sam roztashovani za rostannyam (promijenjene) znakove.
Zaštitite poredak redaka kako biste istima dali nisku vidljivost, ako trebate proporcionalnu karakteristiku varijacije. Osim toga, u bogatim vipadkama, majka je dovedena udesno sa statističkim kombinacijama, koje čine veliki broj usamljenika, što je važno prikazati u pojedinom redu. Na spoju s cim-om za primarno prepoznavanje globalnog priznanja statističkih podataka i posebno smanjenja varijacije, znak nastavka pojavljivanja i procesa treba spojiti s grupom, te izraditi rezultate grupiranja. kao grupni stol.
Kao grupna tablica postoje samo dva grafikona - grupe prema predznaku (opcije) i broju grupa (učestalost i učestalost), nazivaju se red ruža.
Nekoliko ruža - najjednostavnija varijanta strukturnog grupiranja za jedan znak, prikazana u grupnoj tablici s dva stupca, u kojoj postoji varijanta učestalosti znakova. U bagatioh vipadkah takva strukturna grupa, tobto. Od presavijanja redova počinje raspodjela statističke građe.
Strukturno grupiranje u pod-podijeljenom redu može se transformirati u desno strukturno grupiranje, budući da će pojavljivanje grupe biti obilježeno ne samo učestalošću, već i drugim statističkim pokazateljima. Prepoznavanje reda ruža u naslovu znak je varijacije. Teorija je razvijena na izvješći način pomoću matematičke statistike.
Red rozpodílu dilyat na atributivne(grupirane po atributnim znakovima, npr. stanovništvo je podijeljeno po statusu, nacionalnosti, obiteljskom taboru) i varijacija(Grupiranje za kílkísnimi znakove).
Varijacijska serija je grupna tablica, tako da zamjenjuje dva grafikona: grupiranje pojedinaca za jedan broj znakova, taj broj pojedinaca u grupi kože. Intervali varijacijskih nizova potvrđuju se jednakim i zatvorenim zvukom. Varijacije pored napredovanja grupiranja stanovništva Rusije za veličinu prosječnog dohotka penija po glavi stanovnika (tablica 3.10).
Tablica 3.10
Rozpodíl broj stanovništva Rusije za vrijednost prosječnog dohotka po glavi stanovnika u 2004-2009 godina.
Skupine stanovništva prema veličini prosječnog dohotka peni po glavi stanovnika, rub./mís. |
Broj stanovništva grupe, u % prije rezultata |
|||||
8 000,1-10 000,0 |
||||||
10 000,1-15 000,0 |
||||||
15 000,1-25 000,0 |
||||||
Ponad 25.000,0 |
||||||
Svo stanovništvo |
Redovi varijacija podijeljeni su na diskretne i intervalne intervale. Diskretna varijacijski redovi dodajte opcije za diskretne znakove koji se mijenjaju na uskim granicama. Uz stražnjicu diskretne varijantne serije, ruske obitelji možete probiti za broj nove djece.
interval varijantni redovi kombiniraju opcije ili bez prekida, ili se mijenjaju u širokim rasponima diskretnih znakova. Interval ê variatsiyny niz rozpodílu stanovništva Rusije za vrijednost prosječnih prihoda peni po glavi stanovnika.
Diskretni varijacijski redovi nisu praktični za zaustavljanje vrlo često. S vremena na vrijeme preklapanje je nezgodno, ali skladište grupe obilježeno je specifičnim opcijama, koje doista mogu biti konačni znakovi grupe.
Najveća širina niza varijacija intervala. Kada ih presavijeni vinikaê presavijenu hranu o broju grupa, kao i veličini intervala, koji se trebaju utvrditi.
Načela razdvajanja ove prehrane razmatrana su u odjeljku o metodologiji induciranja statističkih grupiranja (razd. stavak 3.3).
Redovi varijacija su zasíb gortannya ili sažimanje različitih informacija u kompaktnom obliku, iza njih možete dodati jasnu prosudbu o prirodi varijacije, blizinu identiteta znaka fenomena koji treba dodati nizu. I što je još važnije, vrijednost varijacijskog niza je ona koja broji najvažnije karakteristike varijacije (div. Poglavlje 7).
Pri obradi velikih nizova informacija, što je posebno važno za sat svakodnevnog znanstvenog istraživanja, prije posljednjeg dana, potrebno je ozbiljno organizirati ispravno grupiranje podataka. Ako se daju diskretnog karaktera, onda problemi, kakve smo imali, nisu krivi - potrebno je jednostavno poboljšati učestalost kožnih znakova. Kako završiti oznaku neprekinuto karakter (koji može biti širi je praktičan), tada je izbor optimalnog broja intervala za grupiranje znakova dobar za trivijalne zadatke.
Za grupiranje bez prekida fluktuacija, cijeli varijacijski raspon znakova podijeljen je na papaline intervala prije.
Grupirano po intervalu (neprekinuto) varijacija u blizini imenovati rang prema vrijednostima znakova intervala (), koji su označeni odjednom najvažnijim frekvencijama () broja upozorenja koja su potrošena u i-tom intervalu, ili vidljivim frekvencijama ():
Intervali koji znače znakove |
||||||
mi frekvencija |
Histogramі kumulirati (ogiva), već smo navodno pregledali na čudesan način vizualizacije podataka, koji nam omogućuje da uzmemo u obzir prvo otkriće o strukturi podataka. Takvi grafovi (slika 1.15) bit će isti za kontinuirane podatke, kao i za diskretne podatke, samo zbog činjenice da kontinuirani podaci često ispunjavaju područje svojih mogućih vrijednosti, prihvaćajući jesu li značajni.
Mal. 1.15.
Tom stovptsí na histogramu i kumulativna krivnja se drže zajedno, nemojte majke djece, gdje ne troše značenja znakova u granicama upotrebljivog(zato histogram i kumulat nisu zbog matičnog "diroka" na osi apscise, u kojoj ne koriste vrijednost promjene koja je uvijena, kao na slici 1.16). Visina stompchika je upozorenje na frekvencijski broj koji je potrošen u zadanom intervalu, ili upozorenje na vidljivu frekvenciju-česticu. intervalima nije kriv za peretinatisya i mogu u pravilu imati istu širinu.
Mal. 1.16.
Histogram i poligon ê aproksimacije širine krivulje kretanja (diferencijalna funkcija) f(x) teorijski rozpodílu, koji se razmatra u toku teorije imovirnosti. Iz tog razloga, može biti toliko važno u prvoj statističkoj analizi računa bez prekida podataka - na prvi pogled, moguće je napraviti vysnovki o hipotetskom zakonu distribucije.
Kumulati - krivulja akumulativnih frekvencija (dijelova) intervalne varijacijske serije. Graf integralne funkcije iscrtan je s kumulativom F(x), što se također razmatra u okviru teorije imovirnosti.
Općenito, histogrami i kumulativni koncepti povezani su s istim s neprekinutim podacima i njihovim intervalnim nizom varijacija, tako da su njihovi grafikoni empirijske procjene funkcije gustoće fluktuacija i funkcije rozpodílu očito.
Pobudov serije intervalnih varijacija počinje od određenog broja intervala k. Prvi je zadatak, možda, najkompliciraniji, najvažniji i najdvosmisleniji za sljedbenika prehrane.
Broj intervala nije kriv, ali mi smo premali, tako da kad histogram ispadne previše gladak ( preglađen), konzumirajući sve osobitosti niskosti vikenda – na sl. 1.17 možete razmišljati, kao i sami podaci, o onome što je potaknulo grafikone na sl. 1.15 koristiti histograme s manjim brojem intervala (lijevi grafikon).
U isto vrijeme, broj intervala nije kriv što je prevelik - inače ne možemo procijeniti raspon distribucije podataka koji se pomiču duž numeričke osi: histogram vida nije izglađen. (podmazano) iz nezamjenjivih intervala, neravnomjeran (razd. sl. 1.17, desni graf).
Mal. 1.17.
Kako možete odrediti najbolji broj intervala?
Sche 1926. str. Herbert Sturges (Herbert Sturges) zaproponuvao formulu za izračun broja intervala, gdje je potrebno razbiti nepoznatu vrijednost posljednjeg znaka. Ova formula istine postala je prepopularna - većina statističkih asistenata propagirati će se, za kratice koje će osvojiti i bezlične statističke pakete. Naskílki tse je istina i u uobičajenim raspoloženjima - ê još ozbiljnije prehrane.
Dakle, koja je osnova Sturgesove formule?
Pogledajmo bínomne rozpodíl)