Nedenfor finder du en kort beskrivelse af nogle af de hyppigst anvendte procedurer. Siden vil blive
opdateret løbende efterhånden som vi får brug for flere procedurer, men vil næppe blive udtømmende
(muligvis får I brug for kommandoer / options / procedurer som ikke bliver beskrevet her).
Flere detaljer om procedurerne og deres anvendelse kan findes på SAS' hjemmeside (klik på +'et ud for
'Procedures' for at få en komplet liste over alle procedurer; herfra kan klikkes ind på de enkelte procedurer).
Lene har en lille SAS-manual
som du med fordel kan bladre igennem og Janne Petersen (øvelseslærer) har også udarbejdet et sæt slides
(link endnu ikke aktivt) som det er værd at kigge igennem.
For hver procedure gives et eksempel med en anvendelse på datasættet Sundby95
benyttet i videoerne med introduktion til SAS. Datasættet indlæser du med
syntaksen (jvf video 1 på introduktionssiden)
hvor jeg i samme ombæring også har defineret den kvalitative version af alkoholvariablen (video 6).
Du kan efter at have indlæst disse data køre alle eksemplerne nedenfor.
Det tager tid at lære hvilke procedurer man benytter til hvilke formål.
På denne side gennemgås
Giver antal observationer og en liste over variablene i et datasæt.
Printer (dele af) et datasæt. Med ekstra option
Sorterer observationerne i et datasæt efter værdierne af en eller flere variable angivet i
Vi kan bede om at få observationerne sorteret i omvendt rækkefølge ved at tilføje et
Denne procedure kan benyttes på flere forskellige måder til at beskrive fordelingen af en kvantitativ variabel.
Hvis vi i en
Et histogram kan vi få lavet vha. en
Tilsvarende kan et QQ-plot laves med en
Benyttes til at beregne summer, gennemsnit, standardafvigelser, medianer mm.
Med en
Tilføjes en
Ekstra options kan tilføjes i
Hvordan disse options skal forstås og øvrige nyttige muligheder fremgår af nedenstående tabel.
|
Specificerer at vi ønsker resultaterne angivet med x decimaler. |
|
Antal observationer med oplyste værdier |
|
Antal observationer med manglende værdier |
|
Median |
|
Mindste værdi (minimum) |
|
Største værdi (maximum) |
|
Variationsbredde (maximum - minimum) |
|
Hhv. 1. og 3. kvartil (25% og 75%-fraktil) |
|
Hhv. 1%, 5%, 95% og 99%-fraktiler |
|
Sum |
|
Gennemsnit |
|
Spredning = standardafvigelse = standard deviation |
|
Varians |
|
Standard error (standard afvigelse på gennemsnittet) |
|
Konfidensinterval for middelværdien |
|
T-test størrelsen for test af hypotesen om at middelværdien er 0 |
|
P-værdien hørende til t-test størrelsen for test af hypotesen om at middelværdien er 0 |
Benyttes til at lave tabeller og diverse tests i en-, to- flervejstabeller. I video 5 gennemgik jeg
hvordan man benytter
Har man en variabel med to kategorier (feks ja/nej eller 0/1)
kan man undersøge hypotesen om at sandsynligheden for succes (succes defineret som første niveau af variablen,
dvs her ja eller 0) er lig en bestemt værdi. Ønsker man feks at teste om sandsynligheden for at være mand er
0.5 (fjollet formuleret) svarende til at andelen af mænd og kvinder er lige stor,
kan man teste dette ved at tilføje
En tabel hvor man holder to variable op mod hinanden (tovejstabel) kan opnås ved at sætte en
Her kan man med en række ekstra options styre, hvilke procenter SAS skal beregne og få lavet et test for om
de to variable er uafhængige ved at tilføje options efter en
Ovenfor specificeres at vi ikke ønsker totalprocenter og søjleprocenter (vi får så kun rækkeprocenter) og at vi ønsker et chi-i-anden test for uafhængighed. Hyppigt anvendte options er:
|
Udelader overall procenter |
|
Udelader søjleprocenter |
|
Udelader rækkeprocenter |
|
Tilføjer den forventede værdi under hypotesen om uafhængighed mellem række- og søjlevariablene |
|
Udfører chi-i-anden test i tovejs-tabeller. Bruger du Studio får du kun en p-værdi ud, bruger du Enterprise kommer der adskillige, hvor den første svarer til det hyppigt anvendte Pearson chi-i-anden test. |
|
Beregner relativ risiko og oddsratio for en 2x2-tabel incl konfidensintervaller. |
|
Bestemmer risikodifferensen incl CI for en 2x2 tabel |
Benyttes til at lave ikke-parametriske sammenligninger. Den variabel vi ønsker at undersøge (responsvariablen, kvantitativ) angives i en
Tilføjes en linie
Benyttes til at beregne korrelationer. Her kan man f.eks. angive Pearson (parametrisk, forudsætter at man har en todimensionel normalfordeling) og Spearman (ikke-parametrisk):
Man kan angive vilkårligt mange variable i
Benyttes til at lave t-test. Den variabel vi ønsker at undersøge (responsvariablen, kvantitativ) angives i en
Et one-sample t-test, hvor vi undersøger om middelværdien i én gruppe er lig en bestemt værdi,
opnås ved syntaksen (find video med eksempel og forklaring i video-menuen øverst)
Bemærk option
Ønsker vi at sammenligne middelværdien i to grupper, dvs vi vil lave et two-sample t-test,
skal vi i en
NB: Rækkefølgen af
Benyttes til at lave variansanalyse og lineær regression. Den variabel vi ønsker at undersøge (responsvariablen, kvantitativ)
angives i en
I en ensidet variansanalyse sammenligner vi middelværdien i to eller flere grupper.
Analysen kaldes ensidet, fordi vi benytter én kategorisk forklarende variabel. Den forklarende variabel skal udover
at indgå på højresiden af
Bemærk desuden options
Når vi laver regressionsanalyse kan vi også bruge
Bemærk at der ikke er nogen
Vi kan beregne den forventede værdi for en person på 175 cm ved at benytte en
Bemærk at jeg her har benyttet en
Benyttes til at lave styrkeberegninger. Der findes et hav af af muligheder,
derfor beskrives kun et par enkelte her. Se SAS' hjemmeside om
Når man ønsker at sammenligne middelværdien i to grupper ved et t-test skal man have fat
i
Bemærk at vi altså ikke indlæser et datasæt her, men selv fylder værdierne ind.
Flere værdier til en option (her
Kan benyttes til at lave en række forskellige plots blandt andet scatterplots, histogrammer og boxplots.
Scatterplot (her vægt (
Vi kan få forskellige plot-symboler afhængigt af værdien af en tredie variabel (en
Vi kan tilføje en udglatning (a la glidende gennemsnit)
Vi kan tilføje en regressionslinie (her gør vi det for hvert køn, igen ved at benytte en
Histogram:
Hvis der ønskes en normalfordelingstæthed lagt ovenpå tilføjes linien
Man kan vælge at lægge en data-tilpasset tæthed ovenpå ved at tilføje linien
Bemærk at man kan have flere
Box-plot (her laver vi det så vi får en box for hvert køn):
Der findes også en procedure