From c3b56d463f28376d130907a26638d2c2d3f72689 Mon Sep 17 00:00:00 2001 From: Victor Andersson Date: Tue, 4 Nov 2025 09:49:36 +0100 Subject: [PATCH] Uppgift 1 comleeted maybe --- lektion1/Lektion_1.qmd | 97 +++++++++++++++++++++++++++++++++++++----- 1 file changed, 86 insertions(+), 11 deletions(-) diff --git a/lektion1/Lektion_1.qmd b/lektion1/Lektion_1.qmd index 5e856c5..35b6222 100644 --- a/lektion1/Lektion_1.qmd +++ b/lektion1/Lektion_1.qmd @@ -79,8 +79,15 @@ View(bike) - Vilka datumintervall har de olika årstiderna? Skrolla igenom datamaterialet för att se när vintern övergår till vår osv. +Vintern (2011-01-01 - 2011-03-20)\ +Spring (2011-03-21 - 2011-06-20)\ +Summer (2011-06-21 - 2011-09-22)\ +Fall (2011-09-23 - 2011-12-20) osv + 2. Vilken information får du när du använder `head(bike)` eller `tail(bike)`? +De första och sista raderna i filerna + ```{r 6 första rader} head(bike) @@ -89,6 +96,8 @@ tail(bike) 3. Hur många observationer och hur många variabler innehåller filen `bike.rds`? Använd funktion `glipmse()` eller `str()`. +16 variablar + ```{r glipmse } glimpse(bike) @@ -102,13 +111,54 @@ glimpse(bike) 5. Ta fram/beräkna sammanfattande mått för de olika variablerna. Vilken information får du för de kvalitativa variablerna respektive kvantitativa variablerna?\ \ Svara på frågorna nedan:\ - - Hur många cyklar per dag har som högst hyrts ut?\ - - Vad är det lägsta antalet cyklar per dag medlemmar har hyrt?\ - - Hur många cyklar i genomsnitt per dag har icke-medlemmar hyrt?\ + - Hur många cyklar per dag har som högst hyrts ut? + + ```{r} + + max(bike$total) + ``` + + 8714\ + + - Vad är det lägsta antalet cyklar per dag medlemmar har hyrt? + + ```{r} + + min(bike$member) + ``` + + \ + 20 + + - Hur många cyklar i genomsnitt per dag har icke-medlemmar hyrt? + + ```{r} + + mean(bike$nonmember) + ``` + + \ + 848.1765 + - Tolka värdet 4,34 som är tredje kvartilen för variabeln `windspeed`.\ - - Vad har den genomsnittliga temperaturen varit under perioden?\ + + - Vad har den genomsnittliga temperaturen varit under perioden? + + ```{r} + + mean(bike$tempC[bike$season == "winter"]) + ``` + + för season winter 12.20765\ + - Vilken typ av väder har majoriteten av dagarna haft (titta på variabeln `weathersit`). +```{r} + +bike %>% + count(weathersit, sort = TRUE) +``` + ```{r summary1} bike %>% summary() @@ -122,6 +172,8 @@ sum(bike$member) sum(bike$nonmember) ``` +Members + 7. Ta fram/beräkna medianen samt kvartilerna för antalet uthyrningar per dag för medlemmar. Tolka dessa mått i ord kopplade till uppgiften. ```{r summary member} @@ -138,6 +190,10 @@ bike %>% select(member) %>% summary() ```{r} ### Klistra in koden från ggplot builder nedan +ggplot(bike) + + aes(x = season, y = total) + + geom_col(fill = "#112446") + + theme_minimal() ``` 10. Beräkna med hjälp av funktionen `tbl_summary` beskrivande statistik för några variabler grupperat på årstid (`season`). @@ -149,32 +205,51 @@ bike %>% statistic = list(all_continuous() ~ "{mean} ({sd})"), digits = list(c(tempC, hum) ~ 1, all_categorical() ~ c(0, 1)) - ) %>% - add_overall() + ) %>% + add_overall() ``` - Vilken årstid har störst andel dagar med klart väder? +Fall + - Ange genomsnittlig vindhastighet under vintern. +3.99 + - Vilken årstid har högst spridning (standardavvikelse) i dagligt antal uthyrda cyklar? -- Vad gör koden `add_overall()`?\ +Summer?? + +- Vad gör koden `add_overall()`? + + \ Ta bort koden `%>% add_overall()` och se vad som ändras i utskriften när du kör om koden i chunken ovan. +Jag får en "overall" kollumm" som beskriver genomsnittliga på alla årstider + - Ändra även `all_categorical() ~ c(0, 1)` till `all_categorical() ~ c(1, 2)` och undersök hur utskriften förändras när du kör om koden. +Jag får extra pressision med 1 decimal? + 11. Visualisera med ggplot builder i ett spridningsdiagram hur totala antalet uthyrningar per dag (`total`) varierar med utomhustemperatur (`tempC`). Se Figur 9-10 i bilagan. Klistra in koden i chunken nedan. ```{r rentals vs temp} - +ggplot(bike) + + aes(x = tempC, y = total) + + geom_point(colour = "#00CC00") + + theme_minimal() ``` - Beskriv i "stora drag" hur sambandet mellan temperatur och antalet uthyrda cyklar ser ut. +Om det är varmare så hyrs mer cyklare. Men inte om det är för varmt + - Utifrån informationen i diagrammet, ungefär hur många cyklar hyrs i genomsnitt ut under dagar då temperaturen är kring 20 grader? +drygt 5 tusen ish + # Uppgift 2. Läs in filen `hotel.rds` i Rstudio. (Se till att den filen ligger i mappen som är din arbetskatalog). @@ -251,9 +326,9 @@ hotels %>% - Beskriv hur `LeadTime` varierar, t ex bokar de flesta långt i förväg eller är det vanligast att boka nära ankomst? 8. Visualisera med ggplot builder i ett stapeldiagram hur långt i förväg hotellen bokas uppdelat på ankomstmånad.\ - Starta ggplot builder, dra `ArrivalDateMonth` rill X och `LeadTime` till Y. Välj 'Bar' i menyn till vänster. \ - Klicka på 'Geometries' och sätt 'Stat summary function' till 'mean'. \ - Klicka på 'Axes '\> X axis text options \> Angle: 45. \ + Starta ggplot builder, dra `ArrivalDateMonth` rill X och `LeadTime` till Y. Välj 'Bar' i menyn till vänster.\ + Klicka på 'Geometries' och sätt 'Stat summary function' till 'mean'.\ + Klicka på 'Axes '\> X axis text options \> Angle: 45.\ Gå sedan tillbaka till RStudio och skapa diagrammet i chunken nedan. ```{r Stapeldiagram}