Uppgift 1 comleeted maybe

This commit is contained in:
Victor Andersson
2025-11-04 09:49:36 +01:00
parent 697ab2c956
commit c3b56d463f

View File

@@ -79,8 +79,15 @@ View(bike)
- Vilka datumintervall har de olika årstiderna? Skrolla igenom datamaterialet för att se när vintern övergår till vår osv.
Vintern (2011-01-01 - 2011-03-20)\
Spring (2011-03-21 - 2011-06-20)\
Summer (2011-06-21 - 2011-09-22)\
Fall (2011-09-23 - 2011-12-20) osv
2. Vilken information får du när du använder `head(bike)` eller `tail(bike)`?
De första och sista raderna i filerna
```{r 6 första rader}
head(bike)
@@ -89,6 +96,8 @@ tail(bike)
3. Hur många observationer och hur många variabler innehåller filen `bike.rds`? Använd funktion `glipmse()` eller `str()`.
16 variablar
```{r glipmse }
glimpse(bike)
@@ -102,13 +111,54 @@ glimpse(bike)
5. Ta fram/beräkna sammanfattande mått för de olika variablerna. Vilken information får du för de kvalitativa variablerna respektive kvantitativa variablerna?\
\
Svara på frågorna nedan:\
- Hur många cyklar per dag har som högst hyrts ut?\
- Vad är det lägsta antalet cyklar per dag medlemmar har hyrt?\
- Hur många cyklar i genomsnitt per dag har icke-medlemmar hyrt?\
- Hur många cyklar per dag har som högst hyrts ut?
```{r}
max(bike$total)
```
8714\
- Vad är det lägsta antalet cyklar per dag medlemmar har hyrt?
```{r}
min(bike$member)
```
\
20
- Hur många cyklar i genomsnitt per dag har icke-medlemmar hyrt?
```{r}
mean(bike$nonmember)
```
\
848.1765
- Tolka värdet 4,34 som är tredje kvartilen för variabeln `windspeed`.\
- Vad har den genomsnittliga temperaturen varit under perioden?\
- Vad har den genomsnittliga temperaturen varit under perioden?
```{r}
mean(bike$tempC[bike$season == "winter"])
```
för season winter 12.20765\
- Vilken typ av väder har majoriteten av dagarna haft (titta på variabeln `weathersit`).
```{r}
bike %>%
count(weathersit, sort = TRUE)
```
```{r summary1}
bike %>% summary()
@@ -122,6 +172,8 @@ sum(bike$member)
sum(bike$nonmember)
```
Members
7. Ta fram/beräkna medianen samt kvartilerna för antalet uthyrningar per dag för medlemmar. Tolka dessa mått i ord kopplade till uppgiften.
```{r summary member}
@@ -138,6 +190,10 @@ bike %>% select(member) %>% summary()
```{r}
### Klistra in koden från ggplot builder nedan
ggplot(bike) +
aes(x = season, y = total) +
geom_col(fill = "#112446") +
theme_minimal()
```
10. Beräkna med hjälp av funktionen `tbl_summary` beskrivande statistik för några variabler grupperat på årstid (`season`).
@@ -149,32 +205,51 @@ bike %>%
statistic = list(all_continuous() ~ "{mean} ({sd})"),
digits = list(c(tempC, hum) ~ 1,
all_categorical() ~ c(0, 1))
) %>%
add_overall()
) %>%
add_overall()
```
- Vilken årstid har störst andel dagar med klart väder?
Fall
- Ange genomsnittlig vindhastighet under vintern.
3.99
- Vilken årstid har högst spridning (standardavvikelse) i dagligt antal uthyrda cyklar?
- Vad gör koden `add_overall()`?\
Summer??
- Vad gör koden `add_overall()`?
\
Ta bort koden `%>% add_overall()` och se vad som ändras i utskriften när du kör om koden i chunken ovan.
Jag får en "overall" kollumm" som beskriver genomsnittliga på alla årstider
- Ändra även `all_categorical() ~ c(0, 1)` till `all_categorical() ~ c(1, 2)` och undersök hur utskriften förändras när du kör om koden.
Jag får extra pressision med 1 decimal?
11. Visualisera med ggplot builder i ett spridningsdiagram hur totala antalet uthyrningar per dag (`total`) varierar med utomhustemperatur (`tempC`). Se Figur 9-10 i bilagan. Klistra in koden i chunken nedan.
```{r rentals vs temp}
ggplot(bike) +
aes(x = tempC, y = total) +
geom_point(colour = "#00CC00") +
theme_minimal()
```
- Beskriv i "stora drag" hur sambandet mellan temperatur och antalet uthyrda cyklar ser ut.
Om det är varmare så hyrs mer cyklare. Men inte om det är för varmt
- Utifrån informationen i diagrammet, ungefär hur många cyklar hyrs i genomsnitt ut under dagar då temperaturen är kring 20 grader?
drygt 5 tusen ish
# Uppgift 2.
Läs in filen `hotel.rds` i Rstudio. (Se till att den filen ligger i mappen som är din arbetskatalog).
@@ -251,9 +326,9 @@ hotels %>%
- Beskriv hur `LeadTime` varierar, t ex bokar de flesta långt i förväg eller är det vanligast att boka nära ankomst?
8. Visualisera med ggplot builder i ett stapeldiagram hur långt i förväg hotellen bokas uppdelat på ankomstmånad.\
Starta ggplot builder, dra `ArrivalDateMonth` rill X och `LeadTime` till Y. Välj 'Bar' i menyn till vänster. \
Klicka på 'Geometries' och sätt 'Stat summary function' till 'mean'. \
Klicka på 'Axes '\> X axis text options \> Angle: 45. \
Starta ggplot builder, dra `ArrivalDateMonth` rill X och `LeadTime` till Y. Välj 'Bar' i menyn till vänster.\
Klicka på 'Geometries' och sätt 'Stat summary function' till 'mean'.\
Klicka på 'Axes '\> X axis text options \> Angle: 45.\
Gå sedan tillbaka till RStudio och skapa diagrammet i chunken nedan.
```{r Stapeldiagram}