Uppgift 1 comleeted maybe

This commit is contained in:
Victor Andersson
2025-11-04 09:49:36 +01:00
parent 697ab2c956
commit c3b56d463f

View File

@@ -79,8 +79,15 @@ View(bike)
- Vilka datumintervall har de olika årstiderna? Skrolla igenom datamaterialet för att se när vintern övergår till vår osv. - Vilka datumintervall har de olika årstiderna? Skrolla igenom datamaterialet för att se när vintern övergår till vår osv.
Vintern (2011-01-01 - 2011-03-20)\
Spring (2011-03-21 - 2011-06-20)\
Summer (2011-06-21 - 2011-09-22)\
Fall (2011-09-23 - 2011-12-20) osv
2. Vilken information får du när du använder `head(bike)` eller `tail(bike)`? 2. Vilken information får du när du använder `head(bike)` eller `tail(bike)`?
De första och sista raderna i filerna
```{r 6 första rader} ```{r 6 första rader}
head(bike) head(bike)
@@ -89,6 +96,8 @@ tail(bike)
3. Hur många observationer och hur många variabler innehåller filen `bike.rds`? Använd funktion `glipmse()` eller `str()`. 3. Hur många observationer och hur många variabler innehåller filen `bike.rds`? Använd funktion `glipmse()` eller `str()`.
16 variablar
```{r glipmse } ```{r glipmse }
glimpse(bike) glimpse(bike)
@@ -102,13 +111,54 @@ glimpse(bike)
5. Ta fram/beräkna sammanfattande mått för de olika variablerna. Vilken information får du för de kvalitativa variablerna respektive kvantitativa variablerna?\ 5. Ta fram/beräkna sammanfattande mått för de olika variablerna. Vilken information får du för de kvalitativa variablerna respektive kvantitativa variablerna?\
\ \
Svara på frågorna nedan:\ Svara på frågorna nedan:\
- Hur många cyklar per dag har som högst hyrts ut?\ - Hur många cyklar per dag har som högst hyrts ut?
- Vad är det lägsta antalet cyklar per dag medlemmar har hyrt?\
- Hur många cyklar i genomsnitt per dag har icke-medlemmar hyrt?\ ```{r}
max(bike$total)
```
8714\
- Vad är det lägsta antalet cyklar per dag medlemmar har hyrt?
```{r}
min(bike$member)
```
\
20
- Hur många cyklar i genomsnitt per dag har icke-medlemmar hyrt?
```{r}
mean(bike$nonmember)
```
\
848.1765
- Tolka värdet 4,34 som är tredje kvartilen för variabeln `windspeed`.\ - Tolka värdet 4,34 som är tredje kvartilen för variabeln `windspeed`.\
- Vad har den genomsnittliga temperaturen varit under perioden?\
- Vad har den genomsnittliga temperaturen varit under perioden?
```{r}
mean(bike$tempC[bike$season == "winter"])
```
för season winter 12.20765\
- Vilken typ av väder har majoriteten av dagarna haft (titta på variabeln `weathersit`). - Vilken typ av väder har majoriteten av dagarna haft (titta på variabeln `weathersit`).
```{r}
bike %>%
count(weathersit, sort = TRUE)
```
```{r summary1} ```{r summary1}
bike %>% summary() bike %>% summary()
@@ -122,6 +172,8 @@ sum(bike$member)
sum(bike$nonmember) sum(bike$nonmember)
``` ```
Members
7. Ta fram/beräkna medianen samt kvartilerna för antalet uthyrningar per dag för medlemmar. Tolka dessa mått i ord kopplade till uppgiften. 7. Ta fram/beräkna medianen samt kvartilerna för antalet uthyrningar per dag för medlemmar. Tolka dessa mått i ord kopplade till uppgiften.
```{r summary member} ```{r summary member}
@@ -138,6 +190,10 @@ bike %>% select(member) %>% summary()
```{r} ```{r}
### Klistra in koden från ggplot builder nedan ### Klistra in koden från ggplot builder nedan
ggplot(bike) +
aes(x = season, y = total) +
geom_col(fill = "#112446") +
theme_minimal()
``` ```
10. Beräkna med hjälp av funktionen `tbl_summary` beskrivande statistik för några variabler grupperat på årstid (`season`). 10. Beräkna med hjälp av funktionen `tbl_summary` beskrivande statistik för några variabler grupperat på årstid (`season`).
@@ -155,26 +211,45 @@ bike %>%
- Vilken årstid har störst andel dagar med klart väder? - Vilken årstid har störst andel dagar med klart väder?
Fall
- Ange genomsnittlig vindhastighet under vintern. - Ange genomsnittlig vindhastighet under vintern.
3.99
- Vilken årstid har högst spridning (standardavvikelse) i dagligt antal uthyrda cyklar? - Vilken årstid har högst spridning (standardavvikelse) i dagligt antal uthyrda cyklar?
- Vad gör koden `add_overall()`?\ Summer??
- Vad gör koden `add_overall()`?
\
Ta bort koden `%>% add_overall()` och se vad som ändras i utskriften när du kör om koden i chunken ovan. Ta bort koden `%>% add_overall()` och se vad som ändras i utskriften när du kör om koden i chunken ovan.
Jag får en "overall" kollumm" som beskriver genomsnittliga på alla årstider
- Ändra även `all_categorical() ~ c(0, 1)` till `all_categorical() ~ c(1, 2)` och undersök hur utskriften förändras när du kör om koden. - Ändra även `all_categorical() ~ c(0, 1)` till `all_categorical() ~ c(1, 2)` och undersök hur utskriften förändras när du kör om koden.
Jag får extra pressision med 1 decimal?
11. Visualisera med ggplot builder i ett spridningsdiagram hur totala antalet uthyrningar per dag (`total`) varierar med utomhustemperatur (`tempC`). Se Figur 9-10 i bilagan. Klistra in koden i chunken nedan. 11. Visualisera med ggplot builder i ett spridningsdiagram hur totala antalet uthyrningar per dag (`total`) varierar med utomhustemperatur (`tempC`). Se Figur 9-10 i bilagan. Klistra in koden i chunken nedan.
```{r rentals vs temp} ```{r rentals vs temp}
ggplot(bike) +
aes(x = tempC, y = total) +
geom_point(colour = "#00CC00") +
theme_minimal()
``` ```
- Beskriv i "stora drag" hur sambandet mellan temperatur och antalet uthyrda cyklar ser ut. - Beskriv i "stora drag" hur sambandet mellan temperatur och antalet uthyrda cyklar ser ut.
Om det är varmare så hyrs mer cyklare. Men inte om det är för varmt
- Utifrån informationen i diagrammet, ungefär hur många cyklar hyrs i genomsnitt ut under dagar då temperaturen är kring 20 grader? - Utifrån informationen i diagrammet, ungefär hur många cyklar hyrs i genomsnitt ut under dagar då temperaturen är kring 20 grader?
drygt 5 tusen ish
# Uppgift 2. # Uppgift 2.
Läs in filen `hotel.rds` i Rstudio. (Se till att den filen ligger i mappen som är din arbetskatalog). Läs in filen `hotel.rds` i Rstudio. (Se till att den filen ligger i mappen som är din arbetskatalog).