Uppgift 1 comleeted maybe
This commit is contained in:
@@ -79,8 +79,15 @@ View(bike)
|
||||
|
||||
- Vilka datumintervall har de olika årstiderna? Skrolla igenom datamaterialet för att se när vintern övergår till vår osv.
|
||||
|
||||
Vintern (2011-01-01 - 2011-03-20)\
|
||||
Spring (2011-03-21 - 2011-06-20)\
|
||||
Summer (2011-06-21 - 2011-09-22)\
|
||||
Fall (2011-09-23 - 2011-12-20) osv
|
||||
|
||||
2. Vilken information får du när du använder `head(bike)` eller `tail(bike)`?
|
||||
|
||||
De första och sista raderna i filerna
|
||||
|
||||
```{r 6 första rader}
|
||||
|
||||
head(bike)
|
||||
@@ -89,6 +96,8 @@ tail(bike)
|
||||
|
||||
3. Hur många observationer och hur många variabler innehåller filen `bike.rds`? Använd funktion `glipmse()` eller `str()`.
|
||||
|
||||
16 variablar
|
||||
|
||||
```{r glipmse }
|
||||
|
||||
glimpse(bike)
|
||||
@@ -102,13 +111,54 @@ glimpse(bike)
|
||||
5. Ta fram/beräkna sammanfattande mått för de olika variablerna. Vilken information får du för de kvalitativa variablerna respektive kvantitativa variablerna?\
|
||||
\
|
||||
Svara på frågorna nedan:\
|
||||
- Hur många cyklar per dag har som högst hyrts ut?\
|
||||
- Vad är det lägsta antalet cyklar per dag medlemmar har hyrt?\
|
||||
- Hur många cyklar i genomsnitt per dag har icke-medlemmar hyrt?\
|
||||
- Hur många cyklar per dag har som högst hyrts ut?
|
||||
|
||||
```{r}
|
||||
|
||||
max(bike$total)
|
||||
```
|
||||
|
||||
8714\
|
||||
|
||||
- Vad är det lägsta antalet cyklar per dag medlemmar har hyrt?
|
||||
|
||||
```{r}
|
||||
|
||||
min(bike$member)
|
||||
```
|
||||
|
||||
\
|
||||
20
|
||||
|
||||
- Hur många cyklar i genomsnitt per dag har icke-medlemmar hyrt?
|
||||
|
||||
```{r}
|
||||
|
||||
mean(bike$nonmember)
|
||||
```
|
||||
|
||||
\
|
||||
848.1765
|
||||
|
||||
- Tolka värdet 4,34 som är tredje kvartilen för variabeln `windspeed`.\
|
||||
- Vad har den genomsnittliga temperaturen varit under perioden?\
|
||||
|
||||
- Vad har den genomsnittliga temperaturen varit under perioden?
|
||||
|
||||
```{r}
|
||||
|
||||
mean(bike$tempC[bike$season == "winter"])
|
||||
```
|
||||
|
||||
för season winter 12.20765\
|
||||
|
||||
- Vilken typ av väder har majoriteten av dagarna haft (titta på variabeln `weathersit`).
|
||||
|
||||
```{r}
|
||||
|
||||
bike %>%
|
||||
count(weathersit, sort = TRUE)
|
||||
```
|
||||
|
||||
```{r summary1}
|
||||
|
||||
bike %>% summary()
|
||||
@@ -122,6 +172,8 @@ sum(bike$member)
|
||||
sum(bike$nonmember)
|
||||
```
|
||||
|
||||
Members
|
||||
|
||||
7. Ta fram/beräkna medianen samt kvartilerna för antalet uthyrningar per dag för medlemmar. Tolka dessa mått i ord kopplade till uppgiften.
|
||||
|
||||
```{r summary member}
|
||||
@@ -138,6 +190,10 @@ bike %>% select(member) %>% summary()
|
||||
```{r}
|
||||
### Klistra in koden från ggplot builder nedan
|
||||
|
||||
ggplot(bike) +
|
||||
aes(x = season, y = total) +
|
||||
geom_col(fill = "#112446") +
|
||||
theme_minimal()
|
||||
```
|
||||
|
||||
10. Beräkna med hjälp av funktionen `tbl_summary` beskrivande statistik för några variabler grupperat på årstid (`season`).
|
||||
@@ -149,32 +205,51 @@ bike %>%
|
||||
statistic = list(all_continuous() ~ "{mean} ({sd})"),
|
||||
digits = list(c(tempC, hum) ~ 1,
|
||||
all_categorical() ~ c(0, 1))
|
||||
) %>%
|
||||
add_overall()
|
||||
) %>%
|
||||
add_overall()
|
||||
```
|
||||
|
||||
- Vilken årstid har störst andel dagar med klart väder?
|
||||
|
||||
Fall
|
||||
|
||||
- Ange genomsnittlig vindhastighet under vintern.
|
||||
|
||||
3.99
|
||||
|
||||
- Vilken årstid har högst spridning (standardavvikelse) i dagligt antal uthyrda cyklar?
|
||||
|
||||
- Vad gör koden `add_overall()`?\
|
||||
Summer??
|
||||
|
||||
- Vad gör koden `add_overall()`?
|
||||
|
||||
\
|
||||
Ta bort koden `%>% add_overall()` och se vad som ändras i utskriften när du kör om koden i chunken ovan.
|
||||
|
||||
Jag får en "overall" kollumm" som beskriver genomsnittliga på alla årstider
|
||||
|
||||
- Ändra även `all_categorical() ~ c(0, 1)` till `all_categorical() ~ c(1, 2)` och undersök hur utskriften förändras när du kör om koden.
|
||||
|
||||
Jag får extra pressision med 1 decimal?
|
||||
|
||||
11. Visualisera med ggplot builder i ett spridningsdiagram hur totala antalet uthyrningar per dag (`total`) varierar med utomhustemperatur (`tempC`). Se Figur 9-10 i bilagan. Klistra in koden i chunken nedan.
|
||||
|
||||
```{r rentals vs temp}
|
||||
|
||||
|
||||
ggplot(bike) +
|
||||
aes(x = tempC, y = total) +
|
||||
geom_point(colour = "#00CC00") +
|
||||
theme_minimal()
|
||||
```
|
||||
|
||||
- Beskriv i "stora drag" hur sambandet mellan temperatur och antalet uthyrda cyklar ser ut.
|
||||
|
||||
Om det är varmare så hyrs mer cyklare. Men inte om det är för varmt
|
||||
|
||||
- Utifrån informationen i diagrammet, ungefär hur många cyklar hyrs i genomsnitt ut under dagar då temperaturen är kring 20 grader?
|
||||
|
||||
drygt 5 tusen ish
|
||||
|
||||
# Uppgift 2.
|
||||
|
||||
Läs in filen `hotel.rds` i Rstudio. (Se till att den filen ligger i mappen som är din arbetskatalog).
|
||||
@@ -251,9 +326,9 @@ hotels %>%
|
||||
- Beskriv hur `LeadTime` varierar, t ex bokar de flesta långt i förväg eller är det vanligast att boka nära ankomst?
|
||||
|
||||
8. Visualisera med ggplot builder i ett stapeldiagram hur långt i förväg hotellen bokas uppdelat på ankomstmånad.\
|
||||
Starta ggplot builder, dra `ArrivalDateMonth` rill X och `LeadTime` till Y. Välj 'Bar' i menyn till vänster. \
|
||||
Klicka på 'Geometries' och sätt 'Stat summary function' till 'mean'. \
|
||||
Klicka på 'Axes '\> X axis text options \> Angle: 45. \
|
||||
Starta ggplot builder, dra `ArrivalDateMonth` rill X och `LeadTime` till Y. Välj 'Bar' i menyn till vänster.\
|
||||
Klicka på 'Geometries' och sätt 'Stat summary function' till 'mean'.\
|
||||
Klicka på 'Axes '\> X axis text options \> Angle: 45.\
|
||||
Gå sedan tillbaka till RStudio och skapa diagrammet i chunken nedan.
|
||||
|
||||
```{r Stapeldiagram}
|
||||
|
||||
Reference in New Issue
Block a user