yea
This commit is contained in:
@@ -262,7 +262,7 @@ Läs in filen `hotel.rds` i Rstudio. (Se till att den filen ligger i mappen som
|
||||
hotels <- readRDS("hotel.rds")
|
||||
```
|
||||
|
||||
1 Hur många observationer och hur många variabler innehåller filen `hotel.rds`?
|
||||
1\. Hur många observationer och hur många variabler innehåller filen `hotel.rds`?
|
||||
|
||||
118 322 observationer med 33 variablar\
|
||||
\
|
||||
@@ -273,12 +273,19 @@ hotels <- readRDS("hotel.rds")
|
||||
View(hotels)
|
||||
```
|
||||
|
||||
1. Vilken typ av variabel, kvalitativ eller kvantitativ, är variablerna `IsCanceled` (mäter om reservationen bokats av eller inte), `LeadTime` (antal dagar från bokning till ankomst) samt `hotel` (h1 för Algarve och h2 för Lissabon)?\
|
||||
(Bortse från hur variabeln är *kodad* i datamaterialet.)\
|
||||
2\. Vilken typ av variabel, kvalitativ eller kvantitativ, är variablerna `IsCanceled` (mäter om reservationen bokats av eller inte), `LeadTime` (antal dagar från bokning till ankomst) samt `hotel` (h1 för Algarve och h2 för Lissabon)?\
|
||||
(Bortse från hur variabeln är *kodad* i datamaterialet.)
|
||||
|
||||
2. Vi kodar om variabeln `IsCanceled` så att 0 blir "No" och 1 blir "Yes". Klicka på "Addins" längst upp i övre vänstra fönstret och leta upp 'Levels recoding' (du måste ha paketet `questionr` installerat). Se Figur 11-14 i bilagan.\
|
||||
3\. Vi kodar om variabeln `IsCanceled` så att 0 blir "No" och 1 blir "Yes". Klicka på "Addins" längst upp i övre vänstra fönstret och leta upp 'Levels recoding' (du måste ha paketet `questionr` installerat). Se Figur 11-14 i bilagan.\
|
||||
|
||||
3. Klistra in koden från 'Levels recoding' i chunken nedan och klicka därefter på den gröna pilen.
|
||||
Nej be behöver jag inte.
|
||||
|
||||
```{r}
|
||||
|
||||
hotels$IsCanceled <- factor(hotels$IsCanceled, levels = c(0,1), labels = c("No", "Yes"))
|
||||
```
|
||||
|
||||
4\. Klistra in koden från 'Levels recoding' i chunken nedan och klicka därefter på den gröna pilen.
|
||||
|
||||
```{r}
|
||||
# Klistra in kod från 'Levels recoding' nedan
|
||||
@@ -291,7 +298,7 @@ View(hotels)
|
||||
```{r summary hotel}
|
||||
# Klistra in kod från 'Levels recoding' nedan
|
||||
|
||||
|
||||
hotels$hotel <- factor(hotels$hotel, levels = c("h1", "h2"), labels = c("Algarve","Lisbon"))
|
||||
```
|
||||
|
||||
6. Beräkna med hjälp av funktionen `tbl_summary` beskrivande statistik för några variabler grupperat på hotell (Algarve/Lissabon).
|
||||
@@ -314,12 +321,30 @@ hotels %>%
|
||||
|
||||
- Vilket av hotellen har högst andel avbokningar?
|
||||
|
||||
Lisbon
|
||||
|
||||
- Är det någon större skillnad i fördelningen av `CustomerType` mellan hotellen?
|
||||
|
||||
± 3% enheter
|
||||
|
||||
- Hur många dagar före ankomst (`LeadTime`) gjordes den bokning som gjordes längst i förväg?
|
||||
|
||||
709 dagar som helngst
|
||||
|
||||
7. Visualisera med ggplot builder (`esquisse::esquisser(viewer = "browser"`)) i två histogram hur variabeln `LeadTime` varierar för de två hotellen.
|
||||
|
||||
```{r}
|
||||
|
||||
ggplot(
|
||||
ggtitle("Historia")
|
||||
aes(x = , y = total) +
|
||||
geom_point(colour = "#00CC00") +
|
||||
geom_smooth(se = FALSE) +
|
||||
theme_minimal()
|
||||
|
||||
)
|
||||
```
|
||||
|
||||
- Dra `LeadTime` till X, `hotel` till fill och `hotel` till facet.
|
||||
|
||||
- Välj Number of bins: 20 och ändra färger (välj själv) i 'Geometries'.
|
||||
|
||||
Reference in New Issue
Block a user