This commit is contained in:
Victor Andersson
2025-12-10 19:35:45 +01:00
parent c360e3be95
commit 4e38625421
6 changed files with 287 additions and 9 deletions

View File

@@ -262,7 +262,7 @@ Läs in filen `hotel.rds` i Rstudio. (Se till att den filen ligger i mappen som
hotels <- readRDS("hotel.rds")
```
1 Hur många observationer och hur många variabler innehåller filen `hotel.rds`?
1\. Hur många observationer och hur många variabler innehåller filen `hotel.rds`?
118 322 observationer med 33 variablar\
\
@@ -273,12 +273,19 @@ hotels <- readRDS("hotel.rds")
View(hotels)
```
1. Vilken typ av variabel, kvalitativ eller kvantitativ, är variablerna `IsCanceled` (mäter om reservationen bokats av eller inte), `LeadTime` (antal dagar från bokning till ankomst) samt `hotel` (h1 för Algarve och h2 för Lissabon)?\
(Bortse från hur variabeln är *kodad* i datamaterialet.)\
2\. Vilken typ av variabel, kvalitativ eller kvantitativ, är variablerna `IsCanceled` (mäter om reservationen bokats av eller inte), `LeadTime` (antal dagar från bokning till ankomst) samt `hotel` (h1 för Algarve och h2 för Lissabon)?\
(Bortse från hur variabeln är *kodad* i datamaterialet.)
2. Vi kodar om variabeln `IsCanceled` så att 0 blir "No" och 1 blir "Yes". Klicka på "Addins" längst upp i övre vänstra fönstret och leta upp 'Levels recoding' (du måste ha paketet `questionr` installerat). Se Figur 11-14 i bilagan.\
3\. Vi kodar om variabeln `IsCanceled` så att 0 blir "No" och 1 blir "Yes". Klicka på "Addins" längst upp i övre vänstra fönstret och leta upp 'Levels recoding' (du måste ha paketet `questionr` installerat). Se Figur 11-14 i bilagan.\
3. Klistra in koden från 'Levels recoding' i chunken nedan och klicka därefter på den gröna pilen.
Nej be behöver jag inte.
```{r}
hotels$IsCanceled <- factor(hotels$IsCanceled, levels = c(0,1), labels = c("No", "Yes"))
```
4\. Klistra in koden från 'Levels recoding' i chunken nedan och klicka därefter på den gröna pilen.
```{r}
# Klistra in kod från 'Levels recoding' nedan
@@ -291,7 +298,7 @@ View(hotels)
```{r summary hotel}
# Klistra in kod från 'Levels recoding' nedan
hotels$hotel <- factor(hotels$hotel, levels = c("h1", "h2"), labels = c("Algarve","Lisbon"))
```
6. Beräkna med hjälp av funktionen `tbl_summary` beskrivande statistik för några variabler grupperat på hotell (Algarve/Lissabon).
@@ -314,12 +321,30 @@ hotels %>%
- Vilket av hotellen har högst andel avbokningar?
Lisbon
- Är det någon större skillnad i fördelningen av `CustomerType` mellan hotellen?
± 3% enheter
- Hur många dagar före ankomst (`LeadTime`) gjordes den bokning som gjordes längst i förväg?
709 dagar som helngst
7. Visualisera med ggplot builder (`esquisse::esquisser(viewer = "browser"`)) i två histogram hur variabeln `LeadTime` varierar för de två hotellen.
```{r}
ggplot(
ggtitle("Historia")
aes(x = , y = total) +
geom_point(colour = "#00CC00") +
geom_smooth(se = FALSE) +
theme_minimal()
)
```
- Dra `LeadTime` till X, `hotel` till fill och `hotel` till facet.
- Välj Number of bins: 20 och ändra färger (välj själv) i 'Geometries'.