Följande uppgifter skall lösas i ett R-Markdown dokument med output: github_document
. Alla kodsnuttar skall vara synliga (echo = TRUE
) undantaget den uppgift som skall ges i löpande text. För lättläst kod, följ t.ex. Google’s R Style guide eller Hadley Wickham’s style guide så långt som möjligt (snåla inte med mellanslag i koden!). Både den genererade .md
filen och källfilen (.Rmd
) skall laddas upp på GitHub under biblioteket HW_efternamn_initial/HW2
. Det skall finnas en länk till .md
filen från HW_efternamn_initial/README.md
som i förra uppgiften.
Inled ditt dokument genom att ladda paketen tidyverse
, readxl
(installeras som del av tidyverse, men kräver separat library
-anrop), knitr
och ggmap
. Paketen skall laddas “tyst” med suppressPackageStartupMessages
. Avsluta dokumentet med en kodsnutt innehållande sessionInfo()
.
Data till uppgiften finns på https://github.com/MT5013-VT18/HW_data som SpeciesObservations-2018-01-23-08-11-26.xlsx
och booli_sold.csv
, ladda ner dessa och placera i ett uderbibliotek data
till till Homework
-repo.
På Artportalen kan man rapportera sina observationer av djur, växter och svampar. I denna uppgiften skall du analysera den senaste månadens rapporter, med fokus på Fåglar som är den överlägset vanligaste gruppen i materialet. Data är hämtat från Analysportalen för biodiversitetsdata.
Vi läser in och undersöker data med glimpse
:
artdata <- read_excel("data/SpeciesObservations-2018-01-23-08-11-26.xlsx")
glimpse(artdata)
## Observations: 7,291
## Variables: 16
## $ `Vetenskapligt namn` <chr> "Turdus pilaris", "Fringilla coeleb...
## $ `Svenskt namn` <chr> "björktrast", "bofink", "skrattmås"...
## $ Organismgrupp <chr> "Fåglar", "Fåglar", "Fåglar", "Fågl...
## $ Fyndstatus <chr> "Present", "Present", "Present", "P...
## $ Observatör <chr> "Rikard Henricsson", "Kerstin Wilto...
## $ Lokal <chr> "Kälvestavägen 119", "Reimersholme"...
## $ Län <chr> "Stockholm", "Stockholm", "Stockhol...
## $ `Koordinatnoggrannhet (m)` <chr> "225", "262", "1367", "200", "319",...
## $ X <chr> "17,885178829", "18,0210041", "18,0...
## $ Y <chr> "59,385253509", "59,318441642", "59...
## $ Startdatum <chr> "2018-01-06", "2018-01-14", "2018-0...
## $ Slutdatum <chr> "2018-01-06", "2018-01-14", "2018-0...
## $ Datakälla <chr> "Artportalen", "Artportalen", "Artp...
## $ `Osäker bestämning` <chr> "False", "False", "False", "False",...
## $ Valideringstatus <chr> "Unvalidated", "Unvalidated", "Unva...
## $ ObservationId <chr> "109492512", "109552370", "10937691...
Vi noterar här två saker:
names(artdata) <- gsub(" ", "_", names(artdata))
read_excel
klassat samtliga kolumner som character
. Konvertera variablerna X
och Y
till numeriskt format med as.numeric
(först måste du byta kommatecken mot punkt, t.ex. med gsub
). Konvertera även datumen med as.Date
.Filtrera ut organismgruppen Fåglar och lös följande uppgifter:
Veckodag
med hjälp av funktionen Weekdays
. Gör ett stapeldiagram över det genomsnittliga antalet observationer per veckodag (försök gärna placera staplarna i lämplig ordning).ggmap
kan man enkelt plotta data på kartor. Installera detta och illustrera någon geografisk aspekt av data genom att plotta punkter färglagda efter någon variabel. En grundkarta får du t.ex. med map <- get_map("Stockholm")
, sedan plottar du med ggmap(map) + geom_point(data = artdata, aes(x=X, y=Y, ...
. Filtrera gärna ut en delmängd av materialet innan plot.Filen data/booli_sold.csv
innehåller data på 500 sålda bostäder i Norra Djurgården, hämtade från Boolis öppna API.
geom_boxplot
).