Zusammenfassung
In diesem Kapitel werden einige Varianten sog. „baumbasierter Verfahren“ vorgestellt. Als erster Vertreter werden Entscheidungsbäume diskutiert, gefolgt von einer kurzen Darstellung von Bagging-Modellen und dann, ausführlicher, von Random-Forest-Modellen. Da Entscheidungsbäume die konzeptionelle Grundlage dieser Familie stellen, erörtern wir diese Modelle relativ detailliert. Schließlich werden noch Vor- und Nachteile dieser Modellfamilie einander gegenübergestellt. Zum Abschluss bestimmen Sie die Relevanz von Prädiktoren bei diesen Modellen.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Notes
- 1.
Z. B. mit tally(~is_halodrie, data = train_df, format = ″percent″); der Anteil der häufigsten Kategorie ist die Vorhersage des Nullmodells.
- 2.
- 3.
Man könnte ntree daher eher als Schokoladenparameter bezeichnen: Eine gewisse Menge wünscht man sich, aber mehr bringt keinen Zusatznutzen; randomforest und damit caret als Schnittstelle zu randomforest nimmt ntree = 500 als Standard, vgl. ?randomForest.
- 4.
Vgl. Abschn. 21.1.2.
- 5.
baum2a <- rpart(is_halodrie ~ rating + age, data = train_df); plot(as.party(baum2a)); es resultiert ein anderer Baum. Interessant ist, dass die Variable age mehr als einmal in den Baum einging, wie im baum2 auch.
- 6.
Z. B. so: baum2a[[″control″]].
- 7.
baum2a[[″variable.importance″]].
- 8.
train(kiterium ~ praediktor, data = meine_daten, method = ″rpart″).
- 9.
Ja.
- 10.
Nein; wird die Anzahl der Knoten im Baum zu groß, so sinkt die Modellgüte im Test-Sample wieder.
- 11.
Nein; in der Regel sind viel kleinere Werte besser. Als Faustregel kann man mit \(\sqrt{(k)}\) beginnen, wobei \(k\) die Anzahl der Prädiktoren im Modell bezeichnet.
- 12.
Author information
Authors and Affiliations
Corresponding author
Rights and permissions
Copyright information
© 2019 Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature
About this chapter
Cite this chapter
Sauer, S. (2019). Baumbasierte Verfahren. In: Moderne Datenanalyse mit R. FOM-Edition. Springer Gabler, Wiesbaden. https://doi.org/10.1007/978-3-658-21587-3_21
Download citation
DOI: https://doi.org/10.1007/978-3-658-21587-3_21
Published:
Publisher Name: Springer Gabler, Wiesbaden
Print ISBN: 978-3-658-21586-6
Online ISBN: 978-3-658-21587-3
eBook Packages: Business and Economics (German Language)