> next') ;?> up') ;?> previous'); ?>
Next: Stochastische Modellierung mit Hidden-Markov-Modellen Up: Modellierung und Simulation von Previous: Zuordnung von ,,kurzen Kassen``

SVD-Clusterung von Bauspar-Zeitreihen

Für die Prototypengenerierung haben wir bisher ein geometrisches Clusterverfahren, das $ K$-means-Verfahren, verwendet, das diejenigen Verträge zu einem Cluster zusammenfasst, deren Sparverhalten im Zeitverlauf ähnlich sind. Als Ähnlichkeitsmaß haben wir den euklidischen Abstand gewählt. Der Prototyp eines Clusters wird durch den Clusterschwerpunkt definiert. Mit Hilfe dieses Verfahrens konnten wir Prototypen finden, die das Bausparkollektiv gut abbilden und auch aus der Realität bekannt sind. Alternativ zu dem $ K$-means-Clusterverfahren haben wir eine neue Methode zur Generierung der Prototypen untersucht, die auf der Singular Value Decomposition (SVD) basiert und kein explizites Abstandsmaß verwendet. Unter der Singular Value Decomposition wird die Zerlegung einer Matrix $ A$ in das Produkt zweier orthogonaler Matrizen $ U$ und $ V$ und einer Diagonalmatrix $ D$ verstanden: $ A = U D V^T$. Als Ausgangsmatrix haben wir die Bausparmatrix $ A$ so definiert, dass die Zeilen die Verträge und die Spalten die Bausparmerkmale wie Sparrate (Verhältnis zwischen Spargeldeingang und Bausparsumme), Anspargrad (Verhältnis zwischen angespartem Guthaben und Bausparsumme) oder Bewertungszahl (Kennzahl für die Leistung des Bausparers für das Bausparkollektiv) im Zeitverlauf darstellen. Die Bausparmatrix kann um weitere Merkmale wie demographische Größen (Beruf oder Alter des Bausparers) erweitert werden. Auch hier haben wir als Datenbasis alle Bausparverträge betrachtet, deren Sparphasen uns vollständig bekannt sind. Bilden wir die Singular Value Decomposition der normierten Bausparmatrix und betrachten die zu den $ d$ größten Werten der Diagonalmatrix $ D$ gehörenden Spalten der linken orthogonalen Matrix $ U$, dann erhalten wir aus den zu den $ p$ größten positiven (negativen) Spalteneinträgen gehörenden Verträgen pro Spalte $ 2d$ Cluster. Die Prototypen berechnen sich als Schwerpunkte der gefundenen Cluster. Zur Berechnung der Prototypen haben wir die relationale Bauspar-Datenbank eingesetzt, mit deren Hilfe wir die Cluster und die Prototypen leicht bestimmen können. Die mittels SVD-Clusterung gefundenen Prototypen weisen einen ähnlichen Sparverlauf wie die Prototypen der $ K$-means-Clusterung auf und können auch in der Realität wiedergefunden werden. Somit haben wir hier ein zur $ K$-means-Clusterung alternatives Clusterverfahren an der Hand, mit dessen Hilfe wir auch weitere Merkmale außer der Sparrate zur Bestimmung der Prototypen hinzuziehen können, ohne einen expliziten Abstand zu berechnen.


next') ;?> up') ;?> previous'); ?>