Der Förderverein VersicherungsMathematik im Bereich der Kraftfahrtversicherung, kurz VM4K, hat eine Forschungsarbeit zum Umgang mit Telematikdaten gefördert. Ein Interview mit der Absolventin Annika Ziegler, Professorin Martina Brück von der Hochschule Koblenz / RheinAhrCampus sowie Carina Götzen von der aktuariellen Beratungsgesellschaft Meyertholes Siems Kohlruss (MSK).
Im Gespräch (von links nach rechts): Professorin Martina Brück (Hochschule Koblenz/RheinAhrCampus), Annika Ziegler und Carina Götzen (Meyerthole Siems Kohlruss) (Bildquellen: Hochschule Koblenz/Meyerthole Siems Kohlruss).
Wie kam das Projekt zustande?
Prof. Martina Brück: Die Hochschule Koblenz ist seit 2019 Mitglied bei VM4K. Neben mathematischen und statistischen Grundlagen haben unsere Absolvent*innen des Wirtschaftsmathematik-Studiums insbesondere auch Kenntnisse in Versicherungs- und Finanzmathematik, sowie zunehmend im Bereich Machine Learning, erworben. Grundsätzlich sind wir sehr am Austausch interessiert – sowohl fachlich, zwischen Hochschulen und Universitäten, als auch mit Versicherern. Als mich Annika Ziegler, eine sehr gute Studentin unserer Hochschule, ansprach, da sie auf der Suche nach einem Thema für ihre Bachelor-Arbeit war, kam uns gleich eine mögliche Zusammenarbeit über VM4K in den Sinn.
Carina Götzen: Über den Vorschlag, den Frau Professorin Brück dann an MSK richtete, haben wir uns sehr gefreut. Das Ziel von VM4K, Forschung und Wirtschaft zu vernetzen, liegt uns sehr am Herzen. Wenn dies durch konkrete Projekte wie gemeinsam abgestimmte Abschlussarbeiten entsteht, ist dies ein großer Gewinn für alle. Schon eine frühere Zusammenarbeit, bei der im Rahmen einer Masterarbeit ebenfalls Telematik und Big Data behandelt wurden, ist für alle Seiten sehr produktiv gewesen.
Wie gelingt es Ihnen bei der Telematik, Big Data in den Griff zu bekommen?
Annika Ziegler: Geeignete Statistiksoftware wie z.B. ARIANE (Eigenentwicklung Meyerthole Siems Kohlruss) und R ist für den Umgang mit großen Datenmengen unumgänglich. Aber wenn es, wie im vorliegenden Fall, um die Dimension von Big Data geht, wird dennoch eine sehr hohe Rechenzeit benötigt. Daher wurden bei der Forschungsarbeit Heatmaps eingesetzt, eine Darstellungsform, bei der Geschwindigkeits- und Beschleunigungsverhalten zweidimensional dargestellt wird. Mit Hilfe von Heatmaps lassen sich mehrere Millionen Datensätze auf einen Umfang von 100 Datenpunkten reduzieren.
Brück: Innerhalb des Bereichs der Data Analytics stehen grundsätzlich viele Ansätze zur Verfügung. Doch wenn es etwa darum geht, den Einfluss von riskantem Fahrverhalten darzustellen, haben die Heatmaps den großen Vorteil, dass sie eine hohe Erklärbarkeit bieten. In Verbindung mit dem gewählten Ansatz der Hauptkomponentenanalyse bieten sie eine optimale Möglichkeit, die enorm große Datenmenge zu reduzieren und das Fahrverhalten mit wenigen Parametern zu beschreiben.
Götzen: Die Erfahrung in einem Beratungsunternehmen zeigt, dass ein Modell, das sich intuitiv vermittelt, die Akzeptanz der Analysen deutlich steigert – bei Versicherungshäusern schließt das sowohl Vorstände als auch Fachabteilungen mit ein.
Wo lagen bei dieser Forschungsarbeit besondere Knackpunkte und Hindernisse?
Ziegler: Im Rahmen einer empirischen Arbeit ist es besonders wertvoll, Dinge auszuprobieren. Doch in diesem Fall ergaben sich durch die großen Datenmengen, die zu langen Rechenzeiten führen, deutliche Einschränkungen. Man muss genauer im Vorfeld abwägen, welche Experimente wirklich erfolgversprechend erscheinen. Ein weiterer Knackpunkt war, dass keine Schadendaten vorlagen. Hier haben wir für die Modellierung jedoch auf die Prämien zurückgreifen können und so ein fundiertes Ergebnis erzielt.
Götzen: Das Komprimieren von Daten ist eine grundsätzliche Herausforderung, nicht nur im vorliegenden Fall. Entscheidend ist, die Balance zu halten – zwischen der Reduktion des Datenumfangs auf der einen Seite und dem Erhalten der wesentlichen Informationen auf der anderen. Eine weitere Hürde war, dass Daten zu rund 1.000 Fahrzeugen vorlagen. Hieraus statistisch signifikante Fahrprofile abzuleiten, erfordert Fingerspitzengefühl. Neben statistischen Verfahren, die als Hilfestellung dienen können um z.B. die optimale Anzahl an einfließenden Hauptkomponenten zu bestimmen, kamen wir nicht um simples Ausprobieren und Durchspielen möglicher Einstellungen herum.
Gab es beim Durchführen der unterschiedlichen Schritte, die Teil dieser Forschung sind, ein Aha-Erlebnis?
Ziegler: Als die Heatmaps an konkreten Daten berechnet wurden, waren wir sehr gespannt, ob das Konzept auch wirklich in der Praxis aufgehen würde. Als wir dann auf dem Bildschirm so überzeugende Ergebnisse zu sehen bekamen, war das ein sehr schöner Augenblick. Die Ergebnisse waren sehr strukturiert und eindeutig.
Götzen: Das würde ich so unterschreiben.
Sie untersuchen drei Merkmale: Geschwindigkeit, Beschleunigung und Querbeschleunigung. Sind noch weitere Komponenten denkbar?
Ziegler: Vielversprechend wäre es, auch den Straßentyp zu berücksichtigen. Ob ein Fahrzeug zum Beispiel auf der Autobahn, im Kreisverkehr oder in populationsstarken Gegenden unterwegs ist, kann die Bewertung der Fahrdaten in Einzelfällen noch einmal deutlich verändern.
Würde dies nicht das Datenaufkommen noch weiter erhöhen?
Götzen: Nein, das Erweitern des Datensatzes um weitere beschreibende Attribute würde nicht so stark ins Gewicht fallen. Das große Datenvolumen kommt durch die Granularität der Datenaufzeichnung zustande. Wir haben einen Datensatz pro gefahrener Sekunde. Einige Attribute lassen sich aus den bereits vorliegenden Daten ableiten, z.B. ob es sich um eine Tages- oder Nachtfahrt handelt. Hierbei möchte ich erwähnen, dass es sich hier um eine Forschungsarbeit handelt. Die in der Arbeit ausgewählten Merkmale bilden nur einen Teil dessen ab, was in ein aussagekräftiges, marktfähiges Tarifmodell einfließen würde.
Hat Telematik (oder Ihre Recherche dazu) Einfluss auf Ihr eigenes Fahrverhalten?
Ziegler: Das ist tatsächlich der Fall. Seit ich mich so intensiv mit der Analyse von Telematikdaten befasst habe, stelle ich fest, dass ich mein eigenes Fahrverhalten noch bewusster reflektiere.
Brück: In Teilen hat die Forschungsarbeit von Frau Ziegler Aussagen bestätigt, die anzunehmen gewesen wären, etwa, dass eine hohe Querbeschleunigung in Kurven einen riskanteren Fahrstil repräsentiert. In den Daten fanden sich aber auch einige Überraschungen. So gilt zum Beispiel nicht für alle Geschwindigkeitsbereiche die Regel „je schneller, desto riskanter“. So hat die Analyse beispielsweise ergeben, dass sich ein unterdurchschnittlicher Fahranteil in Geschwindigkeiten von 65km/h bis 105km/h reduzierend auf die erwartete KH-Prämie auswirkt. Eine mögliche Erklärung könnte sein, dass die Geschwindigkeit in der Regel mit dem Straßentyp korreliert; Autobahn und Landstraße haben unterschiedliche Gefahrenpotenziale. Diese interessante Fragestellung sollte durch weiterführende Forschung untersucht werden.
Lesen Sie auch das Interview mit Christoph Meurer von der Itzehoer zu der Forschungsarbeit von Annika Ziegler.