Data Scientist Due Diligence
Einführung
Ich suche derzeit nach neuen beruflichen Möglichkeiten und bin zufällig auf eine Stelle bei der Commerzbank gestoßen: . Sie scheint eine ideale Weiterentwicklung meiner aktuellen Tätigkeit zu sein, daher notiere ich hier meine primitiven Überlegungen zur Stellenbeschreibung.
Devisen (Fx)
- Entwicklung von Machine-Learning-Modellen zur Preisprognose im Devisenhandel unter Einsatz von Techniken wie Deep Learning (neuronale Netzwerke)
- Verwendung von ML/DL zur Prognose zukünftiger Wechselkursentwicklungen. Erfordert typischerweise Datensammlung, Feature Engineering, Training neuronaler Netzwerke (z.B. LSTM, CNN) und Modellvalidierung/-optimierung.
- Aus meiner Erfahrung als Hobby-Trader sind derzeit relevante Merkmale im USD-Markt technische Indikatoren, Trump-Tweets, FED-Reden und makroökonomische Indikatoren wie NFP. Im EUR-Markt spielen die EZB-Zinssenkungserwartungen und der Abbau chinesischer Handelsbarrieren eine größere Rolle.
- Analyse des Kundenorderflows (Sentiment) im FX-Markt mittels Verfahren wie Gradient-Boosting-Modellen zur Unterstützung des Risikomanagements
- Hierbei bezieht sich Sentiment nicht auf Sprache, sondern auf ein kurzfristiges Ungleichgewicht von Kauf- und Verkaufsaufträgen als Richtungsindikator.
- Datensammlung und -vorverarbeitung
- Erhebung von Orderflow-Daten: Richtung, Volumen, Preis, Zeitstempel, Kundentyp etc.
- Feature-Konstruktion: Kauf-/Verkaufsverhältnisse, volumengewichtete Durchschnittspreise, Verteilung nach Kundentyp etc.
- Label-Konstruktion: Zielwerte basierend auf kurzfristigen Preisbewegungen (z.B. Preissteigerung/-senkung in 5 Minuten).
- Anwendung des Gradient Boosting Modells (XGBoost)
- Modelltraining mit historischen Daten zur Vorhersage von Preisbewegungen oder Kundenstimmungen.
- Hyperparameter-Tuning mittels Cross-Validation, Grid Search oder Bayesscher Optimierung.
- Extraktion von Sentiment-Indikatoren
- Quantifizierung von Sentiment: Vorhersagewahrscheinlichkeiten des Modells als Indikator für “Stärke” des Sentiments.
- Segmentanalyse nach Kundentyp (Einzelhandel, Institutionen, Hedgefonds etc.).
- Kombination intelligenter Alpha-Signale zur Ableitung fundierter Risikomanagement-Entscheidungen im FX-Handel
- Dies bezieht sich auf das Einbetten von Signalen, z.B. durch eine zusätzliche MLP-Schicht zur Gewichtung.
- Anwendung von Multi-Armed-Bandit-Methoden zur Optimierung von Trading-Spreads beim Market-Making im FX-Geschäft
- Schritte zur Anwendung im FX-Markt-Making:
- Verschiedene Spreads als „Arme“ initialisieren (z. B. 1 Pip, 1,5 Pip, 2 Pip)
- Ausführungsrate, Gewinn und Inventarrisiko für jeden Spread überwachen
- Belohnungsfunktion definieren: z. B. Spread-Einnahme minus Inventarstrafe (direction * inventory level * penalty factor)
- Ziel: Optimale Spread-Wahl zur Gewinnmaximierung bei Risikokontrolle
- Auswahlgewichte gemäß MAB-Strategie aktualisieren
- Dynamische Anpassung der Spreads zur Annäherung an optimale Strategie
- Auswahl des MAB-Algorithmus:
- ε-greedy: Mit Wahrscheinlichkeit ε neue Spreads erkunden, sonst den besten verwenden
- UCB: Berücksichtigt erwartete Belohnung + Unsicherheit
- Thompson Sampling: Wahrscheinlichkeitsmodellierung + Bayessche Auswahl
- Schritte zur Anwendung im FX-Markt-Making:
Rohstoffe (Commodities)
- Erstellung arbitragefreier Gas- und Strompreis-Kurven mithilfe von Handelssignalen
- Bekannt mit Methoden zur arbitragefreien Preisbildung im CFD-Kontext.
- Für Proxy-Futures: lineare Interpolation oder fortgeschrittene Methoden (Stückweise Regression, Splines), anschließend Glättung mittels Optimierungsalgorithmen (Least Squares, konvexe Optimierung).
- Optimale Schätzung von Forward-Kurven und Definition von Proxy-Hedge-Instrumenten durch Datenanalyse, Backtesting und Sensitivitätstests
- Proxy-Hedges sind hochkorrelierte Assets (z. B. ähnliche Laufzeiten, verwandte Rohstoffe).
- Sensitivitätsanalyse: Test der Modellreaktionen auf Preise, Volatilität, Korrelationen → Schwächen erkennen, Risikoanpassung.
- Einsatz von Advanced Analytics- und Zeitreihenanalyse-Techniken zur Signalgewinnung im Rohstoffhandel
- ARIMA:
- AR-Koeffizienten positiv → Momentum; negativ → Rückkehr zum Mittelwert
- Strukturwechsel in Residuen → Alpha durch Ereignisse möglich
- GARCH:
- α: Wirkung neuer Schocks (hoch → starke Reaktion)
- β: Beständigkeit der Volatilität (hoch → Trendfolge möglich)
- Konditionale Volatilität: Ausschläge → Risikoaufschläge → evtl. Kontra-/Optionsstrategie
- Fourier / FFT:
- Frequenzveränderung: Kürzer → Beschleunigung → evtl. Trendumkehr
- Amplitudenänderung: Zunahme → Trendstärke; Abnahme → Seitwärtsstrategie
- Ausreißererkennung:
- Z-Score > ±2~3 → Absicherung oder Arbitragestrategie
- ARIMA:
- Durchführung von Datenbereinigung, -transformation und Web-Scraping
- Python (pandas, BeautifulSoup, Scrapy, Selenium) wird typischerweise für diese Aufgaben verwendet.