Ich bin auf das Forum hier nach langer Suche gestoßen und habe mit großem Interesse die Diskussionen zum automatischen Kontoauszug-Abruf von DKB und anderen Banken gelesen (z.B. DKB).
Als Quereinsteiger wollte ich mal Eure Meinung zu folgender Überlegung hören.
Der Vorteil für mich:
Was derzeit noch fehlt:
Ich habe dazu aber noch nichts hier im Forum finden können. Wäre für mich mal interessant zu hören, was die Experten denken.. oder andere Laien..
Als Quereinsteiger wollte ich mal Eure Meinung zu folgender Überlegung hören.
- Monatliche Kontoauszüge (PDFs) werden von Comdirect/DKB nur über Web-Banking bereitgestellt
- Abruf e-Kontoauszüge (z.B. Banking 4) ersetzen den manuellen Download nicht, man muss sich also weiterhin monatlich einloggen und x PDFs manuell herunterladen, umbenennen (etc.)
- Ich habe seit einiger Zeit ein Verfahren entwickelt, wie ich Umsätze aus den PDFs automatisch extrahiere. Dazu nutze ich pdfplumber (https://github.com/jsvine/pdfplumber), welcher Tabellen in PDFs erkennen kann und Daten strukturiert verarbeitet
- Für jedes Bank-Kontoauszug-PDF-Format ist ein eigenes "Mapping" zu schreiben. Jedoch bleiben die Formate größtenteils über mehrere Jahre stabil. Bei DKB gab es z.B. erst mit der Umstellung aufs neue Web-Banking einen Formatwechsel, nach mehr als 10 Jahren ohne Änderung
Der Vorteil für mich:
- ich muss mich ohnehin einloggen, um die PDF abzurufen
- ich habe eine einzige Quelle (single point of truth) für Umsätze (die signierten PDF), nicht mehrere (HBCI, CSV etc.)
- ich kann die Daten frei weiterverarbeiten.. in eine eigene Datenbank, Format, LibreCalc etc. In meinem Fall gehen die Daten nach Beancount (https://github.com/beancount/beancount)
- ich muss keine HBCI-Fin/TS etc. Standards abstimmen und warten; der ständige Wechsel der Kartenformate bei DKB hat auch einen ständigen Wechsel der Abruf-Verfahren nach sich gezogen, das nervt; Ich habe hier einige Kartenlesegeräte rumliegen, die nutzlos geworden sind. Alles Hardwareschrott.
- ich benötige keine kostenpflichtige Girocard (DKB); sondern kann die kostenlose Visa Debit behalten
Was derzeit noch fehlt:
- das Verarbeiten ist noch nicht perfekt und noch nicht vorzeigbar. Derzeit verarbeite ich in JupyterLab & Pandas Dataframes und lasse mir Fehler ausgeben. Der Aufwand bisher war aber minimal. Das Mapping für DKB/Comdirect war in 2 Tagen geschrieben. Ich bin zuversichtlich, dass das sehr robust und mit sanity-checks und validation umsetzen lässt und auch absolut sicher die korrekten Umsätze (etc.) extrahiert.
- ich habe den letzten Schritt des Automatischen PDF-Abrufs der Kontoauszüge noch nicht automatisieren können. Eine (etwas verrückte) Idee war, ein Android-Handy an meinen Server zu hängen, eine Kamera auf das Display, dann per automatischen Login und srcpy (https://github.com/Genymobile/scrcpy) in der DKB-App den One-Time-Code abrufen, per Kamera Fotografieren, OCR für das Kamera Bild, um den Code auszulesen und dann alles in einer VM nutzen, um sich automatisch einzuloggen. Danach mittels Screen-Scraping (z.B.) die PDF herunterladen, umbenennen (und weiterverarbeiten). Das ist aber zugegeben schon ziemlich abenteuerlich.
- Dadurch, dass Kontoauszüge nur monatlich 1x bereitgestellt werden, hat man lokal auch nur 1x im Monat eine aktualisierte Umsatzerfassung. Für mich ist das akzeptabel, aber wahrscheinlich nicht für jedermann.
Ich habe dazu aber noch nichts hier im Forum finden können. Wäre für mich mal interessant zu hören, was die Experten denken.. oder andere Laien..