read_transactions.webcrawler.amazon_visa¶
- author:
Tim Häberlein
- version:
2.0
- date:
22.10.2025
- organisation:
TU Dresden, FZM
AmazonCrawler¶
Crawler für Amazon Visa (Zinia) – lädt Transaktionen im XLS-Format herunter.
- Verwendung:
from read_transactions.webcrawler.amazon import AmazonCrawler
- with AmazonCrawler(logging_level=“DEBUG“) as crawler:
crawler.login() crawler.download_data() crawler.process_data() crawler.save_data()
Attributes¶
Classes¶
Crawler für Amazon Visa (Zinia). |
Module Contents¶
- class read_transactions.webcrawler.amazon_visa.AmazonVisaCrawler(save_amazon_order: bool = True, *args, **kwargs)¶
Bases:
read_transactions.webcrawler.WebCrawlerCrawler für Amazon Visa (Zinia).
Der Crawler automatisiert den Login auf customer.amazon.zinia.de, lädt alle Transaktionen im gewählten Datumsbereich herunter (XLS-Format) und konvertiert sie in ein einheitliches CSV-Format.
- Ablauf:
Login mit Benutzername + 4-stelliger PIN
Öffnen der Transaktionsseite
Setzen des gewünschten Zeitraums
Herunterladen der Excel-Datei
Zusammenführen / Bereinigen der Daten
- Erfordert:
gültige Zugangsdaten in config.yaml
hinterlegte URLs für login und transactions
funktionierenden Selenium-WebDriver (Edge / Chrome / Firefox)
- Beispiel:
`bash readtx run amazon --start 01.01.2024 --end 31.03.2024 --log_level DEBUG `
Parameter¶
- save_amazon_orderbool, optional
Falls True, werden die detaillierten Umsatzinformationen zusätzlich von Amazon gespeichert Achtung: nur, wenn details ebenfalls True ist. Standard:
True.- detailsbool, optional
Falls True, werden detaillierte Umsatzinformationen zusätzlich von Amazon abgerufen. Diese werden anhand von Betrag und Datum den Umsätzen zugeordnet. Standard:
True.- logfilestr, optional
Pfad zu einer Logdatei. Wenn None, wird nur in die Konsole geloggt.
- output_pathstr, optional
Verzeichnis, in dem die verarbeiteten Daten gespeichert werden. Standard:
out.- start_datestr | pandas.Timestamp | datetime.date, optional
Startdatum für den Download (Format:
dd.mm.yyyy). Standard: heutiges Datum.- end_datestr | pandas.Timestamp | datetime.date, optional
Enddatum für den Download (Format:
dd.mm.yyyy). Standard: sechs Monate vor start_date.- logging_levelstr, optional
Log-Level der Crawler-Instanz (z. B. „DEBUG“, „INFO“, „WARNING“). Standard:
INFO.- global_log_levelstr, optional
Globales Log-Level für das gesamte Paket (Standard:
INFO).- browserstr, optional
Zu verwendender Browser-Treiber (
edge,chromeoderfirefox). Standard:edge.- headlessbool, optional
Falls True, wird der Browser im Hintergrundmodus gestartet. Standard:
False.- user_agentstr, optional
Optionaler User-Agent-String für den Browser.
- Attribute:
account_balance (str): Aktueller Kontostand nach erfolgreichem Login. data (pd.DataFrame): Aufbereitete Transaktionsdaten.
- _verified = False¶
- _save_amazon_order = True¶
- login() None¶
Führt Login bei Amazon Visa (Zinia) aus.
- download_data() None¶
Navigiert zur Transaktionsseite und lädt XLS-Datei herunter.
- process_data(*args, **kwargs) None¶
Verarbeitet heruntergeladene XLS-Daten.
- preprocess_data(key: str, df: pandas.DataFrame) pandas.DataFrame¶
Überschreibt die Clean-Funktion der Basis-Klasse.
- _verify_identity() None¶
Führt den gesamten OTP-/2FA-Verifizierungsprozess durch (ohne Rekursion).
- _fetch_transaction_details(key_columns=['Betrag', 'Datum']) pandas.DataFrame¶
Detaillierte Umsatzinformationen über amazon.de abrufen - load orders from amazon.de with amazon crowler - match transactions by amount + date - for each match, get details (verwendungszweck, verwendungszweck2) from amazon data - merge details into self.data verwendungszweck as verwendungszweck, verwendungszweck 2 as verwendungszweck 3
- read_transactions.webcrawler.amazon_visa.end¶