Hallo Leute!
Ich brauch etwas Hilfe bei einem Regex-Problem. Es soll bei einem Rechnungsformular der Rechnungsbetrag ausgelesen werden. Da dieser, abhängig von der Anzahl der Rechnungsposten immer wo anders steht, liest das OCR alles Mögliche aus, aber selten den korrekten Betrag. Deshalb muß mit Regex nachgeholfen werden. Ich möchte den Wert nach "Gesamtbetrag" vollständig auslesen. Leider macht mir das Tausender-Trennzeichen einen Strich durch mein Ansinnen. Den Regex-Ausdruck (?<=Gesamtsumme([\s]*))(\d{1,6})([\.,]\d{2}) habe ich mir auch nur aus dem Netz kopiert und im Try-and-Error-Verfahren so weit gebracht, dass er die richtige Zeile erkennt. Ich bekomme es allerdings nicht hin, dass er immer den kompletten Betrag erkennt. Leider habe ich (noch) absolut rudimentäre RegEX-Kenntnisse.
Habt Ihr einen Lösungsvorschlag?
Ich brauch etwas Hilfe bei einem Regex-Problem. Es soll bei einem Rechnungsformular der Rechnungsbetrag ausgelesen werden. Da dieser, abhängig von der Anzahl der Rechnungsposten immer wo anders steht, liest das OCR alles Mögliche aus, aber selten den korrekten Betrag. Deshalb muß mit Regex nachgeholfen werden. Ich möchte den Wert nach "Gesamtbetrag" vollständig auslesen. Leider macht mir das Tausender-Trennzeichen einen Strich durch mein Ansinnen. Den Regex-Ausdruck (?<=Gesamtsumme([\s]*))(\d{1,6})([\.,]\d{2}) habe ich mir auch nur aus dem Netz kopiert und im Try-and-Error-Verfahren so weit gebracht, dass er die richtige Zeile erkennt. Ich bekomme es allerdings nicht hin, dass er immer den kompletten Betrag erkennt. Leider habe ich (noch) absolut rudimentäre RegEX-Kenntnisse.
Habt Ihr einen Lösungsvorschlag?