olmoOCR - Open Source Texterkennung
Info:
"Optical character recognition" (OCR) meint automatische Texterkennung basierend auf optischer Zeichenerkennung!
Der frei zugängliche Dienst olmoOCR, welcher für die Konvertierung von PDFs und anderen Dokumenten in reinen Text entwickelt wurde (wobei die natürliche Lesereihenfolge erhalten bleibt) unterstützt/erkennt Tabellen, Gleichungen, Handschrift und mehr...
olmOCR wurde auf akademische Arbeiten, technische Dokumentation und andere Referenzinhalte trainiert und verwendet eine einzigartige Prompting-Technik, um die Genauigkeit zu erhöhen und Halluzinationen zu verringern.
olmOCR wurde auf akademische Arbeiten, technische Dokumentation und andere Referenzinhalte trainiert und verwendet eine einzigartige Prompting-Technik, um die Genauigkeit zu erhöhen und Halluzinationen zu verringern.
Link:
https://olmocr.allenai.org/ [18.03.2025]