KI-gestützte OCR im ONLYOFFICE PDF-Editor: So konvertieren Sie Bilder in Text
Version 9.0 brachte einige wichtige KI-Verbesserungen mit sich, die Ihre Produktivität bei der Arbeit mit Tabellenkalkulationen und PDF-Dateien steigern sollen. In dieser Anleitung konzentrieren wir uns auf die neu hinzugefügte OCR-Funktion und erklären, wie Sie Bilder mit Ihrem bevorzugten KI-Assistenten in unserem PDF-Editor in editierbaren Text umwandeln.
Was ist OCR?
OCR steht für Optical Character Recognition (optische Zeichenerkennung). Diese Technologie ermöglicht das Scannen und Konvertieren verschiedener Dokumenttypen, Bilder und PDF-Dateien in bearbeitbare und durchsuchbare Daten.
In ONLYOFFICE basiert die OCR-Funktion auf künstlicher Intelligenz. So können Sie Bilder mithilfe der OCR-Funktionen Ihres KI-Assistenten in Sekundenschnelle in Text umwandeln. Die Funktion funktioniert in Dokumenten, Tabellen, Präsentationen und PDF-Dateien.
Wir zeigen Ihnen, was Sie für den Einstieg in die OCR-Erkennung Ihrer PDFs benötigen.
Wählen Sie die passende ONLYOFFICE-Lösung
Wählen Sie zunächst die passende ONLYOFFICE-Lösung entsprechend Ihren Anforderungen:
- Setzen Sie ONLYOFFICE Docs, die selbstgehostete Version der Suite, auf Ihrem Windows- oder Linux-Server ein und integrieren Sie sie in die Plattform Ihrer Wahl, um eine sichere Umgebung für die Zusammenarbeit zu schaffen, z. B. in Nextcloud, ownCloud, Redmine, Moodle, Alfresco, Jira, SuiteCRM, Seafile usw. – insgesamt mehr als 40 Optionen. Für alle, die nichts manuell installieren und konfigurieren möchten, ist auch die Cloud-basierte Version von ONLYOFFICE Docs verfügbar.
- Erstellen Sie ein kostenloses ONLYOFFICE DocSpace-Konto und erhalten Sie Zugriff auf eine raumbasierte Plattform für effiziente Teamarbeit in Echtzeit.
- Installieren Sie ONLYOFFICE Desktop Editors auf Ihrem PC oder Laptop mit Windows, Linux oder macOS und nutzen Sie die kostenlose Offline-Dokumentenbearbeitung.
Alle diese Lösungen verfügen über den ONLYOFFICE PDF-Editor, ein leistungsstarkes Tool, mit dem Sie den vorhandenen Text bearbeiten und neue Textfelder hinzufügen, visuelle Objekte einfügen und ändern, interaktive Felder verschiedener Typen hinzufügen, Kommentare und Zeichnungen hinterlassen, Seiten verwalten und Ihre Dokumente mit Anmerkungen versehen können.
Im ONLYOFFICE PDF Editor können Sie die OCR-Funktion aktivieren, indem Sie das KI-Plugin installieren und konfigurieren. Sehen wir uns an, wie es in der Praxis funktioniert.
KI-Integration aktivieren
Um OCR in PDF-Dateien auszuführen, müssen Sie über das KI-Plugin ein geeignetes KI-Modell hinzufügen. Dieses unterstützt alle gängigen Chatbots und Tools – ChatGPT, Google Gemini, Claude Sonnet, Mistral, Groq, DeepSeek, xAI, Stability AI und mehr.
Wir gehen den Installations- und Konfigurationsprozess im ONLYOFFICE PDF-Editor durch.
Schritt 1: KI-Plugin installieren
Öffnen Sie Ihre PDF-Datei und rufen Sie den ONLYOFFICE-Plugin-Marktplatz über den Plugin-Manager auf der Registerkarte Plugins auf. Suchen und installieren Sie das KI-Plugin über die entsprechende Schaltfläche.
Schritt 2: KI-Plugin aktivieren
Aktivieren Sie nun das KI-Plugin, indem Sie den Schieberegler im Bereich Hintergrund-Plugins neben dem Plugin-Manager verschieben. In der oberen Symbolleiste wird eine neue Registerkarte angezeigt – KI.
Schritt 3. Ein geeignetes KI-Modell mit OCR-Funktionen hinzufügen
Wechseln Sie zur Registerkarte KI und klicken Sie auf das Symbol Einstellungen. Sie sehen das KI-Konfigurationsmenü, in dem Sie KI-Modelle für verschiedene Aufgaben hinzufügen und auswählen können.
Klicken Sie auf KI-Modelle bearbeiten, um ein neues Modell hinzuzufügen. Im Menü der KI-Modellliste können Sie Ihre Modelle jederzeit hinzufügen und löschen.
Klicken Sie auf die Schaltfläche + und wählen Sie einen der Anbieter aus der Dropdown-Liste im Feld Name aus. In unserem Beispiel ist es Mistral, Sie können aber auch jede andere Option wählen.
Nach Auswahl eines Anbieters wird der entsprechende URL-Parameter automatisch erstellt. Sie müssen lediglich einen gültigen API-Schlüssel in das Feld Schlüssel eingeben. Sie erhalten ihn auf der offiziellen Website Ihres Anbieters.
Bitte beachten Sie, dass einige Anbieter ihre API-Schlüssel nicht kostenlos anbieten. Sie müssen daher möglicherweise einen kaufen. Wir empfehlen Ihnen daher dringend, die Richtlinien und Nutzungsbedingungen der Anbieter zu lesen, bevor Sie deren KI-Modelle in ONLYOFFICE verwenden.
Wählen Sie nun ein Modell aus der Dropdown-Liste. Falls nichts angezeigt wird, klicken Sie auf Modellliste aktualisieren. Wählen Sie das gewünschte Modell aus. Beachten Sie jedoch, dass verschiedene Modelle für bestimmte Aufgaben gut geeignet sind. Manche Modelle eignen sich beispielsweise gut zur Textgenerierung, können aber Text in Bildern nicht erkennen. Wählen Sie daher am besten ein Modell, das für OCR-Anwendungen entwickelt wurde. Weitere Informationen zu den Funktionen der Modelle finden Sie auf der Website Ihres Anbieters.
Sie können das hinzugefügte Modell außerdem im Feld Modellname umbenennen. Beachten Sie den Abschnitt Modell verwenden für – für Ihr Modell sollte die Option Visuelle Analyse aktiviert sein. Andernfalls können Sie es nicht für OCR verwenden. Falls Ihr Modell über OCR-Funktionalität verfügt, diese Option aber nicht standardmäßig aktiviert ist, aktivieren Sie sie manuell. Klicken Sie abschließend auf OK.
Schritt 4. OCR-Aufgaben zuweisen
Nachdem Sie Ihr KI-Modell erfolgreich hinzugefügt haben, gelangen Sie zurück zur KI-Modellliste. Klicken Sie auf Zurück, um das KI-Konfigurationsfenster zu öffnen. Dort können Sie Ihr KI-Modell als Standardoption für OCR-Aufgaben festlegen. Klicken Sie auf OK, um die Konfiguration abzuschließen.
Gut gemacht! Jetzt ist alles bereit für die OCR-Erkennung Ihrer PDFs. Sie erreichen die OCR-Funktion über die Registerkarte KI. Ist das OCR-Symbol grau? Kein Problem. Wechseln Sie einfach in den Bearbeitungsmodus, da der standardmäßige Kommentarmodus keine Texterkennung zulässt. Klicken Sie entweder auf den Button PDF bearbeiten auf der Registerkarte KI oder wählen Sie den Bearbeitungsmodus oben rechts in der Benutzeroberfläche.
So konvertieren Sie Bilder in Text
Nachdem Sie Ihr KI-Modell konfiguriert haben, können Sie Bilder in Ihren PDF-Dateien ganz einfach in bearbeitbaren Text konvertieren, indem Sie auf der Registerkarte KI auf die OCR-Schaltfläche klicken. Der KI-Assistent erkennt den Text in Ihrem Bild und fügt ihn auf derselben Seite ein.
Bearbeiten Sie ihn anschließend mit den zahlreichen Tools des ONLYOFFICE PDF-Editors: Wählen Sie verschiedene Schriftarten, ändern Sie deren Größe und Farbe, erstellen Sie Aufzählungs- und Nummerierungslisten, richten Sie Text unterschiedlich aus, fügen Sie Objekte ein und bearbeiten Sie sie und vieles mehr.
ONLYOFFICE erhalten und KI für OCR-Aufgaben nutzen
Nutzen Sie die OCR-Funktionen künstlicher Intelligenz, um Bilder in Ihren PDFs online in editierbaren Text umzuwandeln. Erstellen Sie dazu ein kostenloses ONLYOFFICE DocSpace-Konto oder laden Sie die kostenlose Desktop-Anwendung für Ihren PC oder Laptop (Windows, Linux oder macOS) herunter.
Häufig gestellte Fragen
Hier finden Sie Antworten auf die häufigsten Fragen zu KI-gestützter OCR in ONLYOFFICE:
Frage: Ich traue KI-Tools nicht. Kann ich OCR in ONLYOFFICE ohne das KI-Plugin ausführen?
Antwort: Für PDF-Dateien ist KI-gestützte OCR die einzige verfügbare Option. Für Textdokumente können Sie jedoch das OCR-Plugin verwenden, das Bilder in editierbaren Text konvertiert und keine KI-Integration benötigt. Lesen Sie diesen Artikel, um mehr zu erfahren.
Frage: Kann ich OCR nur in PDF-Dateien ausführen?
Antwort: Die KI-gestützte OCR-Funktion ist auch in Dokumenten, Tabellenkalkulationen und Präsentationen verfügbar. Wählen Sie dazu das gewünschte Bild aus, öffnen Sie das Kontextmenü mit einem Rechtsklick und wählen Sie KI -> Bild -> OCR.
Frage: Ist jedes KI-Modell für OCR-Zwecke geeignet?
Antwort: Nicht alle KI-Modelle sind für solche Aufgaben geeignet. Bevor Sie ein KI-Modell für die Texterkennung in ONLYOFFICE verwenden, überprüfen Sie bitte die Spezifikationen auf der Website des Anbieters.
Frage: Ist KI-gestützte OCR eine kostenpflichtige Funktion?
Antwort: Nein, das ONLYOFFICE KI-Plugin und alle seine Funktionen, einschließlich OCR, sind kostenlos verfügbar. Ihr KI-Anbieter erhebt jedoch möglicherweise Gebühren für die Nutzung seiner Modelle in ONLYOFFICE. Weitere Informationen zu den Preisen finden Sie auf der Website Ihres Anbieters.
Erstellen Sie Ihr kostenloses ONLYOFFICE-Konto
Öffnen und bearbeiten Sie gemeinsam Dokumente, Tabellen, Folien, Formulare und PDF-Dateien online.