Einstellungen
Besitzer und Bearbeiter können einen Datenraum verwalten, indem sie auf die Schaltfläche Einstellungen im Datenraum klicken.
Dateien
Laden Sie Dateien in den Datenraum hoch, indem Sie auf die Schaltfläche Dateien hochladen klicken.
Unterstützte Dateitypen
AITEZA unterstützt eine Vielzahl von Dateiformaten für die Dokumentenverarbeitung. Dateien werden automatisch verarbeitet und für den Abruf indiziert.
Dokumente
PDF (
.pdf) – Portable Document Format, einschließlich gescannter DokumenteWord (
.doc,.docx) – Microsoft Word-Dokumente (alt und modern)PowerPoint (
.ppt,.pptx) – Microsoft PowerPoint-PräsentationenExcel (
.xls,.xlsx) – Microsoft Excel-TabellenRTF (
.rtf) – Rich Text FormatKlartext (
.txt) – KlartextdateienMarkdown (
.md) – Markdown-formatierter TextCSV (
.csv) – Durch Kommas getrennte WerteHTML/XML (
.html,.htm,.xml) – Web- und Markup-Dateien
Bilder
JPEG (
.jpg,.jpeg) – Gängiges BildformatPNG (
.png) – Portable Network GraphicsTIFF (
.tiff,.tif) – Tagged Image File FormatBMP (
.bmp) – Bitmap-BilderGIF (
.gif) – Graphics Interchange Format
Audio (mit automatischer Transkription)
MP3 (
.mp3) – MPEG Audio Layer 3WAV (
.wav) – Waveform Audio File FormatFLAC (
.flac) – Free Lossless Audio CodecAAC (
.aac,.m4a) – Advanced Audio CodingOGG (
.ogg) – Ogg Vorbis AudioWebM (
.webm) – WebM AudioWMA (
.wma) – Windows Media AudioAIFF (
.aiff) – Audio Interchange File Format
Outlook (
.msg) – Microsoft Outlook-NachrichtenEML (
.eml) – Standard-E-Mail-Format (RFC 822)MBOX (
.mbox) – Mailbox-Format für mehrere E-Mails
Dateien hochladen
Ziehen Sie entweder Dateien von Ihrem Computer auf die Einstellungsseite oder klicken Sie auf `Dateien hochladen`, um Dateien von Ihrem Computer auszuwählen.
Nach der Verarbeitung werden die Dateien im Datenraum aufgelistet.
PDF-Viewer
Wenn Sie eine PDF aus der Dateiliste öffnen, zeigt der Viewer die Markdown-Repräsentation neben der Original-PDF an. So lassen sich Layout und Inhalte schneller prüfen.
Dateien in einen anderen Datenraum verschieben
Besitzer und Bearbeiter können eine Datei in einen anderen Datenraum verschieben, auf den sie Zugriff haben. Das Verschieben einer Datei entfernt sie aus dem ursprünglichen Datenraum und indiziert sie im Ziel-Datenraum neu; zukünftiges Abrufen verwendet nur den Ziel-Datenraum.
Datei in einen anderen Datenraum verschieben
Navigieren Sie zum Quell-Datenraum und öffnen Sie `Einstellungen` > `Dateien`.
Suchen Sie die Datei, die Sie verschieben möchten, und klicken Sie auf die Aktion `Verschieben` (Ellipsen-Menü, falls nicht direkt sichtbar).
Wählen Sie den Ziel-Datenraum aus der Liste aus. Nur Datenräume, in denen Sie `Besitzer` oder `Bearbeiter` sind, können ausgewählt werden.
Bestätigen Sie das Verschieben im Dialog.
Nach der Verarbeitung erscheint die Datei im Ziel-Datenraum und wird aus dem Original entfernt; ihr Inhalt wird dort für den Abruf verfügbar.
Dateien neu verarbeiten
Sie können vorhandene Dateien neu verarbeiten, um ihren Inhalt und ihre Einbettungen mit verschiedenen Verarbeitungs-Pipelines zu aktualisieren. Dies ist nützlich, wenn:
Verarbeitungsalgorithmen aktualisiert wurden.
Die anfängliche Verarbeitung den Inhalt nicht korrekt extrahiert hat (z. B. gescannte Dokumente).
Sie ein anderes Verarbeitungsmodell für bessere Ergebnisse ausprobieren möchten.
Verarbeitungs-Pipelines
AITEZA bietet mehrere Verarbeitungs-Pipelines für die Dokumentenextraktion:
Pipeline | Beschreibung | Am besten für |
|---|---|---|
DOCLING | Erweiterte Dokumentenverarbeitung mit Layout-Verständnis. | Komplexe Dokumente, Tabellen, mehrspaltiges Layout |
VLM | Vision Language Model-Pipeline mit KI-Vision-Funktionen. | Schwer lesbare Dokumente, komplexe Layouts, handgeschriebener Text |
Verwendung der VLM-Pipeline
Die VLM (Vision Language Model)-Pipeline verwendet fortschrittliche KI-Vision-Modelle, um Inhalte aus Dokumenten zu verstehen und zu extrahieren. Dies ist besonders nützlich für:
Gescannte oder fotografierte Dokumente mit schlechter Qualität.
Dokumente mit komplexen visuellen Layouts.
Handschriftliche Notizen oder Anmerkungen.
Dokumente, bei denen Standard-OCR fehlschlägt.
Datei mit VLM neu verarbeiten
Navigieren Sie zu den Datenraum-Einstellungen und öffnen Sie den Abschnitt `Dateien`.
Suchen Sie die Datei, die Sie neu verarbeiten möchten, und klicken Sie auf die Aktion „Neu verarbeiten" (Ellipsen-Menü, falls nicht direkt sichtbar).
Wählen Sie `VLM` als Verarbeitungs-Pipeline aus.
Wählen Sie ein VLM-Modell (z. B. `gpt-4o`) aus den verfügbaren Optionen.
Bestätigen Sie, um die Neuverarbeitung zu starten. Die Datei wird mit dem neuen Inhalt neu indiziert.
Webseiten
Fügen Sie Webseiten zum Datenraum hinzu, indem Sie auf die Schaltfläche Webseite hinzufügen klicken.
Webseiten hinzufügen
Geben Sie eine gültige URL wie `https://www.example.com` in das URL-Feld ein.
Geben Sie einen beschreibenden Namen für die Webseite in das Namensfeld ein.
Wählen Sie, ob Unterseiten wie `https://www.example.com/subpage` eingeschlossen werden sollen.
Nach der Verarbeitung wird die Webseite im Datenraum aufgelistet.
Modellauswahl
Wählen Sie das Sprachmodell aus, das zur Beantwortung von Fragen im Datenraum verwendet werden soll. Jeder Benutzer, der Zugriff auf den Datenraum hat, kann ein Sprachmodell auswählen, das Sie verfügbar machen.
Modelle hinzufügen
Klicken Sie auf die Schaltfläche `Modell hinzufügen`
Suchen Sie nach dem großen Sprachmodell, das Sie hinzufügen möchten.
(Optional) Aktivieren Sie die Vererbungsoption (`Auf alle Unterdatenräume anwenden`), um dieses Modell in allen unmittelbaren und verschachtelten Unterdatenräumen verfügbar zu machen.
Klicken Sie auf die Schaltfläche `Hinzufügen`, um das Sprachmodell zum Datenraum hinzuzufügen.
Nach der Verarbeitung steht das Sprachmodell zur Auswahl im Datenraum zur Verfügung.
Modelle entfernen
Klicken Sie auf die Schaltfläche `Entfernen` neben dem großen Sprachmodell, das Sie entfernen möchten.
(Optional) Wenn die Vererbung zuvor angewendet wurde, wählen Sie, ob das Entfernen auch auf alle Unterdatenräume übertragen werden soll.
Nach der Verarbeitung ist das Sprachmodell im Datenraum nicht mehr verfügbar.
Benutzerzugriffsverwaltung
Verwalten Sie, welche Benutzer Zugriff auf den Datenraum haben, indem Sie zum Abschnitt „Zugriff verwalten" der Einstellungsseite navigieren.
Benutzer hinzufügen
Klicken Sie auf die Schaltfläche `Benutzer hinzufügen`.
Suchen Sie nach dem Benutzer, den Sie hinzufügen möchten. Sie können nach E-Mail-Adresse oder Name suchen.
Vorausgesetzt, Sie haben die erforderlichen Zugriffsrechte, können Sie auch Benutzer hinzufügen, die noch nicht im System registriert sind.
Wählen Sie die Rolle des Benutzers. Die Rolle kann `Besitzer`, `Bearbeiter` oder `Betrachter` sein.
(Optional) Klicken Sie auf `An alle Unterdatenräume vererben`, um automatisch dieselbe Zugriffsrolle in allen vorhandenen Unterdatenräumen zu gewähren.
Klicken Sie auf die Schaltfläche `Hinzufügen`, um den Benutzer zum Datenraum hinzuzufügen.
Nach der Verarbeitung hat der Benutzer Zugriff auf den Datenraum
Benutzerrollen ändern
Ändern Sie die Rolle eines Benutzers, indem Sie die Rolle aus dem Dropdown-Menü neben dem Benutzer auswählen.
(Optional) Wenn der Zugriff des Benutzers vererbt wird, wählen Sie, ob die Rollenänderung auf alle Unterdatenräume übertragen werden soll.
Nach der Verarbeitung hat der Benutzer die neue Rolle im Datenraum.
Benutzer entfernen
Klicken Sie auf die Schaltfläche `Entfernen` neben dem Benutzer, den Sie entfernen möchten.
(Optional) Wenn der Zugriff des Benutzers vererbt wurde, wählen Sie, ob das Entfernen auch auf alle Unterdatenräume angewendet werden soll.
Nach der Verarbeitung hat der Benutzer keinen Zugriff mehr auf den Datenraum.
Einen Datenraum umbenennen
Datenraum umbenennen
Navigieren Sie zum Abschnitt „Datenraumname" der Einstellungsseite
Geben Sie einen neuen Namen für den Datenraum ein
Klicken Sie auf die Schaltfläche `Speichern`, um den neuen Namen zu speichern
Einen Datenraum löschen
Datenraum löschen
Navigieren Sie zum Abschnitt `Datenraum löschen` der Einstellungsseite
Klicken Sie auf die Schaltfläche `Datenraum löschen`
Bestätigen Sie das Löschen, indem Sie im Bestätigungsdialog auf die Schaltfläche `Löschen` klicken