Version 0.0.2 (Mai 2025)

Ein DOM-Baum-Transformationssystem zur Extraktion und Übersetzung von Textinhalten wurde implementiert. Es wurde eine Logik zur Gruppierung von Text in semantische Blöcke hinzugefügt, um den Kontext bei der Übersetzung zu erhalten.

Was wurde hinzugefügt

HTML-Dokument-Parsing – Extraktion aller Textinhalte von der Seite
Gruppierung von zusammenhängendem Text in semantische Blöcke für eine genauere Übersetzung
Basisübersetzung statischer Inhalte – automatische Übersetzung von Text und Meta-Tags
Kontextwahrung – der Algorithmus berücksichtigt die Verknüpfung von Elementen bei der Gruppierung

Technische Details

Der Transformer analysiert den DOM-Baum der Seite, extrahiert Textknoten und gruppiert sie nach semantischer Nähe. Dies ermöglicht es, nicht einzelne Wörter, sondern ganze Sätze und Absätze zur Übersetzung zu senden, was die Übersetzungsqualität erheblich verbessert.

Mehr zur Implementierung: Automatische KI-Übersetzung und Mehrsprachigkeit der Website

Ergebnis

Das System kann statische Inhalte von Tilda-Websites unter Beibehaltung von Struktur und Kontext übersetzen.