Ein DOM-Baum-Transformationssystem zur Extraktion und Übersetzung von Textinhalten wurde implementiert. Es wurde eine Logik zur Gruppierung von Text in semantische Blöcke hinzugefügt, um den Kontext bei der Übersetzung zu erhalten.
Was wurde hinzugefügt
- HTML-Dokument-Parsing – Extraktion aller Textinhalte von der Seite
- Gruppierung von zusammenhängendem Text in semantische Blöcke für eine genauere Übersetzung
- Basisübersetzung statischer Inhalte – automatische Übersetzung von Text und Meta-Tags
- Kontextwahrung – der Algorithmus berücksichtigt die Verknüpfung von Elementen bei der Gruppierung
Technische Details
Der Transformer analysiert den DOM-Baum der Seite, extrahiert Textknoten und gruppiert sie nach semantischer Nähe. Dies ermöglicht es, nicht einzelne Wörter, sondern ganze Sätze und Absätze zur Übersetzung zu senden, was die Übersetzungsqualität erheblich verbessert.
Mehr zur Implementierung: Automatische KI-Übersetzung und Mehrsprachigkeit der Website
Ergebnis
Das System kann statische Inhalte von Tilda-Websites unter Beibehaltung von Struktur und Kontext übersetzen.
