Un système de transformation de l'arbre DOM a été implémenté pour extraire et traduire le contenu textuel. Une logique de regroupement du texte en blocs sémantiques a été ajoutée pour préserver le contexte lors de la traduction.
Ce qui a été ajouté
- Analyse de document HTML — extraction de tout le contenu textuel de la page
- Regroupement du texte lié en blocs sémantiques pour une traduction plus précise
- Traduction de base du contenu statique — traduction automatique du texte et des méta-balises
- Préservation du contexte — l'algorithme prend en compte la relation entre les éléments lors du regroupement
Détails techniques
Le transformateur analyse l'arbre DOM de la page, extrait les nœuds de texte et les regroupe par proximité sémantique. Cela permet d'envoyer à la traduction non pas des mots isolés, mais des phrases et des paragraphes entiers, ce qui améliore considérablement la qualité de la traduction.
En savoir plus sur l'implémentation : Traduction automatique par IA et multilinguisme du site web
Résultat
Le système est capable de traduire le contenu statique des sites sur Tilda tout en préservant la structure et le contexte.
