Zaimplementowano system transformacji drzewa DOM do ekstrakcji i tłumaczenia treści tekstowych. Dodano logikę grupowania tekstu w bloki semantyczne w celu zachowania kontekstu podczas tłumaczenia.
Co zostało dodane
- Parsowanie dokumentu HTML — ekstrakcja całej treści tekstowej ze strony
- Grupowanie powiązanego tekstu w bloki semantyczne dla dokładniejszego tłumaczenia
- Podstawowe tłumaczenie treści statycznych — automatyczne tłumaczenie tekstu i meta-tagów
- Zachowanie kontekstu — algorytm uwzględnia powiązania elementów podczas grupowania
Szczegóły techniczne
Transformer analizuje drzewo DOM strony, wyodrębnia węzły tekstowe i grupuje je według semantycznej bliskości. Pozwala to na wysyłanie do tłumaczenia nie pojedynczych słów, ale całych fraz i akapitów, co znacznie poprawia jakość tłumaczenia.
Więcej o implementacji: Automatyczne tłumaczenie AI i wielojęzyczność strony internetowej
Wynik
System jest w stanie tłumaczyć statyczną zawartość stron na Tilda z zachowaniem struktury i kontekstu.
