Реалізовано систему трансформації DOM-дерева для вилучення та перекладу текстового контенту. Додано логіку групування тексту в смислові блоки для збереження контексту при перекладі.
Що додано
- Парсинг HTML-документа — вилучення всього текстового контенту зі сторінки
- Групування пов'язаного тексту в смислові блоки для більш точного перекладу
- Базовий переклад статичного контенту — автоматичний переклад тексту та мета-тегів
- Збереження контексту — алгоритм враховує зв'язаність елементів при групуванні
Технічні деталі
Трансформер аналізує DOM-дерево сторінки, вилучає текстові вузли та групує їх за смисловою близькістю. Це дозволяє надсилати на переклад не окремі слова, а цілі фрази та абзаци, що суттєво підвищує якість перекладу.
Детальніше про реалізацію: Автоматичний AI-переклад та багатомовність сайту
Результат
Система здатна перекладати статичний контент сайтів на Tilda зі збереженням структури та контексту.
