Когда настраиваешь hreflang для Казахстана, первый инстинкт — вписать KZ. Это код страны по ISO 3166-1. Код языка — из другого стандарта, ISO 639-1, и для казахского он kk. Для армянского — hy, для грузинского — ka, для таджикского — tg. Ни один не совпадает с кодом страны.
Путаница возникает потому что коды похожи: KZ и kk, AM и hy, GE и ka. Это главная ловушка при настройке hreflang, переключателя языков и передаче локали в платёжные системы.
Как писать языки в меню переключателя
«Казахский» или «Kazakh» в меню выглядит так же странно, как если бы в английском интерфейсе написали «Russian» вместо «Русский».
Редакционные сайты почти всегда используют полные нативные названия. tengrinews.kz — «Қазақша / Русский / English», khovar.tj — «Тоҷикӣ / Русский / English», armenpress.am — «Հայերեն» рядом с иконкой глобуса. Короткие коды (2–3 символа) оправданы только там где мало места: панели управления, мобильные меню, компактные SaaS-интерфейсы.
Нативные названия и аббревиатуры
По каждому языку отдельно
Казахский. Разработчик без казахского набивает в коде К вместо Қ — просто потому что Қ на русской клавиатуре нет. В переключателе появляется «Казакша» вместо «Қазақша». Выглядит как опечатка, а технически — другая строка: поиск по сайту сломается, сортировка поедет. Аббревиатура «КЗ» — по той же причине неправильная, правильно «ҚЗ».
«Қазақша» означает «по-казахски» — разговорная, привычная форма. На официальных сайтах иногда пишут «Қазақ тілі» (казахский язык), но в меню «Қазақша» короче. Сравните: «Казак» (казак, человек) и «Қазақ» (казахский народ) — второе слово просто невозможно написать русскими буквами.
Кыргызский. Здесь нет единого стандарта даже на официальных сайтах. kabar.kg пишет «Кыр», другие правительственные ресурсы — «Кырг». Оба варианта правильны. Практический совет: выбери один и держись его во всём интерфейсе. «Кырг» чуть однозначнее, если в вашем меню несколько аббревиатур на «К» (казахский, кыргызский, русский).
И «Кыргызча», и «Кыргыз тили» — оба правильны: первый разговорнее («говорить по-кыргызски»), второй официальнее («кыргызский язык»). Для переключателя «Кыргызча» привычнее.
Армянский. Это единственный язык в списке где выбор нативного названия зависит от того где живёт аудитория — потому что армянский существует в двух вариантах с разной орфографией (Wikipedia):
- Հայերեն — восточноармянский. Государственный язык Армении, реформированная советская орфография. На нём говорят в Армении, России, Грузии, Иране.
- Հայերէն — западноармянский. Классическая орфография, сохранившаяся в диаспоре после 1915 года. Ливан, Франция, США, Аргентина.
Разница — в одной букве: «ե» у восточного и «է» у западного. Но словарный запас тоже различается: «самолёт» по-восточному — «ինքնաթիռ», по-западному — «օդանաւ». Сайт для Армении — Հայերեն. Для армянской диаспоры — Հայերէն. ISO-код у обоих один — hy, но ISO 639-3 разделяет: hye (восточный) и hyw (западный). Аббревиатура «ՀԱՅ» — от армянского «Հայ» (армянин): «ՀԱ» без третьей буквы как слово не читается.
Таджикский. Проблема та же что у казахского, но видна сразу: Ҷ стоит в самом названии языка. Если разработчик набьёт «ТЧ» вместо «ТҶ» — ошибка прямо в переключателе. Ҷ — это не «Ч»: звук ближе к английскому «j» в jump, что-то среднее между «дж» и мягким «ж». МИД Таджикистана на mfa.tj пишет именно «Ҷ». В слове «Тоҷикӣ» есть ещё Ӣ (долгое «и»), которой тоже нет на русской раскладке.
Грузинский. Разработчики часто пытаются сократить «ქართული» до «Geo» или «GE» — просто потому что не знают как работать с нелатинским шрифтом в интерфейсе или боятся проблем с рендерингом. Грузины мгновенно это считывают: «GE» воспринимается как иностранный технический код, не как родное слово. Мхедрули — письменность 1600 лет, созданная изолированно. «გამარჯობა» — это «здравствуйте». Пишите «ქართული» полностью, даже в компактных интерфейсах.
Локали и валюты
Локаль — это связка «язык + страна». Она определяет формат чисел и дат, символ валюты, порядок сортировки. В локали используется код языка, а не страны: kk_KZ, не kz_KZ. hy_AM, не am_AM. Та же логика что с ISO 639-1.
Коды валют — отдельный стандарт, ISO 4217. Несколько нюансов:
Узбекский so'm — официальное сокращение, пишется строчными буквами с апострофом. В интерфейсах часто используют просто «сум» или «UZS» — оба варианта приняты.
Казахстан и Россия делят телефонный код +7. Если в форме регистрации страну определяют автоматически по телефонному номеру — это сломается: +7 701 может быть и Москва, и Алматы. Запрашивайте страну отдельным полем или определяйте по IP.
В Грузии два официальных языка: грузинский и абхазский. Для коммерческого сайта это почти никогда не нужно, но если проект государственный или ориентирован на Абхазию — учитывайте.
Шрифты и письменности
Если подключить Google Font только с кириллическим диапазоном, армянский и грузинский текст не отобразится в нужном шрифте — браузер подставит системный fallback, и страница будет выглядеть непоследовательно. Армянский Unicode-блок — U+0530–U+058F, грузинский — U+10A0–U+10FF. Noto Sans от Google покрывает оба — подключите его как запасной шрифт для этих языков.
Большинство языков СНГ используют кириллицу, но три страны перешли на латиницу после распада СССР: Узбекистан в 1993 году, Азербайджан в 1991-м. Кириллица там ещё встречается в старых документах и у старшего поколения, но новый контент — латиница. Казахстан начал переход в 2017 году, новая орфография утверждена в 2023-м. Это уже третья смена алфавита за сто лет: арабская вязь, потом Яналиф (советская латиница в 1930-х), потом кириллица, теперь снова латиница.
Узбекскому не нужен отдельный шрифт — там стандартная латиница плюс апостроф в O'zbekcha. Большинство латинских шрифтов это покрывают. Проверьте только символ ʻ (U+02BB) — он есть не везде.
Армянский и грузинский — полностью самостоятельные системы, не связанные ни с кириллицей, ни с латиницей, ни друг с другом. Армянский алфавит создан в 405 году монахом Месропом Маштоцем для перевода Библии. Грузинское мхедрули примерно того же возраста.
Буквы, которых нет на русской клавиатуре
Казахский и таджикский содержат буквы которые на экране легко перепутать с русскими, но технически это разные Unicode-символы. Поиск по сайту не найдёт слово, сортировка поедет, а носители языка заметят сразу.
В казахском 42 буквы — 33 стандартных плюс 9 специальных: Ә, Ғ, Қ, Ң, Ө, Ұ, Ү, Һ, І. В таджикском свои 6 дополнительных: Ғ, Ҳ, Қ, Ҷ, Ӣ, Ӯ.
Қ и К при внимательном взгляде отличаются (у Қ есть хвостик снизу) — но на русской клавиатуре Қ просто нет. Человек набирает «Казакша» вместо «Қазақша» не потому что невнимателен, а потому что нужная клавиша недоступна. Или копирует из источника где уже допущена такая замена и не замечает.
Практически важны буквы в названиях языков и аббревиатурах: Қ в «Қазақша» и «ҚЗ», Ҷ и Ӣ в «Тоҷикӣ» и «ТҶ», І в казахских словах. Если вставляете текст из внешнего источника — проверяйте. Вставьте подозрительный символ на unicode.org и сразу увидите что это за точка.
Часто задаваемые вопросы
Какой язык ставить по умолчанию для Казахстана — русский или казахский?
Для большинства коммерческих сайтов русский безопаснее как дефолт, особенно если аудитория старше 35 или это B2B. По переписи 2021 года казахским владеют около 80% населения, русским — около 70%, и они сильно пересекаются. Для молодёжной или государственной аудитории — казахский.
Нужна ли отдельная версия сайта для западноармянского?
Только если вы целенаправленно работаете с армянской диаспорой в Ливане, Франции или США. Для проекта, ориентированного на Армению, достаточно восточноармянского (hye). Общий код hy технически принят для обоих вариантов.
Как ставить hreflang для армянского?
hreflang="hy" — для восточноармянского (Армения). Для западноармянской диаспоры теоретически hyw, но это нестандартный тег, и не все краулеры его обрабатывают. Проще одна версия на hy, ориентированная на Армению.
Что делать с казахским сейчас — кириллица или латиница?
Кириллица. Официальный документооборот и большинство сайтов всё ещё на кириллице. Новая латинская орфография утверждена в 2023 году, но массового перехода пока нет. За ситуацией следит gov.kz.
Почему код страны и код языка не совпадают — например, Армения AM, а армянский hy?
Это два независимых стандарта. ISO 3166-1 кодирует политические единицы (страны), ISO 639-1 — лингвистические (языки). Армянский получил код hy от латинизированного «Hayastan» — самоназвания Армении. Грузинский — ka от «Kartuli». Где-то коды совпадают (ru/RU, uz/UZ), где-то нет (hy/AM, ka/GE, kk/KZ). Совпадение — случайность, не правило.