Казакстан үчүн hreflang орнотуп жатканда, биринчи инстинкт – KZ деп жазуу. Бул өлкөнүн коду ISO 3166-1боюнча. Тил коду башка стандарттан, ISO 639-1, жана казак тили үчүн ал kk. Армян тили үчүн – hy, грузин тили үчүн – ka, тажик тили үчүн – tg. Бири да өлкөнүн кодуна дал келбейт.
Башаламандык коддор окшош болгондуктан келип чыгат: KZ жана kk, AM жана hy, GE жана ka. Бул hreflang, тил которгучту орнотууда жана төлөм системаларына локалды өткөрүп берүүдө негизги тузак.
Которгуч менюсунда тилдерди кантип жазуу керек
орус интерфейсинде «Русский» ордуна «Russian» деп жазылгандай эле, менюда «Казахский» же «Kazakh» деп жазылганы да кызыктай көрүнөт.
Редакциялык сайттар дээрлик дайыма толук түпкү аталыштарды колдонушат. tengrinews.kz — «Қазақша / Русский / English», khovar.tj — «Тоҷикӣ / Русский / English», armenpress.am — «Հայերեն» глобус сөлөкөтүнүн жанында. Кыска коддор (2–3 символ) орун аз болгон жерлерде гана акталат: башкаруу панелдери, мобилдик менюлар, компакттуу SaaS-интерфейстер.
Түпкү аталыштар жана аббревиатуралар
Ар бир тил боюнча өзүнчө
Казакча. Казак тилин билбеген иштеп чыгуучу кодго Қ ордуна К деп терет — жөн гана Қ орус клавиатурасында жок. Которгучта «Қазақша» ордуна «Казакша» пайда болот. Бул катадай көрүнөт, бирок техникалык жактан — башка сап: сайттан издөө бузулат, сорттоо өзгөрөт. «КЗ» аббревиатурасы — ошол эле себептен туура эмес, туурасы «ҚЗ».
«Қазақша» «казакча» дегенди билдирет — сүйлөшүүдөгү, көнүмүш форма. Расмий сайттарда кээде «Қазақ тілі» (казак тили) деп жазылат, бирок менюда «Қазақша» кыскараак. Салыштырыңыз: «Казак» (казак, адам) жана «Қазақ» (казак эли) — экинчи сөздү орус тамгалары менен жазуу мүмкүн эмес.
Кыргызча. Бул жерде расмий сайттарда да бирдиктүү стандарт жок. kabar.kg «Кыр» деп жазат, башка мамлекеттик ресурстар — «Кырг». Эки вариант тең туура. Практикалык кеңеш: бирөөнү тандап, аны бүт интерфейсте карманыңыз. Эгер менюңузда «К» тамгасынан башталган бир нече аббревиатура болсо (казак, кыргыз, орус), «Кырг» бир аз такыраак.
«Кыргызча» да, «Кыргыз тили» да туура: биринчиси оозеки («кыргызча сүйлөө»), экинчиси расмий («кыргыз тили»). Которгуч үчүн «Кыргызча» көнүмүш.
Армян. Бул тизмедеги жалгыз тил, анда жергиликтүү аталышты тандоо аудиториянын кайсы жерде жашаганына жараша болот — анткени армян тили ар кандай орфографиясы бар эки вариантта бар (Wikipedia):
- Հայերեն — Чыгыш армян тили. Армениянын мамлекеттик тили, реформаланган советтик орфография. Ал Арменияда, Орусияда, Грузияда, Иранда сүйлөнөт.
- Հայերէն — Батыш армян тили. 1915-жылдан кийин диаспорада сакталып калган классикалык орфография. Ливан, Франция, АКШ, Аргентина.
Айырмасы бир тамгада: чыгыш армян тилинде «ե», батыш армян тилинде «է». Бирок сөздүк запасы да айырмаланат: «самолёт» чыгыш армян тилинде — «ինքնաթիռ», батыш армян тилинде — «օդանաւ». Армения үчүн сайт — Հայերեն. Армян диаспорасы үчүн — Հայերէն. Экөөнүн тең ISO-коду бирдей — hy, бирок ISO 639-3 бөлүп турат: hye (чыгыш) жана hyw (батыш). «ՀԱՅ» аббревиатурасы армянча «Հայ» (армян) дегенден келип чыккан: «ՀԱ» үчүнчү тамгасыз сөз катары окулбайт.
Тажик тили. Маселе казак тилиндегидей эле, бирок дароо эле көрүнүп турат: Ҷ тилдин аталышында турат. Эгер иштеп чыгуучу «ТҶ» ордуна «ТЧ» деп терсе — ката которгучта болот. Ҷ — бул «Ч» эмес: үн англисче «j» тамгасына жакыныраак, «дж» менен жумшак «ж» ортосундагы нерсе. Тажикстандын ТИМи mfa.tj сайтында «Ҷ» деп жазат. «Тоҷикӣ» деген сөздө дагы Ӣ (узун «и»), ал дагы орус клавиатурасында жок.
Грузин. Иштеп чыгуучулар көбүнчө «ქართული» дегенди «Geo» же «GE» деп кыскартууга аракет кылышат — жөн гана интерфейсте латын эмес шрифт менен кантип иштөөнү билишпегендиктен же көрсөтүүдөгү көйгөйлөрдөн корккондуктан. Грузиндер муну дароо түшүнүшөт: «GE» чет элдик техникалык код катары кабыл алынат, эне тилдеги сөз катары эмес. Мхедрули — 1600 жылдык жазуу, обочолонгон түрдө түзүлгөн. «გამარჯობა» — бул «саламатсызбы». Компакттуу интерфейстерде да «ქართული» дегенди толугу менен жазыңыз.
Локалдар жана валюталар
Локаль — бул «тил + өлкө» байланышы. Ал сандардын жана даталардын форматын, валюта символун, сорттоо тартибин аныктайт. Локалда өлкөнүн эмес, тилдин коду колдонулат: kk_KZ, kz_KZ эмес. hy_AM, am_AM эмес. ISO 639-1 менен бирдей логика.
Валюта коддору — өзүнчө стандарт, ISO 4217. Бир нече нюанстар:
Өзбек so'm — расмий кыскартуу, апостроф менен кичине тамгалар менен жазылат. Интерфейстерде көбүнчө жөн гана «сум» же «UZS» колдонулат — эки вариант тең кабыл алынган.
Казакстан менен Орусия +7 телефон кодун бөлүшөт. Эгер каттоо формасында өлкө телефон номери боюнча автоматтык түрдө аныкталса — бул бузулат: +7 701 Москва да, Алматы да болушу мүмкүн. Өлкөнү өзүнчө талаа менен сураңыз же IP аркылуу аныктаңыз.
Грузияда эки расмий тил бар: грузин жана абхаз. Коммерциялык сайт үчүн бул дээрлик эч качан кереги жок, бирок эгер долбоор мамлекеттик же Абхазияга багытталган болсо — эске алыңыз.
Шрифттер жана жазуулар
Эгер Google Font'ту кириллица диапазону менен гана туташтырсаңыз, армян жана грузин тексттери керектүү шрифтте көрсөтүлбөйт — браузер системалык камдык көчүрмөнү колдонот жана барак ыраатсыз көрүнөт. Армян Unicode-блогу — U+0530–U+058F, грузин — U+10A0–U+10FF. Noto Sans экөөнү тең камтыйт — аны бул тилдер үчүн кошумча шрифт катары туташтырыңыз.
КМШ өлкөлөрүнүн көпчүлүк тилдери кириллицаны колдонушат, бирок СССР кулагандан кийин үч өлкө латын алфавитине өткөн: Өзбекстан 1993-жылы, Азербайжан 1991-жылы. Ал жерде эски документтерде жана улуу муундарда кириллица дагы эле кездешет, бирок жаңы контент — латын алфавити. Казакстан 2017-жылы өтүүнү баштаган, жаңы орфография 2023-жылы бекитилген. Бул жүз жыл ичиндеги алфавиттин үчүнчү өзгөрүшү: араб жазуусу, андан кийин Яналиф (1930-жылдардагы советтик латын алфавити), андан кийин кириллица, азыр кайрадан латын алфавити.
Өзбек тилине өзүнчө шрифттин кереги жок — ал жерде стандарттуу латын алфавити плюс O'zbekcha'дагы апостроф. Көпчүлүк латын шрифтери муну камтыйт. ʻ (U+02BB) символун гана текшериңиз — ал бардык жерде жок.
Армян жана грузин тилдери — кириллица, латын алфавити же бири-бири менен байланышпаган толугу менен өз алдынча системалар. Армян алфавити 405-жылы монах Месроп Маштоц тарабынан Библияны которуу үчүн түзүлгөн. Грузин мхедрули да болжол менен ошол эле куракта.
Орус клавиатурасында жок тамгалар
Казак жана тажик тилдеринде экранда орус тамгалары менен оңой эле чаташтырыла турган тамгалар бар, бирок техникалык жактан алар ар кандай Unicode-символдор. Сайттан издөө сөздү таппайт, сорттоо бузулат, ал эми тил ээлери дароо байкашат.
Казак тилинде 42 тамга бар — 33 стандарттуу плюс 9 атайын: Ә, Ғ, Қ, Ң, Ө, Ұ, Ү, Һ, І. Тажик тилинде өзүнүн 6 кошумча тамгасы бар: Ғ, Ҳ, Қ, Ҷ, Ӣ, Ӯ.
Қ жана Google'дан келген кылдат караганда айырмаланат (Қ тамгасынын астында куйругу бар) — бирок орус клавиатурасында Қ жөн эле жок. Адам «Қазақша» ордуна «Казакша» деп терет, анткени ал көңүл бурбагандыктан эмес, керектүү баскыч жеткиликтүү эмес. Же болбосо, мындай алмаштырууга жол берилген булактан көчүрүп алып, байкабай калат.
Тилдердин аталыштарындагы жана аббревиатуралардагы тамгалар практикалык мааниге ээ: Қ «Қазақша» жана «ҚЗ» сөздөрүндө, Ҷ жана Ӣ «Тоҷикӣ» жана «ТҶ» сөздөрүндө, І казак сөздөрүндө. Эгерде сиз тышкы булактан текстти киргизсеңиз — текшериңиз. Күмөндүү символды unicode.org сайтына киргизиңиз, ошондо ал кандай чекит экенин дароо көрөсүз.
Көп берилүүчү суроолор
Казакстан үчүн демейки тил катары кайсы тилди коюу керек — орусчабы же казакчабы?
Көпчүлүк коммерциялык сайттар үчүн орус тили демейки катары коопсузураак, айрыкча аудитория 35 жаштан жогору болсо же бул B2B болсо. 2021-жылдагы эл каттоо боюнча калктын болжол менен 80%ы казак тилин, болжол менен 70%ы орус тилин билет, жана алар бири-бирине абдан окшош. Жаштар же мамлекеттик аудитория үчүн — казак тили.
Батыш армян тили үчүн сайттын өзүнчө версиясы керекпи?
Эгерде сиз Ливандагы, Франциядагы же АКШдагы армян диаспорасы менен максаттуу иштесеңиз гана. Арменияга багытталган долбоор үчүн чыгыш армян тили (hye) жетиштүү. Жалпы hy коду техникалык жактан эки вариант үчүн тең кабыл алынган.
Армян тили үчүн hreflang кантип коюлат?
hreflang="hy" — чыгыш армян тили үчүн (Армения). Батыш армян диаспорасы үчүн теориялык жактан hyw, бирок бул стандарттуу эмес тег, жана бардык краулерлер аны иштетпейт. Арменияга багытталган hy боюнча бир версияны колдонуу оңой.
Казак тили менен азыр эмне кылуу керек — кириллицабы же латынчабы?
Кириллица. Расмий документ жүгүртүү жана көпчүлүк сайттар дагы эле кириллицада. Жаңы латын орфографиясы 2023-жылы бекитилген, бирок азырынча массалык өтүү жок. Кырдаалды көзөмөлдөйт gov.kz.
Эмне үчүн өлкөнүн коду менен тилдин коду дал келбейт — мисалы, Армения AM, ал эми армян тили hy?
Бул эки көз карандысыз стандарт. ISO 3166-1 саясий бирдиктерди (өлкөлөрдү), ISO 639-1 лингвистикалык бирдиктерди (тилдерди) коддойт. Армян тили «Hayastan» — Армениянын өзүн-өзү аталышынын латынчасынан hy кодун алган. Грузин тили — «Kartuli» дегенден ka. Кээ бир жерлерде коддор дал келет (ru/RU, uz/UZ), кээ бир жерлерде дал келбейт (hy/AM, ka/GE, kk/KZ). Дал келүү — кокустук, эреже эмес.