Вақте ки шумо hreflang-ро барои Қазоқистон танзим мекунед, инстинкти аввал навиштани KZ аст. Ин рамзи кишвар аз рӯи ISO 3166-1. Рамзи забон аз стандарти дигар аст, ISO 639-1, ва барои қазоқӣ он kk аст. Барои арманӣ — hy, барои гурҷӣ — ka, барои тоҷикӣ — tg. Ҳеҷ яке аз онҳо ба рамзи кишвар мувофиқат намекунад.
Иштибоҳ ба миён меояд, зеро рамзҳо монанданд: KZ ва kk, AM ва hy, GE ва ka. Ин домгоҳи асосӣ ҳангоми танзими hreflang, гузариши забонҳо ва интиқоли маҳаллӣ ба системаҳои пардохт мебошад.
Чӣ тавр забонҳоро дар менюи гузариш нависед
«Қазоқӣ» ё «Kazakh» дар меню ҳамон қадар аҷиб менамояд, ки агар дар интерфейси англисӣ ба ҷои «Русский» «Russian» навишта мешуд.
Сайтҳои таҳрирӣ қариб ҳамеша номҳои пурраи аслиро истифода мебаранд. tengrinews.kz — «Қазақша / Русский / English», khovar.tj — «Тоҷикӣ / Русский / English», armenpress.am — «Հայերեն» дар паҳлӯи нишонаи глобус. Кодҳои кӯтоҳ (2–3 аломат) танҳо дар ҷойҳое, ки фазо кам аст, асосноканд: панелҳои идоракунӣ, менюҳои мобилӣ, интерфейсҳои паймонаи SaaS.
Номҳо ва ихтисороти аслӣ
Барои ҳар як забон алоҳида
Қазоқӣ. Таҳиягар бидуни забони қазоқӣ дар код К-ро ба ҷои Қ менависад — танҳо аз он сабаб, ки Қ дар клавиатураи русӣ нест. Дар гузариш «Казакша» ба ҷои «Қазақша» пайдо мешавад. Ин ба хатои чопӣ монанд аст, аммо аз ҷиҳати техникӣ — сатри дигар: ҷустуҷӯи сайт вайрон мешавад, тартиб тағйир меёбад. Ихтисораи «КЗ» — бо ҳамин сабаб нодуруст аст, дурусташ «ҚЗ».
«Қазақша» маънои «бо забони қазоқӣ» — шакли гуфтугӯӣ ва маъмулӣ. Дар сайтҳои расмӣ баъзан «Қазақ тілі» (забони қазоқӣ) менависанд, аммо дар меню «Қазақша» кӯтоҳтар аст. Муқоиса кунед: «Казак» (қазоқ, одам) ва «Қазақ» (халқи қазоқ) — калимаи дуюмро бо ҳарфҳои русӣ навиштан ғайриимкон аст.
Қирғизӣ. Дар ин ҷо ҳатто дар сайтҳои расмӣ стандарти ягона вуҷуд надорад. kabar.kg «Кыр» менависад, дигар захираҳои давлатӣ — «Кырг». Ҳарду вариант дурустанд. Маслиҳати амалӣ: якеро интихоб кунед ва дар тамоми интерфейс ба он риоя кунед. «Кырг» каме равшантар аст, агар дар менюи шумо якчанд ихтисораҳо бо «К» (қазоқӣ, қирғизӣ, русӣ) мавҷуд бошанд.
Ҳам «Кыргызча» ва ҳам «Кыргыз тили» — ҳарду дурустанд: якум гуфтугӯӣ («бо қирғизӣ гап задан»), дуюм расмӣ («забони қирғизӣ»). Барои гузариш «Кыргызча» маъмултар аст.
Арманӣ. Ин ягона забон дар рӯйхат аст, ки интихоби номи аслии он аз он вобаста аст, ки шунавандагон дар куҷо зиндагӣ мекунанд — зеро арманӣ дар ду вариант бо имлои гуногун вуҷуд дорад (Википедия):
- Հայերեն — армании шарқӣ. Забони давлатии Арманистон, имлои ислоҳшудаи шӯравӣ. Дар Арманистон, Русия, Гурҷистон, Эрон бо он ҳарф мезананд.
- Հայերէն — армании ғарбӣ. Имлои классикӣ, ки дар диаспора пас аз соли 1915 нигоҳ дошта шудааст. Лубнон, Фаронса, ИМА, Аргентина.
Фарқият дар як ҳарф аст: «ե» дар шарқӣ ва «է» дар ғарбӣ. Аммо луғат низ фарқ мекунад: «самолёт» ба шарқӣ — «ինքնաթիռ», ба ғарбӣ — «օդանաւ». Сайт барои Арманистон — Հայերեն. Барои диаспораи арманӣ — Հայերէն. Ҳарду як коди ISO доранд — hy, аммо ISO 639-3 онҳоро ҷудо мекунад: hye (шарқӣ) ва hyw (ғарбӣ). Ихтисораи «ՀԱՅ» — аз армании «Հայ» (арманӣ): «ՀԱ» бе ҳарфи сеюм ҳамчун калима хонда намешавад.
Тоҷикӣ. Мушкил ҳамон аст, ки дар забони қазоқӣ, аммо фавран намоён аст: Ҷ дар худи номи забон ҷойгир аст. Агар таҳиягар ба ҷои «ТҶ» «ТЧ»-ро нависад, хатогӣ дар худи гузариш аст. Ҷ — ин «Ч» нест: садо ба «j»-и англисӣ дар jump наздиктар аст, чизе байни «дж» ва «ж»-и нарм. Вазорати корҳои хориҷии Тоҷикистон дар mfa.tj маҳз «Ҷ»-ро менависад. Дар калимаи «Тоҷикӣ» боз Ӣ («и»-и дароз) мавҷуд аст, ки он ҳам дар клавиатураи русӣ нест.
Гурҷӣ. Таҳиягарон аксар вақт кӯшиш мекунанд, ки «ქართული»-ро ба «Geo» ё «GE» кӯтоҳ кунанд — танҳо аз он сабаб, ки онҳо намедонанд, ки чӣ тавр бо шрифти ғайрилотинӣ дар интерфейс кор кунанд ё аз мушкилоти рендеринг метарсанд. Гурҷиҳо инро фавран мефаҳманд: «GE» ҳамчун коди техникии хориҷӣ қабул карда мешавад, на ҳамчун калимаи модарӣ. Мхедрули — хатти 1600-сола, ки алоҳида сохта шудааст. «გამარჯობა» — ин «салом» аст. «ქართული»-ро пурра нависед, ҳатто дар интерфейсҳои компактӣ.
Локалиҳо ва асъорҳо
Локалӣ — ин пайвастшавии «забон + кишвар» мебошад. Он формати рақамҳо ва санаҳо, рамзи асъор, тартиби ҷудокуниро муайян мекунад. Дар локалӣ коди забон истифода мешавад, на коди кишвар: kk_KZ, на kz_KZ. hy_AM, на am_AM. Ҳамон мантиқе, ки бо ISO 639-1.
Кодҳои асъор — стандарти алоҳида, ISO 4217. Якчанд нозукиҳо:
Сӯми ӯзбекӣ — ихтисораи расмӣ, бо ҳарфҳои хурд бо апостроф навишта мешавад. Дар интерфейсҳо аксар вақт танҳо «сӯм» ё «UZS» истифода мешавад — ҳарду вариант қабул шудаанд.
Қазоқистон ва Русия коди телефонии +7-ро мубодила мекунанд. Агар дар шакли бақайдгирӣ кишвар ба таври худкор аз рӯи рақами телефон муайян карда шавад — ин хато мекунад: +7 701 метавонад ҳам Москва ва ҳам Алмаато бошад. Кишварро бо майдони алоҳида дархост кунед ё аз рӯи IP муайян кунед.
Дар Гурҷистон ду забони расмӣ мавҷуд аст: гурҷӣ ва абхазӣ. Барои вебсайти тиҷоратӣ ин қариб ҳеҷ гоҳ лозим нест, аммо агар лоиҳа давлатӣ бошад ё ба Абхазия нигаронида шуда бошад — ба назар гиред.
Шрифтҳо ва хатҳо
Агар Google Font танҳо бо диапазони кириллӣ пайваст карда шавад, матни арманӣ ва гурҷӣ бо шрифти дилхоҳ намоиш дода намешавад — браузер баргардонидани системаро иваз мекунад ва саҳифа номунтазам ба назар мерасад. Блоки Юникоди арманӣ — U+0530–U+058F, гурҷӣ — U+10A0–U+10FF. Noto Sans аз Google ҳардуро фаро мегирад — онро ҳамчун шрифти эҳтиётӣ барои ин забонҳо пайваст кунед.
Аксарияти забонҳои ИДМ алифбои кириллиро истифода мебаранд, аммо се кишвар пас аз пошхӯрии СССР ба алифбои лотинӣ гузаштанд: Ӯзбекистон дар соли 1993, Озарбойҷон дар соли 1991. Кириллӣ дар он ҷо то ҳол дар ҳуҷҷатҳои кӯҳна ва дар байни насли калонсол дучор меояд, аммо мундариҷаи нав — лотинӣ. Қазоқистон дар соли 2017 ба гузариш оғоз кард, имлои нав дар соли 2023 тасдиқ карда шуд. Ин аллакай сеюмин тағйири алифбо дар сад сол аст: хатти арабӣ, баъд Яналиф (лотини советии солҳои 1930), баъд кириллӣ, ҳоло боз лотинӣ.
Ба ӯзбекӣ шрифти алоҳида лозим нест — дар он ҷо лотинии стандартӣ ва апостроф дар O'zbekcha мавҷуд аст. Аксарияти шрифтҳои лотинӣ инро фаро мегиранд. Танҳо аломати ʻ (U+02BB)-ро тафтиш кунед — он дар ҳама ҷо мавҷуд нест.
Забонҳои арманӣ ва гурҷӣ системаҳои комилан мустақил мебошанд, ки на бо кириллӣ, на бо лотинӣ ва на бо ҳамдигар алоқаманд нестанд. Алифбои арманӣ соли 405 аз ҷониби роҳиб Месроп Маштотс барои тарҷумаи Библия сохта шудааст. Мхедрулии гурҷӣ тақрибан ҳамон қадар қадимӣ аст.
Ҳарфҳое, ки дар клавиатураи русӣ нестанд
Қазоқӣ ва тоҷикӣ ҳарфҳоеро дар бар мегиранд, ки дар экран бо ҳарфҳои русӣ ба осонӣ омехта мешаванд, аммо аз ҷиҳати техникӣ онҳо аломатҳои гуногуни Unicode мебошанд. Ҷустуҷӯи сайт калимаро намеёбад, ҷудокунӣ хато мекунад ва забонзабонҳо фавран пай мебаранд.
Дар қазоқӣ 42 ҳарф мавҷуд аст — 33 ҳарфи стандартӣ ва 9 ҳарфи махсус: Ә, Ғ, Қ, Ң, Ө, Ұ, Ү, Һ, І. Дар тоҷикӣ 6 ҳарфи иловагии худ мавҷуд аст: Ғ, Ҳ, Қ, Ҷ, Ӣ, Ӯ.
Қ ва К бо назардошти бодиққат фарқ мекунанд (Қ думчаи поёнӣ дорад) — аммо дар клавиатураи русӣ Қ танҳо нест. Одам «Казакша»-ро ба ҷои «Қазақша» менависад, на аз он сабаб, ки беэҳтиёт аст, балки аз он сабаб, ки тугмаи лозима дастрас нест. Ё аз манбаъе нусхабардорӣ мекунад, ки дар он чунин ивазкунӣ аллакай анҷом дода шудааст ва пай намебарад.
Ҳарфҳо дар номҳои забонҳо ва ихтисорот амалан муҳиманд: Қ дар «Қазақша» ва «ҚЗ», Ҷ ва Ӣ дар «Тоҷикӣ» ва «ТҶ», І дар калимаҳои қазоқӣ. Агар шумо матнро аз манбаи беруна ворид кунед — тафтиш кунед. Аломати шубҳанокро ба unicode.org ворид кунед ва шумо фавран хоҳед дид, ки ин чӣ гуна нуқта аст.
Саволҳои зуд-зуд додашаванда
Кадом забонро барои Қазоқистон ба таври пешфарз гузоштан лозим аст — русӣ ё қазоқӣ?
Барои аксари сайтҳои тиҷоратӣ, русӣ ҳамчун пешфарз бехатартар аст, хусусан агар шунавандагон аз 35-сола боло бошанд ё ин B2B бошад. Мувофиқи барӯйхатгирии соли 2021, тақрибан 80% аҳолӣ қазоқӣ ва тақрибан 70% русӣ медонанд ва онҳо ба таври назаррас ба ҳам мепайванданд. Барои шунавандагони ҷавон ё давлатӣ — қазоқӣ.
Оё барои армании ғарбӣ версияи алоҳидаи сайт лозим аст?
Танҳо агар шумо қасдан бо диаспораи арманӣ дар Лубнон, Фаронса ё ИМА кор кунед. Барои лоиҳае, ки ба Арманистон нигаронида шудааст, армании шарқӣ (hye) кофӣ аст. Коди умумии hy техникӣ барои ҳарду вариант қабул шудааст.
Чӣ тавр hreflang-ро барои арманӣ гузоштан лозим аст?
hreflang="hy" — барои армании шарқӣ (Арманистон). Барои диаспораи армании ғарбӣ, назариявӣ hyw, аммо ин теги ғайристандартӣ аст ва на ҳама краулерҳо онро коркард мекунанд. Як версияи оддӣ дар hy, ки ба Арманистон нигаронида шудааст, осонтар аст.
Бо қазоқӣ ҳоло чӣ бояд кард — кириллӣ ё лотинӣ?
Кириллик. Ҳуҷҷатгузории расмӣ ва аксари вебсайтҳо то ҳол бо кириллик мебошанд. Имлои нави лотинӣ дар соли 2023 тасдиқ карда шуд, аммо то ҳол гузариши оммавӣ вуҷуд надорад. Вазъиятро назорат мекунад gov.kz.
Чаро рамзи кишвар ва рамзи забон мувофиқат намекунанд — масалан, Арманистон AM, аммо арманӣ hy?
Инҳо ду стандарти мустақил мебошанд. ISO 3166-1 воҳидҳои сиёсӣ (кишварҳо)-ро рамзгузорӣ мекунад, ISO 639-1 — лингвистӣ (забонҳо)-ро. Арманӣ рамзи hy-ро аз «Hayastan»-и лотинишуда — номи худшиносии Арманистон гирифтааст. Гурҷӣ — ka аз «Kartuli». Дар баъзе ҷойҳо рамзҳо мувофиқат мекунанд (ru/RU, uz/UZ), дар баъзе ҷойҳо не (hy/AM, ka/GE, kk/KZ). Мувофиқат — тасодуф аст, на қоида.