ԱՊՀ լեզուներ, կոդեր և արժույթներ. տեղեկատու կայքերի տեղայնացման համար
Այս հոդվածում. ինչպես ճիշտ ստորագրել լեզուները անջատիչում, ISO կոդերը, հապավումները, բնիկ անունների նրբությունները և հատուկ նշանները, որոնք հեշտ է շփոթել ռուսերեն տառերի հետ։
Երբ դուք կարգավորում եք hreflang-ը Ղազախստանի համար, առաջին բնազդը KZ-ը մուտքագրելն է։ Սա երկրի կոդն է ըստ ISO 3166-1։ Լեզվի կոդը մեկ այլ ստանդարտից է՝ ISO 639-1, և ղազախերենի համար այն kk է։ Հայերենի համար՝ hy, վրացերենի համար՝ ka, տաջիկերենի համար՝ tg։ Ոչ մեկը չի համընկնում երկրի կոդի հետ։
Շփոթություն է առաջանում, քանի որ կոդերը նման են՝ KZ և kk, AM և hy, GE և ka։ Սա հիմնական թակարդն է hreflang-ը, լեզվի անջատիչը կարգավորելիս և տեղայնացումը վճարային համակարգերին փոխանցելիս։
Ինչպես գրել լեզուները անջատիչի մենյուում
«Ղազախերեն» կամ «Kazakh» մենյուում նույնքան տարօրինակ է թվում, որքան եթե անգլերեն ինտերֆեյսում «Ռուսերեն»-ի փոխարեն գրվեր «Russian»։
Խմբագրական կայքերը գրեթե միշտ օգտագործում են ամբողջական բնօրինակ անվանումներ։ tengrinews.kz — «Қазақша / Русский / English», khovar.tj — «Тоҷикӣ / Русский / English», armenpress.am — «Հայերեն» գլոբուսի պատկերակի կողքին։ Կարճ կոդերը (2–3 նիշ) արդարացված են միայն այնտեղ, որտեղ քիչ տեղ կա՝ կառավարման վահանակներ, բջջային մենյուներ, կոմպակտ SaaS-ինտերֆեյսներ։
Բնօրինակ անվանումներ և հապավումներ
Լեզու
Մենյուում
Կարճ
ISO 639-1
Երկրի կոդ
Ռուսերեն
Ռուսերեն
Ռուս
ru
RU
Ղազախերեն
Қазақша
Қаз
kk
KZ
Ղրղզերեն
Кыргызча
Կիր / Կիրգ
ky
KG
Հայերեն
Հայերեն
ՀԱՅ
hy
AM
Տաջիկերեն
Тоҷикӣ
ՏՋ
tg
TJ
Ուզբեկերեն
O'zbekcha
Ուզբ
uz
UZ
Ադրբեջաներեն
Azərbaycan dili
Ազե
az
AZ
Վրացերեն
ქართული
Գեո
ka
GE
Յուրաքանչյուր լեզվի համար առանձին
Ղազախերեն։ Ղազախերեն չիմացող ծրագրավորողը կոդում K-ի փոխարեն մուտքագրում է Կ, պարզապես այն պատճառով, որ Қ ռուսական ստեղնաշարի վրա չկա։ Անջատիչում «Қазақша»-ի փոխարեն հայտնվում է «Казакша»։ Դա տպագրական սխալի է նման, իսկ տեխնիկապես՝ այլ տող է. կայքի որոնումը կխախտվի, տեսակավորումը կշեղվի։ «ԿԶ» հապավումը նույն պատճառով սխալ է, ճիշտը «ՂԶ» է։
«Қазақша» նշանակում է «ղազախերեն»՝ խոսակցական, սովորական ձև։ Պաշտոնական կայքերում երբեմն գրում են «Қазақ тілі» (ղազախերեն լեզու), բայց մենյուում «Қазақша»-ն ավելի կարճ է։ Համեմատեք՝ «Казак» (կազակ, մարդ) և «Қазақ» (ղազախ ժողովուրդ)՝ երկրորդ բառը պարզապես անհնար է գրել ռուսերեն տառերով։
Ղրղզերեն։ Այստեղ միասնական ստանդարտ չկա նույնիսկ պաշտոնական կայքերում։ kabar.kg գրում է «Кыр», մյուս կառավարական ռեսուրսները՝ «Кырг»։ Երկու տարբերակն էլ ճիշտ են։ Գործնական խորհուրդ. ընտրեք մեկը և պահպանեք այն ամբողջ ինտերֆեյսում։ «Кырг»-ն մի փոքր ավելի միանշանակ է, եթե ձեր մենյուում կան մի քանի հապավումներ «Կ» տառով (ղազախերեն, ղրղզերեն, ռուսերեն)։
Ե՛վ «Кыргызча», և՛ «Кыргыз тили»՝ երկուսն էլ ճիշտ են. առաջինն ավելի խոսակցական է («խոսել ղրղզերեն»), երկրորդն ավելի պաշտոնական է («ղրղզերեն լեզու»)։ Անջատիչի համար «Кыргызча»-ն ավելի սովորական է։
Հայերեն։ Սա միակ լեզուն է ցուցակում, որտեղ բնիկ անվան ընտրությունը կախված է նրանից, թե որտեղ է ապրում լսարանը, քանի որ հայերենը գոյություն ունի երկու տարբերակով՝ տարբեր ուղղագրությամբ (Wikipedia):
Հայերեն — արևելահայերեն։ Հայաստանի պետական լեզուն, բարեփոխված խորհրդային ուղղագրություն։ Խոսվում է Հայաստանում, Ռուսաստանում, Վրաստանում, Իրանում։
Հայերեն — արևմտահայերեն։ Դասական ուղղագրություն, որը պահպանվել է սփյուռքում 1915 թվականից հետո։ Լիբանան, Ֆրանսիա, ԱՄՆ, Արգենտինա։
Տարբերությունը մեկ տառի մեջ է՝ «ե» արևելահայերենում և «է» արևմտահայերենում։ Սակայն բառապաշարը նույնպես տարբերվում է. «ինքնաթիռ» արևելահայերենում և «օդանաւ» արևմտահայերենում։ Կայքը Հայաստանի համար՝ Հայերեն։ Հայկական սփյուռքի համար՝ Հայերեն։ Երկուսի ISO կոդը նույնն է՝ hy, բայց ISO 639-3-ը բաժանում է՝ hye (արևելյան) և hyw (արևմտյան)։ «ՀԱՅ» հապավումը հայերեն «Հայ» բառից է (հայ)։ «ՀԱ»-ն առանց երրորդ տառի որպես բառ չի կարդացվում։
Տաջիկերեն։ Խնդիրը նույնն է, ինչ ղազախերենի դեպքում, բայց անմիջապես տեսանելի է. Ҷ գտնվում է լեզվի անվանման մեջ։ Եթե մշակողը «ТЧ» մուտքագրի «ТҶ»-ի փոխարեն, սխալը կլինի անմիջապես անջատիչում։ Ҷ — դա «Ч» չէ. ձայնը ավելի մոտ է անգլերեն «j»-ին jump բառում, ինչ-որ միջին «дж»-ի և փափուկ «ж»-ի միջև։ Տաջիկստանի ԱԳՆ-ն mfa.tj կայքում գրում է հենց «Ҷ»։ «Тоҷикӣ» բառում կա նաև Ӣ (երկար «ի»), որը նույնպես չկա ռուսական դասավորության մեջ։
Վրացերեն. Մշակողները հաճախ փորձում են «ქართული»-ն կրճատել մինչև «Geo» կամ «GE»՝ պարզապես այն պատճառով, որ չգիտեն, թե ինչպես աշխատել ոչ լատինական տառատեսակի հետ ինտերֆեյսում կամ վախենում են ռենդերինգի խնդիրներից։ Վրացիներն անմիջապես հասկանում են դա. «GE»-ն ընկալվում է որպես օտար տեխնիկական կոդ, ոչ թե որպես մայրենի բառ։ Մխեդրուլին 1600 տարվա գրություն է, որը ստեղծվել է մեկուսացված։ «გამარჯობა»-ն նշանակում է «բարև»։ Գրեք «ქართული» ամբողջությամբ, նույնիսկ կոմպակտ ինտերֆեյսներում։
Տեղայնացումը «լեզու + երկիր» կապ է։ Այն որոշում է թվերի և ամսաթվերի ձևաչափը, արժույթի խորհրդանիշը, տեսակավորման կարգը։ Տեղայնացման մեջ օգտագործվում է լեզվի կոդը, ոչ թե երկրի կոդը՝ kk_KZ, ոչ թե kz_KZ։ hy_AM, ոչ թե am_AM։ Նույն տրամաբանությունն է, ինչ ISO 639-1-ի դեպքում։
Երկիր
Երկրի կոդ
Տեղայնացում
Արժույթ
Խորհրդանիշ
Արժույթի կոդ
Ռուսաստան
RU
ru_RU
Ռուբլի
₽
RUB
Ղազախստան
KZ
kk_KZ
Տենգե
₸
KZT
Ղրղզստան
KG
ky_KG
Սոմ
ս
KGS
Հայաստան
AM
hy_AM
Դրամ
֏
AMD
Տաջիկստան
TJ
tg_TJ
Սոմոնի
SM
TJS
Ուզբեկստան
UZ
uz_UZ
Ուզբեկական սում
so'm
UZS
Ադրբեջան
AZ
az_AZ
Մանաթ
₼
AZN
Վրաստան
GE
ka_GE
Լարի
₾
GEL
Արժույթի կոդերը առանձին ստանդարտ են՝ ISO 4217։ Մի քանի նրբերանգներ.
Ուզբեկական so'm-ը պաշտոնական հապավում է, գրվում է փոքրատառերով՝ ապաթարցով։ Ինտերֆեյսներում հաճախ օգտագործվում է պարզապես «սում» կամ «UZS»՝ երկու տարբերակներն էլ ընդունված են։
Ղազախստանը և Ռուսաստանը կիսում են +7 հեռախոսային կոդը։ Եթե գրանցման ձևում երկիրը ավտոմատ կերպով որոշվում է հեռախոսահամարով, ապա դա կխախտվի. +7 701-ը կարող է լինել և՛ Մոսկվա, և՛ Ալմաթի։ Հարցրեք երկիրը առանձին դաշտով կամ որոշեք IP-ով։
Վրաստանում կան երկու պաշտոնական լեզուներ՝ վրացերեն և աբխազերեն։ Առևտրային կայքի համար դա գրեթե երբեք անհրաժեշտ չէ, բայց եթե նախագիծը պետական է կամ ուղղված է Աբխազիային, հաշվի առեք դա։
Եթե Google Font-ը միացնեք միայն կիրիլյան տիրույթով, հայերեն և վրացերեն տեքստը չի ցուցադրվի անհրաժեշտ տառատեսակով. բրաուզերը կօգտագործի համակարգային պահեստային տարբերակը, և էջը անհամապատասխան տեսք կունենա։ Հայերեն Unicode-բլոկը՝ U+0530–U+058F, վրացերենը՝ U+10A0–U+10FF։ Noto Sans Google-ից ծածկում է երկուսն էլ. միացրեք այն որպես պահեստային տառատեսակ այս լեզուների համար։
ԱՊՀ երկրների մեծ մասը օգտագործում է կիրիլիցա, բայց երեք երկիր ԽՍՀՄ փլուզումից հետո անցել են լատինիցայի՝ Ուզբեկստանը 1993 թվականին, Ադրբեջանը 1991-ին։ Կիրիլիցան այնտեղ դեռ հանդիպում է հին փաստաթղթերում և ավագ սերնդի մոտ, բայց նոր բովանդակությունը լատինիցա է։ Ղազախստանը սկսել է անցումը 2017 թվականին, նոր ուղղագրությունը հաստատվել է 2023-ին։ Սա արդեն երրորդ այբուբենի փոփոխությունն է հարյուր տարվա ընթացքում՝ արաբական գիր, ապա Յանալիֆ (խորհրդային լատինիցա 1930-ականներին), ապա կիրիլիցա, հիմա նորից լատինիցա։
Ուզբեկերենին առանձին տառատեսակ պետք չէ՝ այնտեղ ստանդարտ լատինիցա է գումարած ապոստրոֆ O'zbekcha-ում։ Լատինական տառատեսակների մեծ մասը ծածկում է սա։ Ստուգեք միայն ʻ (U+02BB) սիմվոլը՝ այն ամենուր չկա։
Հայերենը և վրացերենը լիովին ինքնուրույն համակարգեր են, որոնք կապված չեն ո՛չ կիրիլիցայի, ո՛չ լատինիցայի, ո՛չ էլ միմյանց հետ։ Հայերեն այբուբենը ստեղծվել է 405 թվականին Մեսրոպ Մաշտոց վանականի կողմից՝ Աստվածաշունչը թարգմանելու համար։ Վրացական մխեդրուլին մոտավորապես նույն տարիքի է։
Տառեր, որոնք չկան ռուսական ստեղնաշարի վրա
Ղազախերենը և տաջիկերենը պարունակում են տառեր, որոնք էկրանին հեշտությամբ կարելի է շփոթել ռուսականի հետ, բայց տեխնիկապես դրանք տարբեր Unicode-սիմվոլներ են։ Կայքի որոնումը չի գտնի բառը, տեսակավորումը կխախտվի, իսկ լեզվակիրները անմիջապես կնկատեն։
Ղազախերենում կա 42 տառ՝ 33 ստանդարտ գումարած 9 հատուկ՝ Ә, Ғ, Қ, Ң, Ө, Ұ, Ү, Һ, І։ Տաջիկերենում կան իրենց 6 լրացուցիչ տառերը՝ Ғ, Ҳ, Қ, Ҷ, Ӣ, Ӯ։
Қ և K ուշադիր նայելիս տարբերվում են (Қ-ն ներքևից պոչիկ ունի), բայց ռուսական ստեղնաշարի վրա Қ պարզապես չկա։ Մարդը «Казакша» է մուտքագրում «Қазақша»-ի փոխարեն ոչ թե անուշադիր լինելու պատճառով, այլ այն պատճառով, որ անհրաժեշտ ստեղնը հասանելի չէ։ Կամ պատճենում է աղբյուրից, որտեղ արդեն թույլ է տրվել նման փոխարինում և չի նկատում։
Գործնականում կարևոր են տառերը լեզուների անվանումներում և հապավումներում. Қ «Қазақша» և «ҚЗ»-ում, Ҷ և Ӣ «Тоҷикӣ» և «ТҶ»-ում, І ղազախական բառերում։ Եթե տեքստ եք տեղադրում արտաքին աղբյուրից, ստուգեք։ Տեղադրեք կասկածելի նշանը unicode.org կայքում և անմիջապես կտեսնեք, թե ինչ կետ է դա։
Հաճախ տրվող հարցեր
Ո՞ր լեզուն դնել Ղազախստանի համար լռելյայն՝ ռուսերենը, թե՞ ղազախերենը։
Կոմերցիոն կայքերի մեծ մասի համար ռուսերենն ավելի անվտանգ է որպես լռելյայն, հատկապես եթե լսարանը 35-ից բարձր է կամ դա B2B է։ 2021 թվականի մարդահամարի տվյալներով՝ բնակչության մոտ 80%-ը տիրապետում է ղազախերենին, մոտ 70%-ը՝ ռուսերենին, և դրանք խիստ համընկնում են։ Երիտասարդական կամ պետական լսարանի համար՝ ղազախերենը։
Արդյո՞ք անհրաժեշտ է կայքի առանձին տարբերակ արևմտահայերենի համար։
Միայն եթե դուք նպատակաուղղված աշխատում եք լիբանանյան, ֆրանսիական կամ ամերիկյան հայկական սփյուռքի հետ։ Հայաստանին ուղղված նախագծի համար բավարար է արևելահայերենը (hye)։ Ընդհանուր hy կոդը տեխնիկապես ընդունված է երկու տարբերակների համար։
Ինչպե՞ս տեղադրել hreflang հայերենի համար։
hreflang="hy" — արևելահայերենի համար (Հայաստան)։ Արևմտահայ սփյուռքի համար տեսականորեն hyw, բայց դա ոչ ստանդարտ թեգ է, և ոչ բոլոր քրոուլերներն են այն մշակում։ Ավելի հեշտ է ունենալ մեկ տարբերակ hy-ով, որն ուղղված է Հայաստանին։
Ի՞նչ անել ղազախերենի հետ հիմա՝ կիրիլի՞ցա, թե՞ լատինատառ։
Կիրիլիցա։ Պաշտոնական փաստաթղթաշրջանառությունը և կայքերի մեծ մասը դեռ կիրիլիցայով են։ Նոր լատինատառ ուղղագրությունը հաստատվել է 2023 թվականին, բայց զանգվածային անցում դեռ չկա։ Իրավիճակին հետևում է gov.kz։
Ինչու՞ երկրի կոդը և լեզվի կոդը չեն համընկնում, օրինակ՝ Հայաստանը AM է, իսկ հայերենը՝ hy։
Սրանք երկու անկախ ստանդարտներ են։ ISO 3166-1-ը կոդավորում է քաղաքական միավորները (երկրները), ISO 639-1-ը՝ լեզվական միավորները (լեզուները)։ Հայերենը ստացել է hy կոդը լատինատառ «Hayastan»-ից՝ Հայաստանի ինքնանվանումից։ Վրացերենը՝ ka «Kartuli»-ից։ Որոշ տեղերում կոդերը համընկնում են (ru/RU, uz/UZ), որոշ տեղերում՝ ոչ (hy/AM, ka/GE, kk/KZ)։ Համընկնումը պատահականություն է, ոչ թե կանոն։
Միացնե՞լ ղազախերենը, հայերենը կամ վրացերենը կայքին։
Multify-ը թարգմանում է կայքը անհրաժեշտ լեզուներով և ավտոմատ կերպով կարգավորում է լոկալները, արժույթները և լեզուների անջատիչը՝ առանց կայքի կոդի փոփոխությունների։