Երբ դուք կարգավորում եք hreflang-ը Ղազախստանի համար, առաջին բնազդը KZ-ը մուտքագրելն է։ Սա երկրի կոդն է ըստ ISO 3166-1։ Լեզվի կոդը մեկ այլ ստանդարտից է՝ ISO 639-1, և ղազախերենի համար այն kk է։ Հայերենի համար՝ hy, վրացերենի համար՝ ka, տաջիկերենի համար՝ tg։ Ոչ մեկը չի համընկնում երկրի կոդի հետ։
Շփոթություն է առաջանում, քանի որ կոդերը նման են՝ KZ և kk, AM և hy, GE և ka։ Սա հիմնական թակարդն է hreflang-ը, լեզվի անջատիչը կարգավորելիս և տեղայնացումը վճարային համակարգերին փոխանցելիս։
Ինչպես գրել լեզուները անջատիչի մենյուում
«Ղազախերեն» կամ «Kazakh» մենյուում նույնքան տարօրինակ է թվում, որքան եթե անգլերեն ինտերֆեյսում «Ռուսերեն»-ի փոխարեն գրվեր «Russian»։
Խմբագրական կայքերը գրեթե միշտ օգտագործում են ամբողջական բնօրինակ անվանումներ։ tengrinews.kz — «Қазақша / Русский / English», khovar.tj — «Тоҷикӣ / Русский / English», armenpress.am — «Հայերեն» գլոբուսի պատկերակի կողքին։ Կարճ կոդերը (2–3 նիշ) արդարացված են միայն այնտեղ, որտեղ քիչ տեղ կա՝ կառավարման վահանակներ, բջջային մենյուներ, կոմպակտ SaaS-ինտերֆեյսներ։
Բնօրինակ անվանումներ և հապավումներ
Յուրաքանչյուր լեզվի համար առանձին
Ղազախերեն։ Ղազախերեն չիմացող ծրագրավորողը կոդում K-ի փոխարեն մուտքագրում է Կ, պարզապես այն պատճառով, որ Қ ռուսական ստեղնաշարի վրա չկա։ Անջատիչում «Қазақша»-ի փոխարեն հայտնվում է «Казакша»։ Դա տպագրական սխալի է նման, իսկ տեխնիկապես՝ այլ տող է. կայքի որոնումը կխախտվի, տեսակավորումը կշեղվի։ «ԿԶ» հապավումը նույն պատճառով սխալ է, ճիշտը «ՂԶ» է։
«Қазақша» նշանակում է «ղազախերեն»՝ խոսակցական, սովորական ձև։ Պաշտոնական կայքերում երբեմն գրում են «Қазақ тілі» (ղազախերեն լեզու), բայց մենյուում «Қазақша»-ն ավելի կարճ է։ Համեմատեք՝ «Казак» (կազակ, մարդ) և «Қазақ» (ղազախ ժողովուրդ)՝ երկրորդ բառը պարզապես անհնար է գրել ռուսերեն տառերով։
Ղրղզերեն։ Այստեղ միասնական ստանդարտ չկա նույնիսկ պաշտոնական կայքերում։ kabar.kg գրում է «Кыр», մյուս կառավարական ռեսուրսները՝ «Кырг»։ Երկու տարբերակն էլ ճիշտ են։ Գործնական խորհուրդ. ընտրեք մեկը և պահպանեք այն ամբողջ ինտերֆեյսում։ «Кырг»-ն մի փոքր ավելի միանշանակ է, եթե ձեր մենյուում կան մի քանի հապավումներ «Կ» տառով (ղազախերեն, ղրղզերեն, ռուսերեն)։
Ե՛վ «Кыргызча», և՛ «Кыргыз тили»՝ երկուսն էլ ճիշտ են. առաջինն ավելի խոսակցական է («խոսել ղրղզերեն»), երկրորդն ավելի պաշտոնական է («ղրղզերեն լեզու»)։ Անջատիչի համար «Кыргызча»-ն ավելի սովորական է։
Հայերեն։ Սա միակ լեզուն է ցուցակում, որտեղ բնիկ անվան ընտրությունը կախված է նրանից, թե որտեղ է ապրում լսարանը, քանի որ հայերենը գոյություն ունի երկու տարբերակով՝ տարբեր ուղղագրությամբ (Wikipedia):
- Հայերեն — արևելահայերեն։ Հայաստանի պետական լեզուն, բարեփոխված խորհրդային ուղղագրություն։ Խոսվում է Հայաստանում, Ռուսաստանում, Վրաստանում, Իրանում։
- Հայերեն — արևմտահայերեն։ Դասական ուղղագրություն, որը պահպանվել է սփյուռքում 1915 թվականից հետո։ Լիբանան, Ֆրանսիա, ԱՄՆ, Արգենտինա։
Տարբերությունը մեկ տառի մեջ է՝ «ե» արևելահայերենում և «է» արևմտահայերենում։ Սակայն բառապաշարը նույնպես տարբերվում է. «ինքնաթիռ» արևելահայերենում և «օդանաւ» արևմտահայերենում։ Կայքը Հայաստանի համար՝ Հայերեն։ Հայկական սփյուռքի համար՝ Հայերեն։ Երկուսի ISO կոդը նույնն է՝ hy, բայց ISO 639-3-ը բաժանում է՝ hye (արևելյան) և hyw (արևմտյան)։ «ՀԱՅ» հապավումը հայերեն «Հայ» բառից է (հայ)։ «ՀԱ»-ն առանց երրորդ տառի որպես բառ չի կարդացվում։
Տաջիկերեն։ Խնդիրը նույնն է, ինչ ղազախերենի դեպքում, բայց անմիջապես տեսանելի է. Ҷ գտնվում է լեզվի անվանման մեջ։ Եթե մշակողը «ТЧ» մուտքագրի «ТҶ»-ի փոխարեն, սխալը կլինի անմիջապես անջատիչում։ Ҷ — դա «Ч» չէ. ձայնը ավելի մոտ է անգլերեն «j»-ին jump բառում, ինչ-որ միջին «дж»-ի և փափուկ «ж»-ի միջև։ Տաջիկստանի ԱԳՆ-ն mfa.tj կայքում գրում է հենց «Ҷ»։ «Тоҷикӣ» բառում կա նաև Ӣ (երկար «ի»), որը նույնպես չկա ռուսական դասավորության մեջ։
Վրացերեն. Մշակողները հաճախ փորձում են «ქართული»-ն կրճատել մինչև «Geo» կամ «GE»՝ պարզապես այն պատճառով, որ չգիտեն, թե ինչպես աշխատել ոչ լատինական տառատեսակի հետ ինտերֆեյսում կամ վախենում են ռենդերինգի խնդիրներից։ Վրացիներն անմիջապես հասկանում են դա. «GE»-ն ընկալվում է որպես օտար տեխնիկական կոդ, ոչ թե որպես մայրենի բառ։ Մխեդրուլին 1600 տարվա գրություն է, որը ստեղծվել է մեկուսացված։ «გამარჯობა»-ն նշանակում է «բարև»։ Գրեք «ქართული» ամբողջությամբ, նույնիսկ կոմպակտ ինտերֆեյսներում։
Տեղայնացումներ և արժույթներ
Տեղայնացումը «լեզու + երկիր» կապ է։ Այն որոշում է թվերի և ամսաթվերի ձևաչափը, արժույթի խորհրդանիշը, տեսակավորման կարգը։ Տեղայնացման մեջ օգտագործվում է լեզվի կոդը, ոչ թե երկրի կոդը՝ kk_KZ, ոչ թե kz_KZ։ hy_AM, ոչ թե am_AM։ Նույն տրամաբանությունն է, ինչ ISO 639-1-ի դեպքում։
Արժույթի կոդերը առանձին ստանդարտ են՝ ISO 4217։ Մի քանի նրբերանգներ.
Ուզբեկական so'm-ը պաշտոնական հապավում է, գրվում է փոքրատառերով՝ ապաթարցով։ Ինտերֆեյսներում հաճախ օգտագործվում է պարզապես «սում» կամ «UZS»՝ երկու տարբերակներն էլ ընդունված են։
Ղազախստանը և Ռուսաստանը կիսում են +7 հեռախոսային կոդը։ Եթե գրանցման ձևում երկիրը ավտոմատ կերպով որոշվում է հեռախոսահամարով, ապա դա կխախտվի. +7 701-ը կարող է լինել և՛ Մոսկվա, և՛ Ալմաթի։ Հարցրեք երկիրը առանձին դաշտով կամ որոշեք IP-ով։
Վրաստանում կան երկու պաշտոնական լեզուներ՝ վրացերեն և աբխազերեն։ Առևտրային կայքի համար դա գրեթե երբեք անհրաժեշտ չէ, բայց եթե նախագիծը պետական է կամ ուղղված է Աբխազիային, հաշվի առեք դա։
Տառատեսակներ և գրելաձևեր
Եթե Google Font-ը միացնեք միայն կիրիլյան տիրույթով, հայերեն և վրացերեն տեքստը չի ցուցադրվի անհրաժեշտ տառատեսակով. բրաուզերը կօգտագործի համակարգային պահեստային տարբերակը, և էջը անհամապատասխան տեսք կունենա։ Հայերեն Unicode-բլոկը՝ U+0530–U+058F, վրացերենը՝ U+10A0–U+10FF։ Noto Sans Google-ից ծածկում է երկուսն էլ. միացրեք այն որպես պահեստային տառատեսակ այս լեզուների համար։
ԱՊՀ երկրների մեծ մասը օգտագործում է կիրիլիցա, բայց երեք երկիր ԽՍՀՄ փլուզումից հետո անցել են լատինիցայի՝ Ուզբեկստանը 1993 թվականին, Ադրբեջանը 1991-ին։ Կիրիլիցան այնտեղ դեռ հանդիպում է հին փաստաթղթերում և ավագ սերնդի մոտ, բայց նոր բովանդակությունը լատինիցա է։ Ղազախստանը սկսել է անցումը 2017 թվականին, նոր ուղղագրությունը հաստատվել է 2023-ին։ Սա արդեն երրորդ այբուբենի փոփոխությունն է հարյուր տարվա ընթացքում՝ արաբական գիր, ապա Յանալիֆ (խորհրդային լատինիցա 1930-ականներին), ապա կիրիլիցա, հիմա նորից լատինիցա։
Ուզբեկերենին առանձին տառատեսակ պետք չէ՝ այնտեղ ստանդարտ լատինիցա է գումարած ապոստրոֆ O'zbekcha-ում։ Լատինական տառատեսակների մեծ մասը ծածկում է սա։ Ստուգեք միայն ʻ (U+02BB) սիմվոլը՝ այն ամենուր չկա։
Հայերենը և վրացերենը լիովին ինքնուրույն համակարգեր են, որոնք կապված չեն ո՛չ կիրիլիցայի, ո՛չ լատինիցայի, ո՛չ էլ միմյանց հետ։ Հայերեն այբուբենը ստեղծվել է 405 թվականին Մեսրոպ Մաշտոց վանականի կողմից՝ Աստվածաշունչը թարգմանելու համար։ Վրացական մխեդրուլին մոտավորապես նույն տարիքի է։
Տառեր, որոնք չկան ռուսական ստեղնաշարի վրա
Ղազախերենը և տաջիկերենը պարունակում են տառեր, որոնք էկրանին հեշտությամբ կարելի է շփոթել ռուսականի հետ, բայց տեխնիկապես դրանք տարբեր Unicode-սիմվոլներ են։ Կայքի որոնումը չի գտնի բառը, տեսակավորումը կխախտվի, իսկ լեզվակիրները անմիջապես կնկատեն։
Ղազախերենում կա 42 տառ՝ 33 ստանդարտ գումարած 9 հատուկ՝ Ә, Ғ, Қ, Ң, Ө, Ұ, Ү, Һ, І։ Տաջիկերենում կան իրենց 6 լրացուցիչ տառերը՝ Ғ, Ҳ, Қ, Ҷ, Ӣ, Ӯ։
Қ և K ուշադիր նայելիս տարբերվում են (Қ-ն ներքևից պոչիկ ունի), բայց ռուսական ստեղնաշարի վրա Қ պարզապես չկա։ Մարդը «Казакша» է մուտքագրում «Қазақша»-ի փոխարեն ոչ թե անուշադիր լինելու պատճառով, այլ այն պատճառով, որ անհրաժեշտ ստեղնը հասանելի չէ։ Կամ պատճենում է աղբյուրից, որտեղ արդեն թույլ է տրվել նման փոխարինում և չի նկատում։
Գործնականում կարևոր են տառերը լեզուների անվանումներում և հապավումներում. Қ «Қазақша» և «ҚЗ»-ում, Ҷ և Ӣ «Тоҷикӣ» և «ТҶ»-ում, І ղազախական բառերում։ Եթե տեքստ եք տեղադրում արտաքին աղբյուրից, ստուգեք։ Տեղադրեք կասկածելի նշանը unicode.org կայքում և անմիջապես կտեսնեք, թե ինչ կետ է դա։
Հաճախ տրվող հարցեր
Ո՞ր լեզուն դնել Ղազախստանի համար լռելյայն՝ ռուսերենը, թե՞ ղազախերենը։
Կոմերցիոն կայքերի մեծ մասի համար ռուսերենն ավելի անվտանգ է որպես լռելյայն, հատկապես եթե լսարանը 35-ից բարձր է կամ դա B2B է։ 2021 թվականի մարդահամարի տվյալներով՝ բնակչության մոտ 80%-ը տիրապետում է ղազախերենին, մոտ 70%-ը՝ ռուսերենին, և դրանք խիստ համընկնում են։ Երիտասարդական կամ պետական լսարանի համար՝ ղազախերենը։
Արդյո՞ք անհրաժեշտ է կայքի առանձին տարբերակ արևմտահայերենի համար։
Միայն եթե դուք նպատակաուղղված աշխատում եք լիբանանյան, ֆրանսիական կամ ամերիկյան հայկական սփյուռքի հետ։ Հայաստանին ուղղված նախագծի համար բավարար է արևելահայերենը (hye)։ Ընդհանուր hy կոդը տեխնիկապես ընդունված է երկու տարբերակների համար։
Ինչպե՞ս տեղադրել hreflang հայերենի համար։
hreflang="hy" — արևելահայերենի համար (Հայաստան)։ Արևմտահայ սփյուռքի համար տեսականորեն hyw, բայց դա ոչ ստանդարտ թեգ է, և ոչ բոլոր քրոուլերներն են այն մշակում։ Ավելի հեշտ է ունենալ մեկ տարբերակ hy-ով, որն ուղղված է Հայաստանին։
Ի՞նչ անել ղազախերենի հետ հիմա՝ կիրիլի՞ցա, թե՞ լատինատառ։
Կիրիլիցա։ Պաշտոնական փաստաթղթաշրջանառությունը և կայքերի մեծ մասը դեռ կիրիլիցայով են։ Նոր լատինատառ ուղղագրությունը հաստատվել է 2023 թվականին, բայց զանգվածային անցում դեռ չկա։ Իրավիճակին հետևում է gov.kz։
Ինչու՞ երկրի կոդը և լեզվի կոդը չեն համընկնում, օրինակ՝ Հայաստանը AM է, իսկ հայերենը՝ hy։
Սրանք երկու անկախ ստանդարտներ են։ ISO 3166-1-ը կոդավորում է քաղաքական միավորները (երկրները), ISO 639-1-ը՝ լեզվական միավորները (լեզուները)։ Հայերենը ստացել է hy կոդը լատինատառ «Hayastan»-ից՝ Հայաստանի ինքնանվանումից։ Վրացերենը՝ ka «Kartuli»-ից։ Որոշ տեղերում կոդերը համընկնում են (ru/RU, uz/UZ), որոշ տեղերում՝ ոչ (hy/AM, ka/GE, kk/KZ)։ Համընկնումը պատահականություն է, ոչ թե կանոն։