Днес с идването на работа, един колега ме развесели, споменавайки обсъждането в ефира на bTV – „Защо плащаме повече за есемесите на кирилица?“ … Разбира се темата не е нова – преди десетина дни в един от онези вестници дето не трябва да се споменават във възпитана компания бяха излезли със ШОК! БОНБА! статия за същия проблем. Още тогава, под споделената статия бях написал кратък коментар, който се надявах да е изчистил неяснотите …
За какво става дума, с две думи?
Когато пишем SMS-и на телефона си, ако те са на латиница, можем да съберем 160 знака в един SMS, ако обаче решим да пишем на кирилица, знаците спадат на 70. ШОК! ви казвам! УДЖАС! Крадат ни!
Разбира се, това не е така. Имаме GSM SMS спецификацията. Но явно от Комисия за защита на потребители не са чували за това (по принцип имам добро мнение за хората в тази институция – до момента всеки казус обърнат към тях е получавал справедливо и правилно решение).
В разговора за bTV ми прави впечатление едно изречение на председателя на КЗП – Димитър Маргаритов, а именно
Това не е оправдание, българският език е официален за Европейския съюз
Това е в отговор на оправданието пратено от трите мобилни оператора у нас в който споменават байтове и стандарти. Не знам до колко г-н Маргаритов е на ясно, но всяка форма на комуникация в този свят, която е приета за световна следва спецификациите на така нареченото си RFC или Reqest for Comment (за тези които не знаят, това е описание на стандартните форми и дефиниции на всеки протокол) които се поддържат от така наречената Internet Engineering Task Force или IEFT. Това е не правителстване организация, която се опитва да постави ясни дефиниции на това как трябва да изглеждат и да се държат стандартите за комуникация, които се използват в модерния свят. Всеки нов протокол и спецификация трябва да мине разглеждане и обсъждане за да се превърне в стандарт … но това са малки политически дразги.
Ето какво пише в RFC 5724 (финалната ревизия на стандарта приета през 2010 година):
1.2.1. SMS Content
GSM SMS messages are alphanumeric paging messages that can be sent to and from SMS clients. SMS messages have a maximum length of 160 characters (7-bit characters from the GSM character set [SMS-CHAR]), or 140 octets. Other character sets (such as UCS-2 16-bit characters, resulting in 70-character messages) MAY also be supported [SMS-CHAR], but are defined as being optional by the SMS specification. Consequently, applications handling SMS messages as part of a chain of character-processing applications MUST make sure that character sets are correctly mapped to and from the character set used for SMS messages.
[…]
Или иначе казано, с думи прости, самата спецификация на стандарта GSM SMS позволява съдържанието на SMS-а да бъде до 140 октета (групи по 8 бита) или 160 7 битови знака от кодовата таблица. Тъй като това е 7 битова кодова таблица, тя позволява до 128 различни знака да бъдат кодирани с нея. Повече информация можете да намери тук. Но това са брой комбинации, които не позволяват да се закодират много езикова таблици.
За това е добавена поддръжката на UCS-2 кодиращата таблица, която е 16-bit-a и може да поеме много повече символи, които да бъдат кодирани с нея. Пълен списък има тук. Както може би се сещате 16 bit-a информация в 140 байтов поток позволяват точно 70 символа да бъдат закодирани.
Къде е проблема ми с изказването на г-н Димитров?
Това че българският е официално приет в Европейският съюз за официален НЕ ПРОМЕНЯ стандартната протоколна спецификация. Това не е нещо, което зависи от мобилните оператори или от телефоните ни. GSM SMS протокола е стар протокол, който е имплементиран и работи почти от както има GSM като стандарт. Промяната на един стандарт води до загуба на интерграция с широкия свят. Дори да приемем, че можем да реимплементираме GSM SMS протокола с друга кодова таблица, това е решава проблема – просто създава един тон други проблеми … още повече, че говорим за морално остарял протокол, който с навлизането на модерните комуиникации се използва все по-рядко.
Много е хубаво да се говори на изуст, но е още по хубаво хората да си четата спецификациите. Има една абревиатура която трябва да виси със големи червени букви над бюрото на всеки който се занимава с технологии и не е сигурен че разбира от тях. Това е … правило, което всеки човек който разбира от технологии има набито в съзнанието си докато прокърви:
Та КЗП – прочетете си RFC-то моля ви и не ставайте смешни. Иначе много ви харесвам като за държавна институция.
Надявам се знаете, че няма SMS Gate и не ви крадат!
Ваш,
Lucifer
P.S.: ШОК!1! БОНБА!1!1!!!!
Вашият коментар