Це статті за 05.09.2008

Труднощі української типографії: Юнікод. Частина 1

· · 3 коментарів

Стандартна українська розкладка клавіатури має багато недоліків. Чому кома знаходиться у верхньому регістрі, якщо вона використовується набагато частіше за крапку? На англійській розкладці вона знаходиться в більш зручному місці, ніж крапка. Курйоз: українська «ен» («ні») знаходиться там, де англійська «y» («yes»), а українська «те» («так») — там, де англійська «n» («no»). Головна проблема будь-якої кириличної розкладки в тому, що не вистачає клавіш для позначення усіх букв. В українській мові на 7 букв більше, ніж у англійській. Цікаво, що на клавіатурі радянських комп’ютерів було більше клавіш і всі букви могли вільно розміститися. Отже, можливо варто пошукати альтернативу стандартній розкладці?

⫹ ⊕ ⚓ ⚔ ⚕ ⚗ ⚛ ⚠ ⚥ ✂ ✈ ✍ ䷕  ⊹ ☠ ☢ ☣ ☪ ☮ ☫ ☭ ☯ ☺ ☽ ♍ ♕ ♥ ♪ ♲ ✓  ض Ծ ⺑ ऒ ಊ Ћ ⠌

Бачите прямокутнички в попередньому абзаці. Скоріш за все, так. Якщо їх багато і тільки де-не-де видно знайомі або й незнайомі символи, то я вам співчуваю. Ваш комп’ютер не може відтворити все багатство різноманітних символів Юнікоду, як от «якір», «череп з кістками», «ножиці», «знак радіаційної небезпеки», «хіпівський peace», «серп і молот», а також знаки китайської, арабської, грузинської, чи, наприклад, бенгальської писемностей. Юнікод — це проект по розробці єдиного кодування для всіх писемностей і символів світу. На даний час, Юнікод підтримує величезну кількість символів. Багато сайтів, програм і мов програмування у нових версіях переходять на Юнікод. Але софтверна корпорація Майкрософт і не думає переходити, а пропонує власне однобайтове кодування, яке може передати тільки 256 символів. В текст документа, звичайно, можна включити юнікодівські символи, але їх не можна використати на рівні системи, наприклад, назвати файл ☠.txt. Якщо небажання інтернаціоналізації пояснювати економією ресурсів (один символ Юнікоду може займати до 4 байт), тоді чому Vista така вимоглива до заліза? Чимало розробників софту також визнають тільки одну культуру — спрощену англо-американську. Їхня логіка така — «піпл хаваєт».

В таких умовах нелегко верстати згідно усіх правил, але якщо за цю справу взятися серйозно, то сайти і документи будуть виглядати набагато краще.

Дефіс, тире, мінус

Історично, на стандартній клавіатурі є тільки один символ, що виражає і дефіс, і тире, і мінус. В Юнікоді він називається Hyphen-minus (U+002D). Але справжній дефіс має окремий символ з назвою Hyphen (U+2010). Як це типово для Юнікоду, дефіс має також різновиди: Soft hyphen (U+00AD) і Non-breaking hyphen (U+2011). Я думаю, нема великої різниці, який дефіс використовувати, бо вони дуже схожі. Зовсім інша ситуація з тире. Думаю, набагато приємніше бачити довге тире, по якому погляд «ковзає». Це добре символізує паузу, яка, звичайно, буває замість тире в усному мовленні. Не випадково ж у видавничій справі виробилася ця норма.

В українській мові використовують довге тире Em dash (U+2014). Інші види тире: фігурне тире Figure dash (U+2012), коротке тире En dash (U+2013), хвилясте тире Swung dash (U+2053), хвилясте тире Wave dash (U+301C).

Для мінуса використовується знак Minus sign (U+2212).

Лапки і апостроф

На стандартній клавіатурі є два різновиди лапок: подвійні прямі лапки Quotation mark (U+0022) і одинарні прямі лапки Apostrophe (U+0027). Кожна мова має свої варіанти форми лапок. Наприклад, данська мова використовує »…«, а японська —「…」. Народи Північної Європи частіше використовують звичайні лапки, а Південної — кутові. В українській мові немає загальноприйнятого варіанту написання лапок. Застосовуються такі варіанти:

  • «…» — «ялинки», кутові або французькі лапки. Саме цей варіант використовується в чинному українському правописі. Я також дотримуюсь його за тієї причини, що він є на моїй розкладці і чітко видно відкривання та закривання лапок.
  • „…“ — звичайні або німецькі лапки. Також часто використовуються в українській типографії. Цей варіант частіше за інші присутній в документах до Другої Світової Війни.
  • „…” — особливі лапки. Чимало видавництв використовують цей варіант.
  • “…” — англійські лапки. Цей варіант рекомендується проектом українського правопису 1999 року.
  • ”…” — непарні лапки.
  • “…” — прямі подвійні лапки. Не рекомендуються.

Краще використовувати «ялинки» або звичайні лапки. Головне — дотримуватись одного варіанту на всьому сайті. Якщо треба поставити лапки в лапках, можна використати інший їх варіант.

Хоч символ Юнікоду U+0027 й має назву «Apostrophe», але, з точки зору української типографії, це зовсім не апостороф. Правильний апостроф в українській мові має форму коми, що пишеться зверху. Такому визначенню відповідає кілька символів Юнікоду: Right single quotation mark (U+2019), Modifier letter apostrophe (U+02BC) і ще чимало інших. Треба використовувати Right single quotation mark в якості апострофу. Modifier letter apostrophe має таку ж форму, але застосовується для позначення модифікації звучання попередньої літери. В українській мові апостроф не модифікує звучання.

Юнікод має ще багато символів, подібних до лапок чи апострофа, але вони не мають стосунку до української мови.

Продовження незабаром. …І практичні рішення.

Категорія: Мова

Warning: Parameter 1 to W3_Plugin_TotalCache::ob_callback() expected to be a reference, value given in /home/u801826201/public_html/wp-includes/functions.php on line 3510