Труднощі української типографії: Юнікод. Частина 1

· · 3 коментарів

Стандартна українська розкладка клавіатури має багато недоліків. Чому кома знаходиться у верхньому регістрі, якщо вона використовується набагато частіше за крапку? На англійській розкладці вона знаходиться в більш зручному місці, ніж крапка. Курйоз: українська «ен» («ні») знаходиться там, де англійська «y» («yes»), а українська «те» («так») — там, де англійська «n» («no»). Головна проблема будь-якої кириличної розкладки в тому, що не вистачає клавіш для позначення усіх букв. В українській мові на 7 букв більше, ніж у англійській. Цікаво, що на клавіатурі радянських комп’ютерів було більше клавіш і всі букви могли вільно розміститися. Отже, можливо варто пошукати альтернативу стандартній розкладці?

⫹ ⊕ ⚓ ⚔ ⚕ ⚗ ⚛ ⚠ ⚥ ✂ ✈ ✍ ䷕  ⊹ ☠ ☢ ☣ ☪ ☮ ☫ ☭ ☯ ☺ ☽ ♍ ♕ ♥ ♪ ♲ ✓  ض Ծ ⺑ ऒ ಊ Ћ ⠌

Бачите прямокутнички в попередньому абзаці. Скоріш за все, так. Якщо їх багато і тільки де-не-де видно знайомі або й незнайомі символи, то я вам співчуваю. Ваш комп’ютер не може відтворити все багатство різноманітних символів Юнікоду, як от «якір», «череп з кістками», «ножиці», «знак радіаційної небезпеки», «хіпівський peace», «серп і молот», а також знаки китайської, арабської, грузинської, чи, наприклад, бенгальської писемностей. Юнікод — це проект по розробці єдиного кодування для всіх писемностей і символів світу. На даний час, Юнікод підтримує величезну кількість символів. Багато сайтів, програм і мов програмування у нових версіях переходять на Юнікод. Але софтверна корпорація Майкрософт і не думає переходити, а пропонує власне однобайтове кодування, яке може передати тільки 256 символів. В текст документа, звичайно, можна включити юнікодівські символи, але їх не можна використати на рівні системи, наприклад, назвати файл ☠.txt. Якщо небажання інтернаціоналізації пояснювати економією ресурсів (один символ Юнікоду може займати до 4 байт), тоді чому Vista така вимоглива до заліза? Чимало розробників софту також визнають тільки одну культуру — спрощену англо-американську. Їхня логіка така — «піпл хаваєт».

В таких умовах нелегко верстати згідно усіх правил, але якщо за цю справу взятися серйозно, то сайти і документи будуть виглядати набагато краще.

Дефіс, тире, мінус

Історично, на стандартній клавіатурі є тільки один символ, що виражає і дефіс, і тире, і мінус. В Юнікоді він називається Hyphen-minus (U+002D). Але справжній дефіс має окремий символ з назвою Hyphen (U+2010). Як це типово для Юнікоду, дефіс має також різновиди: Soft hyphen (U+00AD) і Non-breaking hyphen (U+2011). Я думаю, нема великої різниці, який дефіс використовувати, бо вони дуже схожі. Зовсім інша ситуація з тире. Думаю, набагато приємніше бачити довге тире, по якому погляд «ковзає». Це добре символізує паузу, яка, звичайно, буває замість тире в усному мовленні. Не випадково ж у видавничій справі виробилася ця норма.

В українській мові використовують довге тире Em dash (U+2014). Інші види тире: фігурне тире Figure dash (U+2012), коротке тире En dash (U+2013), хвилясте тире Swung dash (U+2053), хвилясте тире Wave dash (U+301C).

Для мінуса використовується знак Minus sign (U+2212).

Лапки і апостроф

На стандартній клавіатурі є два різновиди лапок: подвійні прямі лапки Quotation mark (U+0022) і одинарні прямі лапки Apostrophe (U+0027). Кожна мова має свої варіанти форми лапок. Наприклад, данська мова використовує »…«, а японська —「…」. Народи Північної Європи частіше використовують звичайні лапки, а Південної — кутові. В українській мові немає загальноприйнятого варіанту написання лапок. Застосовуються такі варіанти:

  • «…» — «ялинки», кутові або французькі лапки. Саме цей варіант використовується в чинному українському правописі. Я також дотримуюсь його за тієї причини, що він є на моїй розкладці і чітко видно відкривання та закривання лапок.
  • „…“ — звичайні або німецькі лапки. Також часто використовуються в українській типографії. Цей варіант частіше за інші присутній в документах до Другої Світової Війни.
  • „…” — особливі лапки. Чимало видавництв використовують цей варіант.
  • “…” — англійські лапки. Цей варіант рекомендується проектом українського правопису 1999 року.
  • ”…” — непарні лапки.
  • “…” — прямі подвійні лапки. Не рекомендуються.

Краще використовувати «ялинки» або звичайні лапки. Головне — дотримуватись одного варіанту на всьому сайті. Якщо треба поставити лапки в лапках, можна використати інший їх варіант.

Хоч символ Юнікоду U+0027 й має назву «Apostrophe», але, з точки зору української типографії, це зовсім не апостороф. Правильний апостроф в українській мові має форму коми, що пишеться зверху. Такому визначенню відповідає кілька символів Юнікоду: Right single quotation mark (U+2019), Modifier letter apostrophe (U+02BC) і ще чимало інших. Треба використовувати Right single quotation mark в якості апострофу. Modifier letter apostrophe має таку ж форму, але застосовується для позначення модифікації звучання попередньої літери. В українській мові апостроф не модифікує звучання.

Юнікод має ще багато символів, подібних до лапок чи апострофа, але вони не мають стосунку до української мови.

Продовження незабаром. …І практичні рішення.

Категорія: Мова

Коментарі (3)RSS-стрічка коментарів

  1. The Lex коментує:

    Не зрозуміло чому написане – якась, вибачте на слові, фігня, та ще й у традиційному ключи “отакий тупий так його перетак мікрософт”.

    Щойно пішов і назвав файл “символ череп з кістками”.txt – причому назву скопіював прямо з цього тексту – що я не так зробив? Вже давно забув перейматися, чи файли названі з німецькими умляутами, чи взагалі з японськими ієрогліфами – усе чудово ладнає у файловій системі поряд з рідними назвами українською.

    Про мінуси, дефіси, і тире – це все класно, але як його набирати такий текст? Доречі, клятого мікрософта ворд успішно виправляє по тексту дефіси ні “довге тире”. Той самий ворд успішно ставить лапки залежно від поточної мови: набираєш українською чи російською – ось тобі “французькі” лапки; англійською – ось тобі “які треба”. А як “дотримуватися одного варіанту на одному сайті”, якщо сайт чи навіть один і той самий текст написаний кількома мовами?

    Щиро кажучи, незрозуміло у чому, власне, “труднощі”… :)

  2. chugylo коментує:

    The Lex, вибачаюся, що написав неперевірену інформацію про назви файлів, але в усьому іншому я з вами не згоден. Ви самі визнаєте, що стандартна розкладка не дозволяє набирати багато потрібних символів. Ворд, це звичайно, добре, але рішення на рівні однієї програми — це напіврішення. Тире і правильні лапки повинні бути доступними з будь-якого місця. І розкладка, що виправляє ці недоліки вже існує, але не всім про це відомо. І останнє про один варіант написання на одному сайті: не треба ж усе сприймати так буквально.

  3. The Lex коментує:

    Що до “розкладки, яка виправляє недоліки” – то найпотужніший недолій стандартної також і “віндової” розкладки української – це відсутність у ній, власне, апострофа як такого. Але навіть цей недолік – як то кажуть падонки “баян” – вже давно відомий і давно виправлений у альтернативних розкладках. Просто усі ці “труднощі” – це традиційний “перший досвід досвіченого лінуксоіда що вперше побачив вінду” – у вінді у цій усе чудово підтримується і навіть UTF-8 он вже від самої Win XP можна у “блокноні” правити і зберігати і тим самим “блокнотом” навіть “конвертити” (як то українською?) туди-сюди куди треба. У вінді проблем з юнікодом нема вже давно.

    Стосовно ж типографіки в мові – як на мене, надмірне прагнення в усьому впроваджувати правила для друку у електронних виданнях – це трохи перебільшення. Скажімо лапки насправді у більшості текстів обраними шрифтами навіть толком не помітні і вже напевне треба докладати зусиль, щоб розібрати тип верхніх лапок чи апострофа. І якщо з довгим тире я ще згоден – доречі, а які правила переносу “довгого тире” і як вони підтримуються і чим? – то з усім іншим це вже більше “прикраси” – істотно на читабельність тексту вони не впливають. До того ж юнікод у “неанглійських мовах” – це звичка таки “лінуксоідів” – на жаль чи на щастя, а більшість “простих людей” користуються своїми розкладками у розширеному 8-бітовому ANSI. Ну, принаймні це що стосується європейців. :)

    P.S. Ненавиджу щиро перетворені на “єдині символи” смайліки, ага. ;)

Напишіть відгук

Ваша пошт@ не публікуватиметься. Обов’язкові поля позначені *


Warning: Parameter 1 to W3_Plugin_TotalCache::ob_callback() expected to be a reference, value given in /home/u801826201/public_html/wp-includes/functions.php on line 3510