Ці статті позначені тегом Створення блогу

Труднощі української типографії: Юнікод. Частина 2

· 3 коментарів

На початок статті.

Трикрапка

Трикрапка в Юнікоді зветься Horizontal ellipsis (U+2026).

Пробіл

Серйозно! Пробіли теж бувають різними. В типографії деяких мов прийняті різні види пробілів, з різною довжиною. Але в українській є сенс використовувати тільки два їх види. Пробіл може відображатися, як пусте місце між словами, або слугувати, як місце переносу рядка. Але правопис забороняє в деяких випадках виконувати перенос на місці пробілу. Ось два приклади з неправильним переносом:

Т. Г.
Шевченко.

Знання
— це сила.

В таких випадках застосовують нерозривний пробіл (прогалину) No-break space (U+00A0). На прогалині рядок не переноситься і кілька пробілів не можуть злитися в один.

Наголос

В Юнікоді є багато варіантів наголосу. Варто використовувати Combining grave accent (U+0300).

Як це використовувати?

В офісних програмах, зазвичай, є автокоректор, що може зробити значну частину замін. Але я б не радив повністю йому довіряти.

Якщо писати HTML-код, то, для зручнішого читання, краще вставляти символи безпосередньо, а не через їхній код. Виняток тільки для прогалини — краще писати  

Найкращий варіант набору — використання окремої розкладки. На даний час, вже існує українська Юнікод-розкладка, доступна для платформ Windows і Linux (X.org). Вона була розроблена безвідносно до роду занять користувача: типографіст чи програміст. Суть полягає у використанні так званого третього рівня, який викликається натисненням клавіші Alt Gr (правий Alt). Наприклад, щоб набрати «, треба натиснути Alt Gr + б. Третій рівень також має нижній і верхній регістри і, таким чином, за однією клавішею може бути закріплено до 4 символів.

Українська Юнікод-розкладка вже включена в більшість дистрибутивів Linux. А віндовзятникам її треба встановлювати окремо.

[Завантажити Юнікод-розкладку для Windows XP]
[Подивитись малюнок]

Довідник найпотрібніших символів
Символ Назва Українська назва Номер UTF-8 UTF-16 XML Чи бажано вживати?
- Hyphen-minus Дефіс-мінус U+002D 0x2D 0x002D - Ні
Hyphen Дефіс U+2010 0xE2 0×80 0×90 0×2010 ‐ Так
Em dash Довге тире U+2014 0xE2 0×80 0×94 0×2014 — — Так
Quotation mark Прямі подвійні лапки U+0022 0×22 0×0022 " " Ні
« Left-pointing double angle quotation mark Відкриваюча кутова лапка U+00AB 0xC2 0xAB 0x00AB « « Так
» Right-pointing double angle quotation mark Закриваюча кутова лапка U+00BB 0xC2 0xBB 0x00BB » » Так
Double low-9 quotation mark U+201E 0xE2 0×80 0x9E 0x201E „ „ Так
Left double quotation mark U+201C 0xE2 0×80 0x9C 0x201C “ “ Так
Right double quotation mark U+201D 0xE2 0×80 0x9D 0x201D ” ” Ні
Apostrophe Одинарна пряма лапка U+0027 0×27 0×0027 ' Ні
Right single quotation mark Апостороф U+2019 0xE2 0×80 0×99 0×2019 ’ ’ Так
ʼ Modifier letter apostrophe Апостроф модифікації попередньої літери U+02BC 0xCA 0xBC 0x02BC ʼ Ні
Horizontal ellipsis Трикрапка U+2026 0xE2 0×80 0xA6 0×2026 … … Так
  No-break space Прогалина (нерозривний пробіл) U+00A0 0xC2 0xA0 0x00A0     Так
[неможливо відобразити] Combining grave accent Наголос U+0300 0xCC 0×80 0×0300 ̀ Так
Джерела

Ця стаття — зведення докупи багатьох джерел, головні з яких:

  • Вікіпедія
  • Чинний український правопис
  • Українська розкладка клавіатури з символами Юнікоду
  • Інтернет системи
  • Програма Gucharmap 2.22.1
Категорія: Мова

Труднощі української типографії: Юнікод. Частина 1

· 3 коментарів

Стандартна українська розкладка клавіатури має багато недоліків. Чому кома знаходиться у верхньому регістрі, якщо вона використовується набагато частіше за крапку? На англійській розкладці вона знаходиться в більш зручному місці, ніж крапка. Курйоз: українська «ен» («ні») знаходиться там, де англійська «y» («yes»), а українська «те» («так») — там, де англійська «n» («no»). Головна проблема будь-якої кириличної розкладки в тому, що не вистачає клавіш для позначення усіх букв. В українській мові на 7 букв більше, ніж у англійській. Цікаво, що на клавіатурі радянських комп’ютерів було більше клавіш і всі букви могли вільно розміститися. Отже, можливо варто пошукати альтернативу стандартній розкладці?

⫹ ⊕ ⚓ ⚔ ⚕ ⚗ ⚛ ⚠ ⚥ ✂ ✈ ✍ ䷕  ⊹ ☠ ☢ ☣ ☪ ☮ ☫ ☭ ☯ ☺ ☽ ♍ ♕ ♥ ♪ ♲ ✓  ض Ծ ⺑ ऒ ಊ Ћ ⠌

Бачите прямокутнички в попередньому абзаці. Скоріш за все, так. Якщо їх багато і тільки де-не-де видно знайомі або й незнайомі символи, то я вам співчуваю. Ваш комп’ютер не може відтворити все багатство різноманітних символів Юнікоду, як от «якір», «череп з кістками», «ножиці», «знак радіаційної небезпеки», «хіпівський peace», «серп і молот», а також знаки китайської, арабської, грузинської, чи, наприклад, бенгальської писемностей. Юнікод — це проект по розробці єдиного кодування для всіх писемностей і символів світу. На даний час, Юнікод підтримує величезну кількість символів. Багато сайтів, програм і мов програмування у нових версіях переходять на Юнікод. Але софтверна корпорація Майкрософт і не думає переходити, а пропонує власне однобайтове кодування, яке може передати тільки 256 символів. В текст документа, звичайно, можна включити юнікодівські символи, але їх не можна використати на рівні системи, наприклад, назвати файл ☠.txt. Якщо небажання інтернаціоналізації пояснювати економією ресурсів (один символ Юнікоду може займати до 4 байт), тоді чому Vista така вимоглива до заліза? Чимало розробників софту також визнають тільки одну культуру — спрощену англо-американську. Їхня логіка така — «піпл хаваєт».

В таких умовах нелегко верстати згідно усіх правил, але якщо за цю справу взятися серйозно, то сайти і документи будуть виглядати набагато краще.

Дефіс, тире, мінус

Історично, на стандартній клавіатурі є тільки один символ, що виражає і дефіс, і тире, і мінус. В Юнікоді він називається Hyphen-minus (U+002D). Але справжній дефіс має окремий символ з назвою Hyphen (U+2010). Як це типово для Юнікоду, дефіс має також різновиди: Soft hyphen (U+00AD) і Non-breaking hyphen (U+2011). Я думаю, нема великої різниці, який дефіс використовувати, бо вони дуже схожі. Зовсім інша ситуація з тире. Думаю, набагато приємніше бачити довге тире, по якому погляд «ковзає». Це добре символізує паузу, яка, звичайно, буває замість тире в усному мовленні. Не випадково ж у видавничій справі виробилася ця норма.

В українській мові використовують довге тире Em dash (U+2014). Інші види тире: фігурне тире Figure dash (U+2012), коротке тире En dash (U+2013), хвилясте тире Swung dash (U+2053), хвилясте тире Wave dash (U+301C).

Для мінуса використовується знак Minus sign (U+2212).

Лапки і апостроф

На стандартній клавіатурі є два різновиди лапок: подвійні прямі лапки Quotation mark (U+0022) і одинарні прямі лапки Apostrophe (U+0027). Кожна мова має свої варіанти форми лапок. Наприклад, данська мова використовує »…«, а японська —「…」. Народи Північної Європи частіше використовують звичайні лапки, а Південної — кутові. В українській мові немає загальноприйнятого варіанту написання лапок. Застосовуються такі варіанти:

  • «…» — «ялинки», кутові або французькі лапки. Саме цей варіант використовується в чинному українському правописі. Я також дотримуюсь його за тієї причини, що він є на моїй розкладці і чітко видно відкривання та закривання лапок.
  • „…“ — звичайні або німецькі лапки. Також часто використовуються в українській типографії. Цей варіант частіше за інші присутній в документах до Другої Світової Війни.
  • „…” — особливі лапки. Чимало видавництв використовують цей варіант.
  • “…” — англійські лапки. Цей варіант рекомендується проектом українського правопису 1999 року.
  • ”…” — непарні лапки.
  • “…” — прямі подвійні лапки. Не рекомендуються.

Краще використовувати «ялинки» або звичайні лапки. Головне — дотримуватись одного варіанту на всьому сайті. Якщо треба поставити лапки в лапках, можна використати інший їх варіант.

Хоч символ Юнікоду U+0027 й має назву «Apostrophe», але, з точки зору української типографії, це зовсім не апостороф. Правильний апостроф в українській мові має форму коми, що пишеться зверху. Такому визначенню відповідає кілька символів Юнікоду: Right single quotation mark (U+2019), Modifier letter apostrophe (U+02BC) і ще чимало інших. Треба використовувати Right single quotation mark в якості апострофу. Modifier letter apostrophe має таку ж форму, але застосовується для позначення модифікації звучання попередньої літери. В українській мові апостроф не модифікує звучання.

Юнікод має ще багато символів, подібних до лапок чи апострофа, але вони не мають стосунку до української мови.

Продовження незабаром. …І практичні рішення.

Категорія: Мова