На початок статті.
Трикрапка
Трикрапка в Юнікоді зветься Horizontal ellipsis (U+2026).
Пробіл
Серйозно! Пробіли теж бувають різними. В типографії деяких мов прийняті різні види пробілів, з різною довжиною. Але в українській є сенс використовувати тільки два їх види. Пробіл може відображатися, як пусте місце між словами, або слугувати, як місце переносу рядка. Але правопис забороняє в деяких випадках виконувати перенос на місці пробілу. Ось два приклади з неправильним переносом:
Т. Г.
Шевченко.
Знання
— це сила.
В таких випадках застосовують нерозривний пробіл (прогалину) No-break space (U+00A0). На прогалині рядок не переноситься і кілька пробілів не можуть злитися в один.
Наголос
В Юнікоді є багато варіантів наголосу. Варто використовувати Combining grave accent (U+0300).
Як це використовувати?
В офісних програмах, зазвичай, є автокоректор, що може зробити значну частину замін. Але я б не радив повністю йому довіряти.
Якщо писати HTML-код, то, для зручнішого читання, краще вставляти символи безпосередньо, а не через їхній код. Виняток тільки для прогалини — краще писати
Найкращий варіант набору — використання окремої розкладки. На даний час, вже існує українська Юнікод-розкладка, доступна для платформ Windows і Linux (X.org). Вона була розроблена безвідносно до роду занять користувача: типографіст чи програміст. Суть полягає у використанні так званого третього рівня, який викликається натисненням клавіші Alt Gr (правий Alt). Наприклад, щоб набрати «, треба натиснути Alt Gr + б. Третій рівень також має нижній і верхній регістри і, таким чином, за однією клавішею може бути закріплено до 4 символів.
Українська Юнікод-розкладка вже включена в більшість дистрибутивів Linux. А віндовзятникам її треба встановлювати окремо.
[Завантажити Юнікод-розкладку для Windows XP]
[Подивитись малюнок]
Довідник найпотрібніших символів
Символ |
Назва |
Українська назва |
Номер |
UTF-8 |
UTF-16 |
XML |
Чи бажано вживати? |
- |
Hyphen-minus |
Дефіс-мінус |
U+002D |
0x2D |
0x002D |
- |
Ні |
‐ |
Hyphen |
Дефіс |
U+2010 |
0xE2 0×80 0×90 |
0×2010 |
‐ |
Так |
— |
Em dash |
Довге тире |
U+2014 |
0xE2 0×80 0×94 |
0×2014 |
— — |
Так |
“ |
Quotation mark |
Прямі подвійні лапки |
U+0022 |
0×22 |
0×0022 |
" " |
Ні |
« |
Left-pointing double angle quotation mark |
Відкриваюча кутова лапка |
U+00AB |
0xC2 0xAB |
0x00AB |
« « |
Так |
» |
Right-pointing double angle quotation mark |
Закриваюча кутова лапка |
U+00BB |
0xC2 0xBB |
0x00BB |
» » |
Так |
„ |
Double low-9 quotation mark |
|
U+201E |
0xE2 0×80 0x9E |
0x201E |
„ „ |
Так |
“ |
Left double quotation mark |
|
U+201C |
0xE2 0×80 0x9C |
0x201C |
“ “ |
Так |
” |
Right double quotation mark |
|
U+201D |
0xE2 0×80 0x9D |
0x201D |
” ” |
Ні |
‘ |
Apostrophe |
Одинарна пряма лапка |
U+0027 |
0×27 |
0×0027 |
' |
Ні |
’ |
Right single quotation mark |
Апостороф |
U+2019 |
0xE2 0×80 0×99 |
0×2019 |
’ ’ |
Так |
ʼ |
Modifier letter apostrophe |
Апостроф модифікації попередньої літери |
U+02BC |
0xCA 0xBC |
0x02BC |
ʼ |
Ні |
… |
Horizontal ellipsis |
Трикрапка |
U+2026 |
0xE2 0×80 0xA6 |
0×2026 |
… … |
Так |
|
No-break space |
Прогалина (нерозривний пробіл) |
U+00A0 |
0xC2 0xA0 |
0x00A0 |
  |
Так |
[неможливо відобразити] |
Combining grave accent |
Наголос |
U+0300 |
0xCC 0×80 |
0×0300 |
̀ |
Так |
Джерела
Ця стаття — зведення докупи багатьох джерел, головні з яких:
- Вікіпедія
- Чинний український правопис
- Українська розкладка клавіатури з символами Юнікоду
- Інтернет системи
- Програма Gucharmap 2.22.1
Стандартна українська розкладка клавіатури має багато недоліків. Чому кома знаходиться у верхньому регістрі, якщо вона використовується набагато частіше за крапку? На англійській розкладці вона знаходиться в більш зручному місці, ніж крапка. Курйоз: українська «ен» («ні») знаходиться там, де англійська «y» («yes»), а українська «те» («так») — там, де англійська «n» («no»). Головна проблема будь-якої кириличної розкладки в тому, що не вистачає клавіш для позначення усіх букв. В українській мові на 7 букв більше, ніж у англійській. Цікаво, що на клавіатурі радянських комп’ютерів було більше клавіш і всі букви могли вільно розміститися. Отже, можливо варто пошукати альтернативу стандартній розкладці?
⫹ ⊕ ⚓ ⚔ ⚕ ⚗ ⚛ ⚠ ⚥ ✂ ✈ ✍ ䷕ ⊹ ☠ ☢ ☣ ☪ ☮ ☫ ☭ ☯ ☺ ☽ ♍ ♕ ♥ ♪ ♲ ✓ ض Ծ ⺑ ऒ ಊ Ћ ⠌
Бачите прямокутнички в попередньому абзаці. Скоріш за все, так. Якщо їх багато і тільки де-не-де видно знайомі або й незнайомі символи, то я вам співчуваю. Ваш комп’ютер не може відтворити все багатство різноманітних символів Юнікоду, як от «якір», «череп з кістками», «ножиці», «знак радіаційної небезпеки», «хіпівський peace», «серп і молот», а також знаки китайської, арабської, грузинської, чи, наприклад, бенгальської писемностей. Юнікод — це проект по розробці єдиного кодування для всіх писемностей і символів світу. На даний час, Юнікод підтримує величезну кількість символів. Багато сайтів, програм і мов програмування у нових версіях переходять на Юнікод. Але софтверна корпорація Майкрософт і не думає переходити, а пропонує власне однобайтове кодування, яке може передати тільки 256 символів. В текст документа, звичайно, можна включити юнікодівські символи, але їх не можна використати на рівні системи, наприклад, назвати файл ☠.txt. Якщо небажання інтернаціоналізації пояснювати економією ресурсів (один символ Юнікоду може займати до 4 байт), тоді чому Vista така вимоглива до заліза? Чимало розробників софту також визнають тільки одну культуру — спрощену англо-американську. Їхня логіка така — «піпл хаваєт».
В таких умовах нелегко верстати згідно усіх правил, але якщо за цю справу взятися серйозно, то сайти і документи будуть виглядати набагато краще.
Дефіс, тире, мінус
Історично, на стандартній клавіатурі є тільки один символ, що виражає і дефіс, і тире, і мінус. В Юнікоді він називається Hyphen-minus (U+002D). Але справжній дефіс має окремий символ з назвою Hyphen (U+2010). Як це типово для Юнікоду, дефіс має також різновиди: Soft hyphen (U+00AD) і Non-breaking hyphen (U+2011). Я думаю, нема великої різниці, який дефіс використовувати, бо вони дуже схожі. Зовсім інша ситуація з тире. Думаю, набагато приємніше бачити довге тире, по якому погляд «ковзає». Це добре символізує паузу, яка, звичайно, буває замість тире в усному мовленні. Не випадково ж у видавничій справі виробилася ця норма.
В українській мові використовують довге тире Em dash (U+2014). Інші види тире: фігурне тире Figure dash (U+2012), коротке тире En dash (U+2013), хвилясте тире Swung dash (U+2053), хвилясте тире Wave dash (U+301C).
Для мінуса використовується знак Minus sign (U+2212).
Лапки і апостроф
На стандартній клавіатурі є два різновиди лапок: подвійні прямі лапки Quotation mark (U+0022) і одинарні прямі лапки Apostrophe (U+0027). Кожна мова має свої варіанти форми лапок. Наприклад, данська мова використовує »…«, а японська —「…」. Народи Північної Європи частіше використовують звичайні лапки, а Південної — кутові. В українській мові немає загальноприйнятого варіанту написання лапок. Застосовуються такі варіанти:
- «…» — «ялинки», кутові або французькі лапки. Саме цей варіант використовується в чинному українському правописі. Я також дотримуюсь його за тієї причини, що він є на моїй розкладці і чітко видно відкривання та закривання лапок.
- „…“ — звичайні або німецькі лапки. Також часто використовуються в українській типографії. Цей варіант частіше за інші присутній в документах до Другої Світової Війни.
- „…” — особливі лапки. Чимало видавництв використовують цей варіант.
- “…” — англійські лапки. Цей варіант рекомендується проектом українського правопису 1999 року.
- ”…” — непарні лапки.
- “…” — прямі подвійні лапки. Не рекомендуються.
Краще використовувати «ялинки» або звичайні лапки. Головне — дотримуватись одного варіанту на всьому сайті. Якщо треба поставити лапки в лапках, можна використати інший їх варіант.
Хоч символ Юнікоду U+0027 й має назву «Apostrophe», але, з точки зору української типографії, це зовсім не апостороф. Правильний апостроф в українській мові має форму коми, що пишеться зверху. Такому визначенню відповідає кілька символів Юнікоду: Right single quotation mark (U+2019), Modifier letter apostrophe (U+02BC) і ще чимало інших. Треба використовувати Right single quotation mark в якості апострофу. Modifier letter apostrophe має таку ж форму, але застосовується для позначення модифікації звучання попередньої літери. В українській мові апостроф не модифікує звучання.
Юнікод має ще багато символів, подібних до лапок чи апострофа, але вони не мають стосунку до української мови.
Продовження незабаром. …І практичні рішення.
Найбільш коментоване