Стандартна українська розкладка клавіатури має багато недоліків. Чому кома знаходиться у верхньому регістрі, якщо вона використовується набагато частіше за крапку? На англійській розкладці вона знаходиться в більш зручному місці, ніж крапка. Курйоз: українська «ен» («ні») знаходиться там, де англійська «y» («yes»), а українська «те» («так») — там, де англійська «n» («no»). Головна проблема будь-якої кириличної розкладки в тому, що не вистачає клавіш для позначення усіх букв. В українській мові на 7 букв більше, ніж у англійській. Цікаво, що на клавіатурі радянських комп’ютерів було більше клавіш і всі букви могли вільно розміститися. Отже, можливо варто пошукати альтернативу стандартній розкладці?
⫹ ⊕ ⚓ ⚔ ⚕ ⚗ ⚛ ⚠ ⚥ ✂ ✈ ✍ ䷕ ⊹ ☠ ☢ ☣ ☪ ☮ ☫ ☭ ☯ ☺ ☽ ♍ ♕ ♥ ♪ ♲ ✓ ض Ծ ⺑ ऒ ಊ Ћ ⠌
Бачите прямокутнички в попередньому абзаці. Скоріш за все, так. Якщо їх багато і тільки де-не-де видно знайомі або й незнайомі символи, то я вам співчуваю. Ваш комп’ютер не може відтворити все багатство різноманітних символів Юнікоду, як от «якір», «череп з кістками», «ножиці», «знак радіаційної небезпеки», «хіпівський peace», «серп і молот», а також знаки китайської, арабської, грузинської, чи, наприклад, бенгальської писемностей. Юнікод — це проект по розробці єдиного кодування для всіх писемностей і символів світу. На даний час, Юнікод підтримує величезну кількість символів. Багато сайтів, програм і мов програмування у нових версіях переходять на Юнікод. Але софтверна корпорація Майкрософт і не думає переходити, а пропонує власне однобайтове кодування, яке може передати тільки 256 символів. В текст документа, звичайно, можна включити юнікодівські символи, але їх не можна використати на рівні системи, наприклад, назвати файл ☠.txt. Якщо небажання інтернаціоналізації пояснювати економією ресурсів (один символ Юнікоду може займати до 4 байт), тоді чому Vista така вимоглива до заліза? Чимало розробників софту також визнають тільки одну культуру — спрощену англо-американську. Їхня логіка така — «піпл хаваєт».
В таких умовах нелегко верстати згідно усіх правил, але якщо за цю справу взятися серйозно, то сайти і документи будуть виглядати набагато краще.
Дефіс, тире, мінус
Історично, на стандартній клавіатурі є тільки один символ, що виражає і дефіс, і тире, і мінус. В Юнікоді він називається Hyphen-minus (U+002D). Але справжній дефіс має окремий символ з назвою Hyphen (U+2010). Як це типово для Юнікоду, дефіс має також різновиди: Soft hyphen (U+00AD) і Non-breaking hyphen (U+2011). Я думаю, нема великої різниці, який дефіс використовувати, бо вони дуже схожі. Зовсім інша ситуація з тире. Думаю, набагато приємніше бачити довге тире, по якому погляд «ковзає». Це добре символізує паузу, яка, звичайно, буває замість тире в усному мовленні. Не випадково ж у видавничій справі виробилася ця норма.
В українській мові використовують довге тире Em dash (U+2014). Інші види тире: фігурне тире Figure dash (U+2012), коротке тире En dash (U+2013), хвилясте тире Swung dash (U+2053), хвилясте тире Wave dash (U+301C).
Для мінуса використовується знак Minus sign (U+2212).
Лапки і апостроф
На стандартній клавіатурі є два різновиди лапок: подвійні прямі лапки Quotation mark (U+0022) і одинарні прямі лапки Apostrophe (U+0027). Кожна мова має свої варіанти форми лапок. Наприклад, данська мова використовує »…«, а японська —「…」. Народи Північної Європи частіше використовують звичайні лапки, а Південної — кутові. В українській мові немає загальноприйнятого варіанту написання лапок. Застосовуються такі варіанти:
- «…» — «ялинки», кутові або французькі лапки. Саме цей варіант використовується в чинному українському правописі. Я також дотримуюсь його за тієї причини, що він є на моїй розкладці і чітко видно відкривання та закривання лапок.
- „…“ — звичайні або німецькі лапки. Також часто використовуються в українській типографії. Цей варіант частіше за інші присутній в документах до Другої Світової Війни.
- „…” — особливі лапки. Чимало видавництв використовують цей варіант.
- “…” — англійські лапки. Цей варіант рекомендується проектом українського правопису 1999 року.
- ”…” — непарні лапки.
- “…” — прямі подвійні лапки. Не рекомендуються.
Краще використовувати «ялинки» або звичайні лапки. Головне — дотримуватись одного варіанту на всьому сайті. Якщо треба поставити лапки в лапках, можна використати інший їх варіант.
Хоч символ Юнікоду U+0027 й має назву «Apostrophe», але, з точки зору української типографії, це зовсім не апостороф. Правильний апостроф в українській мові має форму коми, що пишеться зверху. Такому визначенню відповідає кілька символів Юнікоду: Right single quotation mark (U+2019), Modifier letter apostrophe (U+02BC) і ще чимало інших. Треба використовувати Right single quotation mark в якості апострофу. Modifier letter apostrophe має таку ж форму, але застосовується для позначення модифікації звучання попередньої літери. В українській мові апостроф не модифікує звучання.
Юнікод має ще багато символів, подібних до лапок чи апострофа, але вони не мають стосунку до української мови.
Продовження незабаром. …І практичні рішення.
Коментарі (3)
Не зрозуміло чому написане – якась, вибачте на слові, фігня, та ще й у традиційному ключи “отакий тупий так його перетак мікрософт”.
Щойно пішов і назвав файл “символ череп з кістками”.txt – причому назву скопіював прямо з цього тексту – що я не так зробив? Вже давно забув перейматися, чи файли названі з німецькими умляутами, чи взагалі з японськими ієрогліфами – усе чудово ладнає у файловій системі поряд з рідними назвами українською.
Про мінуси, дефіси, і тире – це все класно, але як його набирати такий текст? Доречі, клятого мікрософта ворд успішно виправляє по тексту дефіси ні “довге тире”. Той самий ворд успішно ставить лапки залежно від поточної мови: набираєш українською чи російською – ось тобі “французькі” лапки; англійською – ось тобі “які треба”. А як “дотримуватися одного варіанту на одному сайті”, якщо сайт чи навіть один і той самий текст написаний кількома мовами?
Щиро кажучи, незрозуміло у чому, власне, “труднощі”… :)
The Lex, вибачаюся, що написав неперевірену інформацію про назви файлів, але в усьому іншому я з вами не згоден. Ви самі визнаєте, що стандартна розкладка не дозволяє набирати багато потрібних символів. Ворд, це звичайно, добре, але рішення на рівні однієї програми — це напіврішення. Тире і правильні лапки повинні бути доступними з будь-якого місця. І розкладка, що виправляє ці недоліки вже існує, але не всім про це відомо. І останнє про один варіант написання на одному сайті: не треба ж усе сприймати так буквально.
Що до “розкладки, яка виправляє недоліки” – то найпотужніший недолій стандартної також і “віндової” розкладки української – це відсутність у ній, власне, апострофа як такого. Але навіть цей недолік – як то кажуть падонки “баян” – вже давно відомий і давно виправлений у альтернативних розкладках. Просто усі ці “труднощі” – це традиційний “перший досвід досвіченого лінуксоіда що вперше побачив вінду” – у вінді у цій усе чудово підтримується і навіть UTF-8 он вже від самої Win XP можна у “блокноні” правити і зберігати і тим самим “блокнотом” навіть “конвертити” (як то українською?) туди-сюди куди треба. У вінді проблем з юнікодом нема вже давно.
Стосовно ж типографіки в мові – як на мене, надмірне прагнення в усьому впроваджувати правила для друку у електронних виданнях – це трохи перебільшення. Скажімо лапки насправді у більшості текстів обраними шрифтами навіть толком не помітні і вже напевне треба докладати зусиль, щоб розібрати тип верхніх лапок чи апострофа. І якщо з довгим тире я ще згоден – доречі, а які правила переносу “довгого тире” і як вони підтримуються і чим? – то з усім іншим це вже більше “прикраси” – істотно на читабельність тексту вони не впливають. До того ж юнікод у “неанглійських мовах” – це звичка таки “лінуксоідів” – на жаль чи на щастя, а більшість “простих людей” користуються своїми розкладками у розширеному 8-бітовому ANSI. Ну, принаймні це що стосується європейців. :)
P.S. Ненавиджу щиро перетворені на “єдині символи” смайліки, ага. ;)