Fri, Oct 21, 2011 at 01:33:26, plostak wrote about "Re: [uanog] Апострофический бред":
Господа, кто-нибудь может объяснить глубокий смысл использования U+02BC вместо U+2019 для обозначения украинского апострофа, как это было предложено в письме к ICANN ( http://uanic.net/node/204 )? Может, потому, что U+2019 это какой-то невнятный right quotation mark, а не буква? Посмотри на класс этого символа в сводной таблице - это punctuation, а не letter, и выступать в именах не имеет права. А U+02BC, несмотря на странное "modifier", считается полноценным буквенным символом.
Сильно сомневаюсь, что для U+02BC во всех языках корректно отработает toLower, toUpper, isLetter etc
Язык тут ни при чём, играют роль общие свойства символов. toLower(), toUpper() его не меняют. isLetter() даст True потому, что символ записан как Lm.
(да, для U+2019 точно отработает неверно), так что обрабатывать все равно придется как исключение,
Нет.
а лингворфсишные изыски в данном случае, имхо, не особо интересны кому-либо, кроме лингворфсишников)
Все, кто заинтересован в качественной работе с юникодом, используют ICU или аналогичную библиотеку, где этот вопрос уже решён.
U+2018 де-факто искользуется в качестве замены английского апострофа при написании украинских слов, теми кого этот вопрос в принципе волнует. Гуглим тоже "м[U+2018]ясо", например.
Значит, это неудачный временный костыль, ничуть не лучше чем использование U+0027 в том же месте, и должен быть похерен как можно быстрее.
Ну я в Firefox @ linux набрал через u2bc при нажатых Ctrl+Shift, хотя это таки было не из лёгких вариантов:) а так прямой ответ - лечить раскладку, украинская раскладка и так в любом Windows жуткая дрянь и потому требует ремонта.
В линухе каждый может, а как ты объяснишь куда _прямо сейчас_ бежать всем остальным? Как регистраторы объяснят клиентам, что их домен хрен введешь из под Windows? Лечить раскладку, говоришь, и сколько десятилетий ее лечат-лечат, а она все болеет и болеет?) Имхо, сегодня M$ уже ничего менять не будет, с этим пора смириться и сделать то что нужно, так как можно, а не изобретать велисипед с третим колесом между ног)
Так не надо полагаться на MS, надо самим сделать и поставлять раскладку. (Вот насчёт шрифтов не знаю, тут может быть сложнее) -netch-