Лучшие unicode вопросы ИТ разработчиков

  • 6 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Распознавание текста как упрощенного и традиционного китайского

Учитывая блок текста, который, как известно, является китайским и закодирован в UTF-8, есть ли способ определить, является ли он упрощенным или традиционным?

Задан 02 Nov 2010, 23:33 от philfreo
  • 5 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

преобразование std :: u32string в / из std :: string и std :: u16string

Мне нужно конвертировать между UTF-8, UTF-16 и UTF-32 для разных API / модулей, и, поскольку я знаю, есть возможность использовать C ++ 11, я смотрю на новые...

Задан 08 Jul 2015, 19:58 от Fire Lancer
  • 20 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Конвертировать все типы умных цитат с PHP

Я пытаюсь преобразовать все типы умных цитат в обычные цитаты при работе с текстом. Тем не менее, следующая функция, которую я скомпилировал, все еще испытывает недостаток в поддержке и правильном дизайне Кто-нибудь знает, как правильно получить ...

Задан 16 Nov 2013, 23:02 от Xeoncross
  • 10 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Является ли ED A0 80 ED B0 80 действительной последовательностью байтов UTF-8?

java.nio.charset.Charset.forName ( "utf8"). декодирование [http://docs.oracle.com/javase/7/docs/api/java/nio/charset/Charset.html#decode%28java.nio.ByteBuffer%29] декодирует последовательность байтов ED A0 80 ED B0 80в кодовую точку ...

Задан 12 Jan 2012, 23:12 от Pacerier
  • 2 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Преобразование C-строк из локального кодирования в UTF8

Я пишу небольшое приложение, в котором я читаю текст из консоли, который затем сохраняется в классической строке char *.Как это происходит, мне нужно передат...

Задан 27 Dec 2009, 00:43 от Andreas Klebinger
  • 74 голосов
  • 5 ответов
  • 0 просмотров
5 ответов

MySQL VARCHAR длины и UTF-8

В MySQL, если я создаю новыйVARCHAR(32) поле в таблице UTF-8 означает ли это, что я могу хранить 32 байта данных в этом поле или 32 символа (многобайтовые)?

Задан 04 Jan 2010, 04:41 от Alix Axel
  • 70 голосов
  • 9 ответов
  • 0 просмотров
9 ответов

Преобразовать строку Unicode в экранированную строку ASCII

Как я могу преобразовать эту строку: This string contains the Unicode character Pi(π)в экранированную строку ASCII: This string contains the Unicode character Pi(\u03a0)а такженаоборот? Текущая кодировка, доступная в C #, преобразует символ π ...

Задан 23 Oct 2009, 19:53 от Ali
  • 106 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Вставить символ Юникода в JavaScript

Мне нужно вставить Омега (Ω) на мою HTML-страницу. Я использую его HTML-код, чтобы сделать это, поэтому я могу написать

Задан 26 Oct 2012, 17:22 от Bluefire
  • 9 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Как отобразить верхний индекс% символа в виде строки в UIlabel?

Как отобразить верхний индекс% символа в виде строки в UIlabel? Я знаю, что% не существует в юникоде как верхний индекс, но есть ли способ показать% как верх...

Задан 19 Jun 2014, 06:27 от Saikiran K
  • 32 голосов
  • 7 ответов
  • 0 просмотров
7 ответов

регулярное выражение для принятия только персидских символов

Я работаю над формой, один из ее пользовательских валидаторов должен принимать только персидские символы ... Я использовал следующий код:

Задан 21 Mar 2014, 17:07 от NikiUsefi
  • 25 голосов
  • 6 ответов
  • 0 просмотров
6 ответов

Как узнать, содержит ли конкретная строка символы Юникода (особенно двухбайтовые символы)

Чтобы быть более точным, мне нужно знать, могу ли (и если возможно, как) узнать, содержит ли данная строка двухбайтовые символы или нет. По сути, мне нужно открыть всплывающее окно для отображения заданного текста, который может содержать ...

Задан 29 Sep 2008, 07:39 от Jay
  • 0 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

BlackBerry - Unicode текстовое отображение

Я хотел бы отобразить арабский текст в LabelField в приложении j2me на устройстве BlackBerry. Предположим, что арабский шрифт установлен на устройстве. В ресурсах локализации, если используется арабская локаль, весь текст сохраняется в ...

Задан 18 Dec 2009, 15:31 от Maksym Gontar
  • 45 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Как конвертировать char * в wchar_t *?

Я попытался реализовать такую функцию, но, к сожалению, она не работает: const wchar_t *GetWC(const char *c) { const size_t cSize = strlen(c)+1; wchar_t wc[cSize]; mbstowcs (wc, c, cSize); return wc; }Моя главная цель здесь состоит в том, чтобы ...

Задан 07 Nov 2011, 02:11 от AutoBotAM
  • 4 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Огромный +1 это сэкономили часы работы. Использование плагина jquery.cookie.

ли кто-нибудь помочь мне понять, как сохранить значение файла cookie на другом языке и чем восстановить его на этом языке. Кажется, что мои куки на иностранных языках превращаются в мусор при получении после хранения. Некоторый код: Напишите ...

Задан 04 Feb 2011, 18:34 от Zigglzworth
  • 4 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Многоязычная сортировка текста в Perl, в Windows, с использованием локали

Я создаю часть программного обеспечения для сортировки книжных индексов на разных языках. Он использует Perl и ключи от локали. Я разрабатываю его на Unix, но он должен быть переносимым на Windows. Должно ли это работать в принципе или, полагаясь ...

Задан 21 Feb 2013, 22:33 от egilchri
  • 161 голос
  • 0 ответов
  • 0 просмотров
0 ответов

Насколько хорошо Unicode поддерживается в C ++ 11?

Я читал и слышал, что C ++ 11 поддерживает Unicode. Несколько вопросов по этому поводу: Насколько хорошо стандартная библиотека C ++ поддерживает Unicode?Есть лиstd::string делать то, что должно?Как мне это использовать?Где потенциальные проблемы?

Задан 14 Jun 2013, 08:09 от Ralph Tandetzky
  • 2 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

Как получить символы для контекстного ввода в сложном сценарии?

В некоторыхRightToLeft языки (например, арабский, персидский, урду и т. д.) каждая буква может иметь различную форму. Существует изолированная форма, начальн...

Задан 23 Jul 2009, 07:08 от Mark CidadeMJ Fathinia
  • 13 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Кодировка Stdout в Python

Есть ли веская причина, почему я не долженначаловсе мои программы на Python с этим? Есть ли что-то особенное, что теряется при выполнении exec, как это?

Задан 01 Apr 2013, 06:41 от Erik Johansson
  • 5 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

python: UnicodeDecodeError: кодек «utf8» не может декодировать байт 0xc0 в позиции 0: недопустимый начальный байт

Я пытаюсь написать сценарий, который генерирует случайный Unicode путем создания случайных строк в кодировке UTF-8, а затем декодировать их в Unicode. Он раб...

Задан 21 May 2014, 00:34 от paritybit
  • 1 голос
  • 1 ответ
  • 0 просмотров
1 ответ

Как мне «расшифровать» символ UTF-8?

Давайте предположим, что я хочу написать функцию для сравнения двух символов Юникода. Как мне это сделать? Я прочитал несколько статей вокруг (какэтот) но до...

Задан 25 Aug 2014, 00:27 от Jack
  • 9 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Фильтрация недопустимых символов XML в Java

Спецификация XML определяет подмножество символов Unicode, которые разрешены в документах XML:http://www.w3.org/TR/REC-xml/#charsets.Как отфильтровать эти си...

Задан 24 May 2010, 12:54 от Grzegorz Oledzki
  • 11 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Можно ли использовать Unicode «argv»?

Я пишу небольшую оболочку для приложения, которое использует файлы в качестве аргументов.Оболочка должна быть в Unicode, поэтому яЯ использую wchar_t для сим...

Задан 02 Nov 2009, 23:00 от John
  • 7 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Загрузка текста RTF из базы данных в TRichEdit

В настоящее время я нахожусь в процессе переноса нашего программного решения с Delphi 7 на 2010. В основном изменения были простыми, и осталось лишь небольшо...

Задан 02 Nov 2010, 01:47 от Simon Hartcher
  • 20 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Конвертировать все типы умных цитат с PHP

Я пытаюсь преобразовать все типы умных цитат в обычные цитаты при работе с текстом. Тем не менее, следующая функция I 'Похоже, что в скомпилированном вид...

Задан 16 Nov 2013, 22:02 от Xeoncross
  • 6 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

как конвертировать старую кодировку эмодзи в последнюю кодировку в iOS5?

к сожалению, после выхода iOS5 я получил сообщение от моих пользователей, что они не могут войти в систему. Потому что в именах есть символ эмодзи, а яблоко изменило кодировку эмодзи. так там имя пользователя содержит старую версию эмодзи, как ...

Задан 22 Oct 2011, 01:09 от springrider
  • 4 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

 цикл вместо регулярного выражения. Ответ Михаэля Лю выглядит правильным, хотя мой ответ может быть полезен, когда входная кодировка неизвестна.

я есть строка, которая содержит следующий код / ​​значение: "You won\u0092t find a ...." [/imgs/55hh7.png] Похоже, что эта строка содержит специальный символ «Правый апостроф». ref1:Unicode control ...

Задан 13 Sep 2017, 00:38 от Pure.Krome
  • 6 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

Как разобрать числовые символы кандзи с помощью ICU?

Я пишу функцию с использованием ICU для анализа строки Unicode, которая состоит из числовых символов кандзи, и хочу вернуть целочисленное значение строки. "五" => 5 "三十 一" => 31 "五千 九百 七 十二" => 5972 Я устанавливаю локаль для Locale :: getJapan ...

Задан 28 Apr 2009, 01:14 от Aki
  • 7 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Django: gettext и принуждение к Unicode

У меня есть следующий код в моем приложении Django. class Status(object): def __init__(self, id, desc): self.id = id self.desc = desc def __unicode__(self): return self.desc STATUS = Status(0, _(u"Some text")) Когда я пытаюсь отобразить какой-то ...

Задан 25 Jan 2010, 15:57 от gruszczy
Page 2 of 32