Лучшие unicode вопросы ИТ разработчиков

  • 17 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

Узнайте скрипт Unicode персонажа

Учитывая символ Юникода, что было бы самым простым способом вернуть егоскрипт [http://en.wikipedia.org/wiki/Script_%28Unicode%29](как "латиница", "хангыль" и т. ...

Задан 26 Mar 2012, 08:25 от georg
  • 30 голосов
  • 8 ответов
  • 0 просмотров
8 ответов

Цвет для Unicode Emoji

В современные браузеры можно включать символы Emoji, но как сделать его одним цветом и выбрать этот цвет?Например, здесь есть некоторые эмодзи и некоторые об...

Задан 05 Sep 2015, 13:40 от mahemoff
  • 24 голосов
  • 5 ответов
  • 0 просмотров
5 ответов

Усечение Юникода, чтобы он соответствовал максимальному размеру при кодировании для банковского перевода

Учитывая строку Unicode и эти требования:Строка должна быть закодирована в некоторый формат последовательности байтов (например, UTF-8 или экранирование Юник...

Задан 27 Nov 2009, 15:04 от JasonSmith
  • 13 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

как windows wchar_t обрабатывает символы Юникода вне базовой многоязычной плоскости?

Я посмотрел ряд других постов здесь и в других местах (см. Ниже), но у меня до сих пор нет четкого ответа на этот вопрос: как windows wchar_t обрабатывает символы юникода вне базовой многоязычной плоскости? Это: многие программисты считают, что ...

Задан 23 Oct 2011, 23:24 от vy32
  • 65 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

В противном случае ваша сортировка будет странной.

ли правило, когда мы должны использовать типы Unicode? Я видел, что большинство европейских языков (немецкий, итальянский, английский, ...) в одной и той же базе данных в столбцах VARCHAR. Я ищу что-то вроде: Если у вас есть китайский -> ...

Задан 04 Mar 2009, 21:09 от Peter Gfader
  • 22 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Как Java хранит символы UTF-16 в 16-битном типе символов?

СогласноJava SE 7 Спецификация [http://docs.oracle.com/javase/specs/jls/se7/html/jls-3.html#jls-3.1]Java использует стандарт Unicode UTF-16 для представления символов. Когда воображаетеString какпростой массив из 16-битных переменных, каждая из ...

Задан 28 Oct 2012, 19:57 от Kierrow
  • 81 голос
  • 0 ответов
  • 0 просмотров
0 ответов

 который получает вас:

атегории должны быть названы греческими буквами. Я используюggplot2и это прекрасно работает с данными. К сожалению, я не могу понять, как разместить эти греческие символы на оси х (в отметках), а также заставить их появиться в легенде. Есть ли ...

Задан 14 Mar 2011, 01:02 от Sam
  • 2 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

), затем используйте:

я есть строка, которая печатается так print a \u4f53\u91cd\u8a08Я использую Eclipse, и консоль может печатать символы Unicode, я проверил это так. print u'\u4f53\u91cd\u8a08' 体重計Он печатает правильно, как я могу сделать строку в переменной а ...

Задан 20 Dec 2010, 06:53 от Abdalla
  • 21 голос
  • 3 ответа
  • 0 просмотров
3 ответа

 уже в Unicode. Все внутренние строки C # являются Unicode. Когда вы конвертируете его в ASCII, вы теряете символы. Вот почему вы получаете ????? ????.

я есть функция для преобразования строки в строку Unicode: private string UnicodeString(string text) { return Encoding.UTF8.GetString(Encoding.ASCII.GetBytes(text)); }Но когда я вызываю эту функцию, результат вывода неверен. Похоже, моя функция ...

Задан 20 Feb 2011, 06:43 от Reg
  • 1092 голосов
  • 24 ответа
  • 0 просмотров
24 ответа

UnicodeEncodeError: кодек 'ascii' не может кодировать символ u '\ xa0' в позиции 20: порядковый номер не в диапазоне (128)

У меня проблемы с работой символов юникода из текста, полученного с разных веб-страниц (на разных сайтах). Я использую BeautifulSoup. Проблема в том, что ошибка не всегда воспроизводима; иногда он работает с некоторыми страницами, а иногда он ...

Задан 30 Mar 2012, 12:06 от Homunculus Reticulli
  • 43 голосов
  • 10 ответов
  • 0 просмотров
10 ответов

Должен ли я поддерживать Unicode в паролях?

Я хотел бы разрешить своим пользователям использовать Unicode для своих паролей.Однако я вижу много сайтов нене поддерживает это (например, Gmail, Hotmail).Т...

Задан 25 Nov 2009, 14:39 от KL90
  • 7 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Могу ли я отключить неявные преобразования Unicode в Python, чтобы найти ошибки в смешанных строках?

При профилировании нашего кода я был удивлен, обнаружив миллионы звонковC: \ Python26 \ Lib \ кодировки \ utf_8.py: 15 (декодирование)Я начал отладку и обнар...

Задан 17 May 2010, 18:00 от Tal Weiss
  • 9 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

std :: string, wstring, u16 / 32 уточнение строки

Мое текущее понимание разницы междуstd::string а такжеstd::wstring просто тип буфера; а именно,char противwchar_tсоответственно. Я также читал, что большинство (если не все) дистрибутивов Linux используютchar для любой и всех строк, как ASCII, ...

Задан 21 Jan 2013, 11:59 от Qix
  • 35 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

«Функция u () не нужна.», ну, она нужна для поддержки людей, которые все еще используют Python 3.2.

то у меня есть скрипт на python, который я бы предпочел работать на python 3.2 и 2.7 просто для удобства. Есть ли способ иметь литералы Unicode, которые работают в обоих? Например. #coding: utf-8 whatever = 'שלום'Приведенный выше код потребовал ...

Задан 08 Jul 2011, 14:19 от ubershmekel
  • 4 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Почему «ARABIC LETTER PEH» не отображается правильно на Android 3.x?

ВСимволы Юникода [http://www.ssec.wisc.edu/~tomw/java/unicode.html]ARABIC LETTER PEH INITIAL FORM 'ﭘ' является0xFB58, Когда я использую следующий код для отображения символов Юникода,все в порядке для каждого символа Unicode в Android 2.2, 2.3. ...

Задан 15 Sep 2011, 05:35 от Bobs
  • 568 голосов
  • 7 ответов
  • 0 просмотров
7 ответов

 с ASCII.

о, следующий правильный синтаксис my_string = b'The string'Я бы хотел знать: Что делает этоb символ перед строкой значит?Каковы последствия его использования?Каковы подходящие ситуации, чтобы использовать это?Я нашелсвязанный вопрос ...

Задан 07 Jun 2011, 18:14 от Jesse Webb
  • 51 голос
  • 6 ответов
  • 0 просмотров
6 ответов

Регулярное выражение Python, соответствующее свойствам Юникода

Perl и некоторые другие текущие движки регулярных выражений поддерживают свойства Юникода, такие как категория, в регулярном выражении. Например. в Perl вы м...

Задан 02 Dec 2009, 12:25 от ThomasH
  • 4 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Добавление в качестве ответа, так как у меня нет представителя, чтобы комментировать.

ли хороший способ отключитьУмная Пунктуация "клавиатура Apple iOS 11 генерирует - в Safari на форме входа в HTML - поле имени пользователя, в частности? Проблема в том, что у нас есть пользователи с апострофами в именах пользователей. Набирая ...

Задан 08 Feb 2018, 05:39 от donatJ
  • 78 голосов
  • 6 ответов
  • 0 просмотров
6 ответов

Как я могу удалить не-ASCII символы, но оставить точки и пробелы, используя Python?

Я работаю с файлом .txt. Я хочу строку текста из файла без символов не ASCII. Тем не менее, я хочу оставить пробелы и периоды. В настоящее время я тоже их снимаю. Вот код: def onlyascii(char): if ord(char) < 48 or ord(char) > 127: return '' ...

Задан 31 Dec 2011, 18:23 от user1120342
  • 7 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

это работает - на самом деле - довольно хорошо

ужно обработать большой список коротких строк (в основном на русском языке, но возможен любой другой язык, включая случайный мусор от кошки, гуляющей по клавиатуре). Некоторые из этих строк будут кодированы в UTF-8 дважды. Мне нужно надежно ...

Задан 17 Feb 2011, 17:36 от Alexander Gladysh
  • 39 голосов
  • 5 ответов
  • 0 просмотров
5 ответов

Удалить символы юникода из текстовых файлов - sed, другие методы bash / shell

Как удалить символы юникода из набора текстовых файлов на терминале? Я пробовал это, но это не сработало: sed 'g/\u'U+200E'//' -i *.txtМне нужно удалить эти Unicodes из текстовых файлов U+0091 - sort of weird "control" space U+0092 - same sort ...

Задан 19 Dec 2011, 13:55 от alvas
  • 4 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

ISO 8859-1 имя файла не декодируется

Я извлекаю файлы из сообщений MIME на python milter и сталкиваюсь с проблемами с файлами, названными так: =? ISO-8859-1? Q? Certificado = 5FZonificaci = F3N...

Задан 25 Jul 2012, 12:21 от Larry G. Wapnitsky
  • 9 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Как инициализировать массив символов с помощью шестнадцатеричных чисел?

Я использую utf8 и должен сохранить константу в массиве символов: const char s[] = {0xE2,0x82,0xAC, 0}; //the euro signОднако это дает мне ошибку: test.cpp:15:40: error: narrowing conversion of ‘226’ from ‘int’ to ‘const char’ inside { } ...

Задан 31 Oct 2013, 19:51 от texasbruce
  • 4 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Как отобразить символы юникода в окне консоли Eclipse?

Я создаю небольшое Java-приложение, которое использует символы Юникода для создания строк и столбцов блоков в окне консоли в Eclipse Keplar. Мой код работает совершенно нормально, но вывод каждого печатаемого символа Unicode представляет собой ...

Задан 18 Nov 2013, 14:34 от Benjamin C. Huskisson-Snider
  • 32 голосов
  • 7 ответов
  • 0 просмотров
7 ответов

Извините за поздний ответ: да, кодировка подразумевает use_unicode = True

аюсь отправить данные учетной записи пользователя из Active Directory на наш MySQL-сервер. Это работает безупречно, но каким-то образом строки в конечном итоге показывают закодированную версию умлаутов и других специальных символов. Active ...

Задан 01 Jun 2011, 14:23 от Raptor
  • 6 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Соответствие штрихам Unicode в регулярных выражениях Java?

Я пытаюсь создать регулярное выражение Java для разделения строк общего формата &quot;foo - bar&quot; на &quot;foo&quot; и &quot;bar&quot; с помощью Pattern....

Задан 15 Jun 2010, 13:22 от Alterscape
  • 4 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Необходимо конвертировать текстовые файлы в Unicode из UTF8 в VBScript

У меня есть куча текстовых файлов в папке, в которой мне нужно изменить кодировку на Unicode, и вместо того, чтобы открывать файлы вручную и сохранять их как Unicode, я хотел бы иметь скрипт для этого. Файлы в настоящее время в кодировке UTF-8, ...

Задан 09 Apr 2013, 15:36 от user1723699
  • 5 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

К сожалению, у меня нет опыта работы со шрифтами Unicode в OSX или Linux, поэтому я не могу вам помочь.

даю игру. У меня есть некоторый интерфейс с текстом. Недавно мы хотели добавить версию на японском языке, но у меня проблема со шрифтами. Я использую stb_freetype для растеризации шрифтов и поддерживаю Unicode, поэтому это не должно быть ...

Задан 08 Jun 2011, 14:32 от Jerry
  • 0 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Unicode символ Visual C ++

Я пытаюсь заставить мою программу работать с символами Юникода. Я использую Visual Studio 2010 на компьютере с Windows 7 x32. Я хочу напечатать символ королевы ("\ ul2655"), и он просто не работает. Я установил свое решение для использования ...

Задан 23 Oct 2013, 17:40 от Robert Lucian Chiriac
  • 8 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Кодирование двоичных данных в XML: есть ли лучшие альтернативы, чем base64?

Я хочу, чтобы кодировать и декодировать двоичные данные в файле XML (с Python, но безотносительно). Я должен признать тот факт, что содержимое тега XML содер...

Задан 25 Jun 2013, 13:52 от KrisWebDev
  • 3 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Символ Unicode (U + 1FXYZ) не выводится правильно при использовании в коде позади

В моем коде позади я пытаюсь вернуть шестнадцатеричный код для символа юникода. Я пытаюсь вывести любой из этих символов для шрифта Segoe UI ...

Задан 05 Jan 2014, 13:42 от Bredcrumbs
  • 2 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

NSString в Emoji Unicode

Я пытаюсь извлечь файл JSON из серверной части, содержащий юникоды для смайликов. Это не устаревшие юникоды (пример: \ ue415), а скорее юникоды, которые рабо...

Задан 09 Jul 2014, 19:34 от Jeremy Herrero
  • 17 голосов
  • 6 ответов
  • 0 просмотров
6 ответов

Вернуть кодовую точку символов в C #

Как я могу вернутьUnicode Code Point [https://en.wikipedia.org/wiki/Code_point] персонажа? Например, если вход «A», то выход должен быть «U + 0041». В идеале решение должно заботиться осуррогатные ...

Задан 15 Dec 2012, 16:32 от FSm
  • 1 голос
  • 2 ответа
  • 0 просмотров
2 ответа

Исправление рендеринга хинди (Unicode) в Android

Я успешно добавил пользовательский шрифт (DroidSansFallBack.ttf), чтобы отображать символы хинди вместо блоков в Pre ICS. Все работает хорошо на 4.1+ в любом случае. Но порядок рендеринга неверен на Froyo и Gingerbread. Я так понимаю это ...

Задан 26 Nov 2012, 17:09 от Alok
Page 3 of 32