Лучшие unicode вопросы ИТ разработчиков

  • 13 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Начинается с изменения в Windows Server 2012

Изменить: я изначально думал, что это связано с .NET Framework 4.5. Оказалось, что это относится и к .NET Framework 4.0.Там'изменение в обработке строк в...

Задан 21 Oct 2013, 11:02 от Nitramk
  • 4 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

C ++ Unicode файл IO

Мне нужна библиотека file io, которая может дать моей программе интерфейс utf-16 (little-endian), но может обрабатывать файлы в других кодировках, в основном...

Задан 19 Jul 2009, 11:29 от Fire Lancer
  • 7 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

Написание текста с диакритическими знаками («никуд», вокализационные знаки) с использованием PIL (Python Imaging Library)

Написание простого текста на изображении с помощью PIL легко. draw = ImageDraw.Draw(img) draw.text((10, y), text2, font=font, fill=forecolor ) Однако, когда я пытаюсь написать знаки препинания на иврите (называемые «никуда» или «קיקוד»), символы ...

Задан 14 Jun 2009, 17:28 от Berry Tsakala
  • 12 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Поставлен в тупик с Unicode, Boost, C ++, codecvts

В C ++ я хочу использовать Unicode, чтобы делать вещи. Так что, упав в кроличью нору Unicode, мне удалось оказаться в железнодорожной катастрофе путаницы, головных болей и мест. Но в Boost у меня возникла неудачная проблема: пытаться ...

Задан 22 Oct 2011, 12:49 от Jookia
  • 16 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Конвертировать юникод в правильный формат strptime

Я пытаюсь преобразовать объект Unicode в объект datetime. Я прочитал документацию:http://docs.python.org/2/library/time.html#time.strptime [http://docs.python.org/2/library/time.html#time.strptime] и попробовал datetime.strptime(date_posted, ...

Задан 16 Jan 2014, 01:15 от bbrooke
  • 74 голосов
  • 12 ответов
  • 0 просмотров
12 ответов

Другой язык, который является контейнером данных, таким как YAML или XML, является именно тем, чем на самом деле является JSON, и JSON не допускает функций.

ибудь знает хороший режим Emacs для редактирования JSON? Приложение, над которым я работаю, использует протокол обмена данными на основе JSON, и наличие данн...

Задан 12 Jan 2009, 15:54 от Ryszard Szopa
  • 21 голос
  • 0 ответов
  • 0 просмотров
0 ответов

stackoverflow.com/questions/49716774/...

аюсь сделать очень простую задачу: принять Unicode-осведомленныйwstring и преобразовать его вstring, закодированные как байты UTF8, а затем наоборот: возьмитеstring содержащий байты UTF8 и преобразовать его в кодировку Unicodewstring. Проблема в ...

Задан 26 May 2011, 14:27 от sebulba
  • 6 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

как конвертировать старую кодировку эмодзи в последнюю кодировку в iOS5?

к сожалению, после выхода iOS5 я получил сообщение от моих пользователей, что они не могут войти в систему. Потому что в именах есть символ эмодзи, а яблоко изменило кодировку эмодзи. так там имя пользователя содержит старую версию эмодзи, как ...

Задан 22 Oct 2011, 01:09 от springrider
  • 59 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

Люди - вы знаете, у нас есть отличная функция чата, где вы можете продолжить эту увлекательную дискуссию. :)

ющее может не квалифицироваться как вопрос SO; если это выходит за пределы, пожалуйста, не стесняйтесь сказать мне, чтобы уйти. Вопрос здесь в основном: «Правильно ли я понимаю стандарт C и правильно ли это делать?» Я хотел бы попросить ...

Задан 10 Jun 2011, 00:35 от Kerrek SB
  • 8 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Кодирование двоичных данных в XML: есть ли лучшие альтернативы, чем base64?

Я хочу, чтобы кодировать и декодировать двоичные данные в файле XML (с Python, но безотносительно). Я должен признать тот факт, что содержимое тега XML содер...

Задан 25 Jun 2013, 13:52 от KrisWebDev
  • 6 голосов
  • 5 ответов
  • 0 просмотров
5 ответов

Поддержка клавиатуры Emoji для EditField в Android

Мое приложение использует Android 4.0 на Samsung Galaxy S3.Я хочу интегрировать поддержку символов Emoji в поле EditText в приложении Android. Кто-нибудь мож...

Задан 03 Jan 2014, 07:04 от HiteshGs
  • 9 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Вот

тоящее время я связываю все свои классы движка C ++ с python для сценариев игры. Последняя проблема заключается в том, что когда вы говорите, что вы делаете переменную в скрипте строку string = 'hello world'это становится PyUnicodeObject. Далее ...

Задан 21 Jul 2011, 22:17 от DaneEC117
  • 8 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

Я отменил отрицательный голос. Но в Python 3 есть еще лучший способ: использовать аргумент кодирования для open.

аюсь декодировать строку, которую я взял из файла: file = open ("./Downloads/lamp-post.csv", 'r') data = file.readlines() data[0]«\ XFF \ xfeK \ x00e \ x00y \ x00w \ x00o \ x00r \ x00d \ x00 \ т \ x00C \ x00o \ x00m \ x00p \ x00e \ x00t \ x00i \ ...

Задан 19 Jan 2011, 13:06 от Oleg Tarasenko
  • 5 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

преобразование std :: u32string в / из std :: string и std :: u16string

Мне нужно конвертировать между UTF-8, UTF-16 и UTF-32 для разных API / модулей, и, поскольку я знаю, есть возможность использовать C ++ 11, я смотрю на новые...

Задан 08 Jul 2015, 19:58 от Fire Lancer
  • 6 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Как надежно удалить невидимые символы, которые нарушают код?

Я пытаюсь создать букмарклет, и мне пришлось столкнуться с этой проблемой, которую я только смог выяснить:

Задан 18 Aug 2014, 22:52 от Steven Lu
  • 11 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

 - мне кажется, это самое чистое решение. Чтобы поставить верхний индекс символа (R), просто передайте строку «®» в этот метод, откуда бы вы его ни вызывали.

я проблема с отображением зарегистрированного символа в виде верхнего индекса. Я использовал значение Юникода \ u00AE, но оно показывается в той же строке. Я хотел бы, чтобы это было немного сверху оставшихся текстов. Завершил поиск в Google, но ...

Задан 31 May 2011, 14:29 от illuminatus
  • 11 голосов
  • 5 ответов
  • 0 просмотров
5 ответов

Чтобы добиться этого, это минимальный рабочий пример:

ожу в новом стандарте C ++ 2.11 Identifiers [lex.name] identifier: identifier-nondigit identifier identifier-nondigit identifier digit identifier-nondigit: nondigit universal-character-name other implementation-defined characterс ...

Задан 15 Apr 2011, 12:49 от towi
  • 58 голосов
  • 12 ответов
  • 0 просмотров
12 ответов

Простой способ удалить акценты из строки Unicode? [Дубликат]

На этот вопрос уже есть ответ: Есть ли способ избавиться от ударений и преобразовать целую строку в обычные буквы? [/questions/3322152/is-there-a-way-to-get-rid-of-accents-and-convert-a-whole-string-to-regular-lette] 10 ответов Я хочу изменить ...

Задан 03 Mar 2013, 20:46 от Rob
  • 0 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Unicode и кодировка для персидского или арабского языка в Python3

некоторый кусок кода как это: city_name = obj['city_from']['name'].encode('utf-8') print(city_name)Выход из этого кода: b'\xd8\xa8\xd9\x86\xd8\xaf\xd8\xb1\xd8\xb9\xd8\xa8\xd8\xa7\xd8\xb3'и если я удаляю кодирование ('utf-8'), выходные данные ...

Задан 20 Mar 2014, 18:58 от Alireza David
  • 36 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

Если в файле есть не только байты <= 0x0F (после спецификации), чтобы убедиться, что он правильно закодирован в UTF-8, вам нужно будет проверить правильность последовательностей и - даже если все последовательности действительны - проверить также, если каждый кодовая точка из последовательности использует самую короткую из возможных последовательностей и также проверяет, не существует ли кодовая точка, которая соответствует высокому или низкому суррогату. Также проверьте, не превышает ли максимальное число байтов последовательности 4, а самая высокая кодовая точка равна 0x10FFFF. Наивысшая кодовая точка ограничивает также биты полезной нагрузки начального байта не более 0x4, а полезная нагрузка первого следующего байта не выше 0xF. Если все упомянутые проверки пройдены успешно, ваша спецификация UTF-8 говорит правду.

ользую фид данных, который недавно добавил заголовок спецификации Unicode (U + FEFF), и моя задача rake теперь испорчена им. Я могу пропустить первые 3 байта сfile.gets[3..-1] но есть ли более элегантный способ чтения файлов в Ruby, который ...

Задан 12 Feb 2009, 20:59 от Andrew Vit
  • 8 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

В Windows, как вы вводите символ вне базовой многоязычной плоскости Unicode?

Я знаю, что Windows поддерживает дополнительные самолеты начиная с Windows XP. У меня есть шрифты, которые, как я знаю, имеют символы вне базовой многоязычной плоскости (BMP). Для этих символов код Unicode состоит из пяти шестнадцатеричных ...

Задан 18 Mar 2012, 02:26 от yam655
  • 198 голосов
  • 6 ответов
  • 0 просмотров
6 ответов

Заменить не-ASCII символы одним пробелом

Мне нужно заменить все не-ASCII (\ x00- \ x7F) символы пробелом. Я&#39;Я удивлен, что это не так просто в Python, если я неЯ что-то упустил. Следующая функци...

Задан 19 Nov 2013, 17:09 от dotancohen
  • 12 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

https://gist.github.com/1282752

отаю с приложением, которое, похоже, стремится вернуть, как мне кажется, двойные строки в кодировке UTF-8.Я отправляю строку

Задан 24 Nov 2010, 12:56 от Morten Siebuhr
  • 3 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

преобразование символов Юникода в R

у меня есть этоMTST столбец, который при печати дает [1] "<U+0391>G<U+03A1><U+0399><U+039D><U+0399><U+039F> " [2] "<U+0391>G<U+03A7><U+0399><U+0391><U+039B><U+039F>S " [3] "<U+0391><U+0399>G<U+0399><U+039D><U+0391> " ...

Задан 22 May 2014, 12:40 от user1834437
  • 96 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

 (Windows) или примите параметр командной строки (если необходимо).

ускаю этот фрагмент дважды в терминале Ubuntu (кодировка установлена ​​в utf-8), один раз с./test.py а затем с./test.py >out.txt: uni = u"\u001A\u0BC3\u1451\U0001D10C" print uniБез перенаправления печатает мусор. С перенаправлением я получаю ...

Задан 28 Dec 2010, 11:24 от zedoo
  • 2 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

я исправляю проблему установки языка. Большое спасибо Гжегож Шпетковски

egexp_replace для Unicode в PostgreSQL я прочитал этоhttp://www.regular-expressions.info/unicode.html [http://www.regular-expressions.info/unicode.html] select regexp_replace('s4y8sds', '\\p{Number}', '')или же select regexp_replace('s4y8sds', ...

Задан 09 Aug 2011, 07:05 от Thessa
  • 43 голосов
  • 11 ответов
  • 0 просмотров
11 ответов

Просто некоторые основные методы для этого (по мотивам инструмента native2ascii):

могу преобразовать международную (например, русскую) строку в\u номера (номера Unicode) например\u041e\u041a заOK ?

Задан 03 Jun 2011, 16:56 от ehsun7b
  • 0 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Веб-страница может лгать о ее кодировке. Выход выглядит как UTF-8. Если у вас есть str в конце, вам нужно будет декодировать его как UTF-8. Если вместо этого у вас есть Unicode, вам нужно сначала кодировать как Latin-1.

ющий код Python использует BeautifulStoneSoup для получения информации API LibraryThing для Толкина "Дети Хурина". import urllib2 from BeautifulSoup import BeautifulStoneSoup URL ...

Задан 09 Mar 2009, 22:47 от Daniel Watkins
  • 2 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Perl латиница-9? Юникод - нужно добавить поддержку

У меня есть приложение, которое расширяется до Великобритании, и мне нужно будет добавить поддержку Юникода Latin-9. Я немного погуглил, но не нашел ничего у...

Задан 14 Jun 2010, 17:56 от Phill Pafford
  • 13 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

 функция. Потребуется преобразовать std :: wstring в std :: string (utf16 в utf8), если вам это нужно и для wstring (что может сделать это довольно дорогим решением, поэтому я ищу себе лучшее решение, если возможно с чистым C ++ (11) означает).

есно, как нормализовать строки (содержащие utf-8 / utf-16) в C / C ++. В .NET есть функцияString.Normalize [http://msdn.microsoft.com/en-us/library/ebza6ck1.aspx] . Я использовал UTF8-CPP в прошлом, но он не предоставляет такой ...

Задан 03 Feb 2011, 10:18 от Ghassen Hamrouni
  • 6 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

Как удалить недопустимые символы Юникода из строк в Java

Я используюАнализатор зависимостей нейронной сети CoreNLP проанализировать некоторые социальные медиа-контента. К сожалению, файл содержит символы, которые, ...

Задан 15 Nov 2015, 16:30 от Yanick Nedderhoff
  • 23 голосов
  • 6 ответов
  • 0 просмотров
6 ответов

эта ссылка

то работаю с текстом utf-8, содержащим такие символы, как: \ Xc2 \ x99 \ Xc2 \ x95 \ Xc2 \ x85 и т.д Эти символы путают другие библиотеки, с которыми я работаю, поэтому их необходимо заменить. Какой эффективный способ сделать это, а ...

Задан 07 Jul 2011, 11:31 от hoju
  • 15 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

 делает) и связать имя поддиапазона с каждой кодовой точкой.

аюсь найти ресурс, который можно использовать для подключения языков (или, скорее, сценариев) к блокам символов Юникода. Такой ресурс будет использоваться для поиска таких вопросов, как "Какие блоки Unicode используются на французском языке?" или ...

Задан 21 Jun 2011, 22:49 от jwl
Page 1 of 32
1 2 3 4 5