Лучшие unicode вопросы ИТ разработчиков

  • 32голосов
  • 7ответов
  • 0просмотров

Многобайтовая обрезка в PHP?

По-видимому, нетmb_trim вmb_* family [http://www.php.net/manual/en/book.mbstring.php]поэтому я пытаюсь реализовать один для себя. Я недавно нашел это регулярное выражение в комментарии вphp.net [http://php.net] : /(^\s+)|(\s+$)/uИтак, я ...

ЗаданApr 09, 2012, 3:43 AMотfedericot
  • 40голосов
  • 3ответа
  • 0просмотров

Как кодировать коды символов Unicode в строковом литерале PowerShell?

Как я могу кодировать символ Unicode U + 0048 (H), скажем, в строке PowerShell? В C # я бы просто сделал это:"\u0048", но это не похоже на работу в PowerShell.

ЗаданJan 03, 2017, 8:34 PMотPeter Mortensendan-gph
  • 3голосов
  • 2ответа
  • 0просмотров

fstream :: open () Unicode или не-Ascii символы не работают (с std :: ios :: out) в Windows

В проекте C ++ я хочу открыть файл (fstream::open()) (что, кажется, является серьезной проблемой). Сборка Windows моей программы с треском провалилась. * File "ä" (UTF-8 0xC3 0xA4) std::string s = ...; //Convert s std::fstream f; ...

ЗаданMay 23, 2017, 12:04 PMотCommunitybasic6
  • 32голосов
  • 17ответов
  • 0просмотров

Как интегрировать и использовать Font Awesome с Objective-C или Swift в проекте Xcode?

Поэтому я пытаюсь использовать этот шрифт http://fortawesome.github.com/Font-Awesome/ [http://fortawesome.github.com/Font-Awesome/], Я добавил шрифт в качестве ресурса и поместил его в файл plist. Вот как я его ...

ЗаданJun 16, 2015, 3:57 AMотKing-Wizardadit
  • 12голосов
  • 2ответа
  • 0просмотров

Как конвертировать JavaScript код записи Unicode в UTF-8?

Существует ли инструмент командной строки или онлайн-сервис, который может конвертировать код нотации javascript unicode в utf-8? Например. Я получил этот код JSON, но его трудно редактировать в обычном текстовом редакторе. {"name":"leon ...

ЗаданDec 23, 2014, 2:09 PMотicebatleon
  • 123голосов
  • 12ответов
  • 0просмотров

Преобразование символов, букв Accent в английский алфавит

Проблема в том, что, как вы знаете, есть тысячи персонажейв диаграмме Юникод [http://www.ssec.wisc.edu/~tomw/java/unicode.html]и я хочу преобразовать все подобные символы в буквы английского алфавита. Например, вот несколько конверсий: ҥ->H ...

ЗаданSep 09, 2009, 8:39 AMотAndreas PeterssonAhmetB - Google
  • 7голосов
  • 3ответа
  • 0просмотров

Конвертер хирагана в кандзи

Знаете ли вы, есть ли библиотека на C # или словарь, который мог бы помочь мне перевести хирагану на кандзи? Я знаю, что существует IME для Windows, но я хотел бы полностью настроить дизайн списка кандидатов на иероглифы для данной Хираганы, и ...

ЗаданApr 29, 2012, 11:25 PMотMakotoRodrigue Rens
  • 9голосов
  • 2ответа
  • 0просмотров

Текст на бенгальском языке не отображается в файле Unicode CSV

У меня есть файл Excel на бенгальском языке. Для правильного отображения бенгальского текста мне нужны бенгальские шрифты, установленные на ПК. Я конвертировал файл Excel в CSV с помощью Office 2010. Но он показывает только «?» знаки вместо ...

ЗаданMay 23, 2017, 12:30 PMотCommunityIstiaque Ahmed
  • 2голос
  • 1ответ
  • 0просмотров

Как преобразовать текст в кодировку Unicode, например, с помощью php?

EDIT 2:Я хотел бы преобразовать английские слова в числа Unicode, используя php5, и затем выдается как \ u * * * *, где * * * * - номер Unicode. В своем первоначальном вопросе я ошибочно подумал, что \ u является стандартом для кодирования ...

ЗаданMay 23, 2017, 11:57 AMотCommunityTryHarder
  • 1голос
  • 1ответ
  • 0просмотров

Unicode проблема с PHP

я использовалdirscan Функция php для получения массива имени файла, она возвращает массив следующим образом: [8] => ?????? ?????.js [9] => ???????? ????? ??? ?????.js [10] => ???????? ???????????? ????????.js [11] => ?????????? ???.js [12] => A ...

ЗаданJun 20, 2012, 1:31 PMотPHPst
  • 233голосов
  • 4ответа
  • 0просмотров

SyntaxError: не-ASCII символ '\ xa3' в файле, когда функция возвращает '£'

Скажем, у меня есть функция: def NewFunction(): return '£'Я хочу напечатать кое-что со знаком решетки перед ним, и это выдает ошибку, когда я пытаюсь запустить эту программу, это сообщение об ошибке отображается: SyntaxError: Non-ASCII ...

ЗаданSep 30, 2014, 1:00 AMотhichris123SNIFFER_dog
  • 4голос
  • 1ответ
  • 0просмотров

Python TypeError: ожидал символьный буферный объект, личное недопонимание

я застрял в этой ошибке в течение длительного времени: TypeError: expected a character buffer objectя просто понимаю, что неправильно понял, это что-то вроде разницы между строкой Unicode и «простой». Строка, я пытался использовать приведенный ...

ЗаданApr 30, 2012, 2:41 PMотuser1340802
  • 7голосов
  • 2ответа
  • 0просмотров

Какая кодировка ожидается для исходного кода Node.js?

Я провел несколько поисков в Google, но получил результаты, связанные с кодировкой строк или файлов. Могу яwriteмой исходный код JavaScript Node.js в UTF-8? Могу ли я использовать не-ASCII символы в комментариях, строках или в качестве имен ...

ЗаданApr 12, 2012, 2:02 PMотNate
  • 29голосов
  • 7ответов
  • 0просмотров

Почему неразрывный пробел не является пробельным символом в Java?

При поиске подходящего способа обрезать неразрывный пробел из проанализированного HTML, я впервые наткнулся на спартанское определение java:String.trim() что по крайней мере правильно задокументировано. Я хотел избежать явного перечисления ...

ЗаданJun 29, 2009, 9:33 PMотPalimondo
  • 5голос
  • 1ответ
  • 0просмотров

Как смоделировать «нажатие клавиши» Unicode Char в Mac Os X с помощью Objective-C?

Я хочу смоделировать символ Unicode в Mac OS X для отправки в приложение Foreground. Я имею в виду, что у меня есть символ Unicode (может содержать арабский, китайский и т. Д.), Например & apos; a '; и я хочу ввести это. Обратите внимание, что я ...

ЗаданApr 16, 2012, 6:59 PMотPeyman
  • 9голосов
  • 5ответов
  • 0просмотров

Вывод файла UTF-8 в R

Я использую R 2.15.0 в Windows 7 64-bit. Я хотел бы вывести текст Unicode (CJK) в файл. В следующем коде показано, как символ Unicode, отправляемый для записи в файловое соединение UTF-8, не работает так, как ожидалось (I): rty <- ...

ЗаданMay 21, 2012, 2:52 AMотPatrick
  • 31голосов
  • 8ответов
  • 0просмотров

Очистить файлы исходного кода от невидимых символов

У меня странная проблема: где-то в моем коде HTML / PHP есть скрытый, невидимый символ, от которого я, похоже, не могу избавиться. Скопировав его из Firebug и преобразовав его, я идентифицировал его как&#xFEFF; или «пространство без разрывов с ...

ЗаданJul 01, 2009, 7:30 AMотdeceze
  • 101голосов
  • 5ответов
  • 0просмотров

Использование awk для удаления метки порядка байтов

Как быawk скрипт (предположительно однострочный) для удаленияBOM [https://en.wikipedia.org/wiki/Byte_order_mark]выглядит как? Спецификация: * print every line after the first (NR > 1) * for the first line: If it starts with #FE #FF or #FF ...

ЗаданMar 15, 2017, 7:52 AMотBoldewyn
  • 8голосов
  • 2ответа
  • 0просмотров

boost :: property_tree :: json_parser и двухбайтовые широкие символы

Introduction std::string text = "á";& Quot; & # XE1; & Quot; является двухбайтовым символом (при условии кодировки UTF-8). Итак, следующая строка печатает 2. std::cout << text.size() << "\n";Ноstd::cout по-прежнему печатает ...

ЗаданApr 21, 2012, 4:07 PMотJarosław Gomułka
  • 46голосов
  • 2ответа
  • 0просмотров

urllib2 читать в Юникоде

Мне нужно хранить контент сайта, который может быть на любом языке. И мне нужно иметь возможность искать содержимое строки Unicode. Я пробовал что-то вроде: import urllib2 req = urllib2.urlopen('http://lenta.ru') content = req.read() Контент ...

ЗаданAug 31, 2010, 8:27 PMотkiamlalunoVitaly Babiy
  • 12голосов
  • 2ответа
  • 0просмотров

UTF-16 на cmd.exe

Я "создал каталог" & # x2022; & # x25D8; & # x25AC; & # xA8; & lx; & # x119; & # xF3; & # x142; & # x2665; & # x263A; & # x263B; 0 & Quot; и я хотел бы сделать это видимым с помощью команды dir / b. Пока что команды chcp 10000, chcp 10001 и chcp ...

ЗаданMay 26, 2012, 8:55 AMот0x6B6F77616C74
  • 3голосов
  • 2ответа
  • 0просмотров

Google App Engine TextProperty и UTF-8: когда кодировать / декодировать

Я использую Google App Engine 2.5 с шаблоном Django и рамкой веб-приложения. Db.TextProperty и UTF-8, а также Unicode и Decode / Encode меня сильно смутили. Я был бы очень признателен, если бы некоторые эксперты могли предложить некоторые ...

ЗаданMay 23, 2017, 11:52 AMотCommunitySusan Mayer
  • 24голос
  • 1ответ
  • 0просмотров

Консольный ввод / вывод Unicode в Haskell на Windows

Кажется довольно сложным заставить консольный ввод / вывод работать с символами Юникода в Haskell под окнами. Вот история о горе: 1. (Preliminary.) Before you even consider doing Unicode I/O in the console under windows, you need to make ...

ЗаданMay 23, 2017, 12:13 PMотCommunitycircular-ruin
  • 12голосов
  • 7ответов
  • 0просмотров

Как я могу повторно добавить маркер порядка байтов Юникода в Linux?

У меня довольно большой файл SQL, который начинается с маркера порядка байтов FFFE. Я разбил этот файл с помощью инструмента разбивки linux с поддержкой Unicode на 100 000 строк. Но при передаче их обратно в окна, это делаетnotкак любая из ...

ЗаданJun 25, 2009, 3:31 PMотNeil Trodden
  • 2голосов
  • 2ответа
  • 0просмотров

Проблема со знаком евро при чтении файла RTF с Python

Мне нужно создать документ в RTF с использованием Python и pyRTF, все в порядке: у меня нет проблем с акцентированными буквами, он принимает даже знак евро без ошибок, но вместо€Я получаю этот знак:¤. I encode the strings in this ...

ЗаданJun 06, 2016, 7:50 AMотKeith Hallarpho
  • 4голосов
  • 3ответа
  • 0просмотров

UTF8 имена файлов в PHP и различные кодировки Unicode

У меня есть файл, содержащий символы Unicode на сервере под управлением Linux. Если я подключаюсь к серверу по SSH и использую табуляцию для перехода к файлу / папке, содержащей символы Юникода, у меня нет проблем с доступом к файлу / папке. ...

ЗаданJul 07, 2009, 1:37 AMотiloveitaly
  • 23голосов
  • 3ответа
  • 0просмотров

Цель-C: уничар против чарса

Я немного запутался между уничаром и чарсом. Могу ли я относиться к уникальным символам, подобным символам? Например, могу ли я сделать это: -(BOOL)isNewLine:(unichar)c { if(c == '\n') return YES; else return NO; }

ЗаданJul 07, 2009, 2:33 PMотLeeMobile
  • 15голосов
  • 4ответа
  • 0просмотров

Как напечатать буквенную строку Unicode в Javascript?

У меня есть массив, содержащий строки со специальными символами Unicode: var a = [ ["a", 33], ["h\u016B", 44], ["s\u00EF", 51], ... ];Когда я зацикливаюсь на этом массиве: for (i=0;i<a.length;i++) { document.write(a[i][0] + "<br />"); }Он ...

ЗаданFeb 10, 2016, 4:06 AMотhippietrailJérôme Verstrynge
  • 79голосов
  • 3ответа
  • 0просмотров

Что «не так» с C ++ wchar_t и wstrings? Какие есть альтернативы широким символам?

Я видел много людей в сообществе C ++ (особенно ## c ++ на freenode), возмущенных использованиемwstrings а такжеwchar_tИ их использование в Windows API. Что именно "не так"? сwchar_t а такжеwstringи если я хочу поддержать интернационализацию, ...

ЗаданAug 23, 2013, 9:03 AMотST3Ken Li
  • 13голосов
  • 5ответов
  • 0просмотров

Вывод Unicode в командной строке Windows?

Я написал небольшое Java-приложение, вывод которого включает символы Unicode. Когда я использую Eclipse для его запуска, я вижу все результаты, как и ожидалось. Люди, которые должны использовать приложение, будут запускать его как файл jar. Я ...

ЗаданFeb 18, 2014, 6:23 PMотKeith PinsonDikla
  • 13голосов
  • 2ответа
  • 0просмотров

Юникод в javadoc и комментарии?

Некоторые компиляторы не работают с не-ASCII символами в JavaDoc и комментариях к исходному коду. Каковы текущие (Java 7) и будущие (Java 8 и более поздние) практики в отношении Unicode в исходных файлах Java? Есть ли различия между IcedTea, ...

ЗаданApr 28, 2012, 7:56 PMотchoopEgon Willighagen
  • 4голосов
  • 4ответа
  • 0просмотров

Тип данных Unicode в SQL

Я новичок в Microsoft SQL. Я планирую сохранить текст на сервере Microsoft SQL, и в нем будут специальные международные символы. Есть ли «Тип данных»? специфично для Unicode или я лучше кодирую свой текст со ссылкой на номер Unicode (т.е. \ u0056)

ЗаданJan 22, 2013, 5:57 PMотLéon Pelletier
  • 14голос
  • 1ответ
  • 0просмотров

Какой API для создания PDF (Java) поддерживает шрифт Gujarati?

Я пробовал iText, PDFBox & amp; Формы Oracle. И я также преуспел в случае с iText для создания PDF документа на гуджарати. Но, к сожалению, он не генерирует правильный шрифт на языке гуджарати (UTF-8). У меня есть проект в JDK 1.4 & amp; это ...

ЗаданMay 14, 2012, 10:32 AMотSarang
  • 93голосов
  • 11ответов
  • 0просмотров

Как отсортировать строки Юникода в алфавитном порядке в Python?

Python сортирует по байтовым значениям по умолчанию, что означает & # xE9; приходит после z и других не менее забавных вещей. Каков наилучший способ сортировки по алфавиту в Python? Есть ли библиотека для этого? Я ничего не смог найти. ...

ЗаданFeb 14, 2011, 4:00 PMотGeorg SchöllyLennart Regebro
  • 4голосов
  • 4ответа
  • 0просмотров

Какая кодировка символов лучше всего подходит для японского языка для отображения в БД, php и html?

я просто хочу знать о переводе языка для японцев, 1) Какая кодировка является лучшей для базы данных mysql 2) Какие / как я могу напечатать это на HTML-странице. ? заранее спасибо.

ЗаданApr 29, 2012, 5:43 PMотMakotocoderex
  • 14голосов
  • 4ответа
  • 0просмотров

Как передать символы Юникода в виде JSP / сервлета request.getParameter?

После многих проб и ошибок я все еще не могу понять проблему. JSP, сервлет и база данных настроены на прием кодировки UTF-8, но даже в тех случаях, когда я использую request.getParameter для всего, что имеет любые двухбайтовые символы, такие как ...

ЗаданJul 07, 2016, 12:59 PMотBalusC
  • 172голосов
  • 12ответов
  • 0просмотров

Python: удаление \ xa0 из строки?

В настоящее время я использую Beautiful Soup для разбора файла HTML и вызоваget_text(), но мне кажется, что у меня осталось \ xa0 Unicode, представляющее пробелы. Есть ли эффективный способ удалить их все в Python 2.7 и заменить их пробелами? Я ...

ЗаданSep 09, 2013, 6:50 AMотddazhuyxn
  • 23голосов
  • 3ответа
  • 0просмотров

Как отобразить эмодзи в HTML

Я сохранил лицо "смакуя вкусную еду смайликов" в базу данных и прочитайте его в php json_encode, который показывает & quot; uD83D \ uDE0B & quot; & # x3002; но обычно мы используем один<img /> этикетка, чтобы заменить это. однако обычно я просто ...

ЗаданJul 11, 2012, 3:06 PMотSergey K.jason_luo
  • 5голосов
  • 2ответа
  • 0просмотров

MySQL регистро-независимый, но чувствительный к акценту UTF8 уникальный ключ

Я знаю, что есть много похожих вопросов по SF, но я думаю, что у меня достаточно разных вопросов, чтобы оправдать новый вопрос. У меня есть таблица, которая имеет один столбец как utf8 с utf8_unicode_ci. У этого также есть уникальный ключ на этом ...

ЗаданJun 12, 2012, 10:13 PMотEli
  • 5голосов
  • 4ответа
  • 0просмотров

PHP найти Emoji [обновить существующий код]

Я пытаюсь обнаружить смайлики в своем php-коде и запретить пользователям входить в него. Код у меня есть: if(preg_match('/\xEE[\x80-\xBF][\x80-\xBF]|\xEF[\x81-\x83][\x80-\xBF]/', $value) > 0) { //warning... }Но это не работает для всех ...

ЗаданMay 12, 2012, 5:44 PMотLi-aung YipKukosk
  • 95голосов
  • 16ответов
  • 0просмотров

UnicodeDecodeError: кодек «ascii» не может декодировать байт 0xef в позиции 1

У меня есть несколько проблем при попытке закодировать строку в UTF-8. Я пробовал множество вещей, включая использованиеstring.encode('utf-8') а такжеunicode(string), но я получаю ошибку: > UnicodeDecodeError: 'ascii' codec can't decode byte ...

ЗаданDec 04, 2014, 4:34 PMотRubens MariuzzoMarkum
  • 7голосов
  • 2ответа
  • 0просмотров

UTF8 рабочий процесс PHP, MySQL подытожил [закрыто]

Я работаю для международных клиентов, у которых все очень разные алфавиты, и поэтому я пытаюсь наконец получить представление о полном рабочем процессе между PHP и MySQL, который обеспечил бы правильную вставку всех кодировок символов. Я прочитал ...

ЗаданJun 13, 2012, 12:25 PMотDominik
  • 36голосов
  • 8ответов
  • 0просмотров

Javascript RegExp + границы слов + символы Юникода

Я строю поиск, и я собираюсь использовать автозаполнение JavaScript с ним. Я из Финляндии (финский язык), поэтому мне приходится иметь дело с некоторыми специальными символами, такими как & # xE4 ;, & # xF6; и & # xE5; Когда пользователь вводит ...

ЗаданMay 14, 2012, 7:50 PMотuser1394520
Пред12...13След