Лучшие utf-8 вопросы ИТ разработчиков

  • 6 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

Конвертировать Unicode из строки JSON с PHP

Я читал о нескольких решениях, но пока не смог заставить что-либо работать. У меня есть строка JSON, которую я прочитал из вызова API, и она содержит символы Unicode -\u00c2\u00a3 например, символ £. Я хотел бы использовать PHP, чтобы ...

Задан 25 Jan 2013, 14:30 от Alex Holsgrove
  • 20 голосов
  • 5 ответов
  • 0 просмотров
5 ответов

Естественный алгоритм сортировки в PHP с поддержкой Unicode?

Можно ли отсортировать массив с символами Unicode / UTF-8 в PHP, используя алгоритм естественного порядка? Например (порядок в этом массиве правильно упорядочен): $array = array ( 0 => 'Agile', 1 => 'Ágile', 2 => 'Àgile', 3 => 'Âgile', 4 ...

Задан 07 May 2009, 03:02 от Alix Axel
  • 8 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

@dirkgently Я пытаюсь заставить пакет работать с VC08, g ++ и позже с icc. Это заставляет меня придерживаться стандарта. Это помогло мне обнаружить некоторые ошибки, которые компиляторы не обнаружили. Некоторые были обнаружены g ++, а другие - VC08.

ел, что C ++ 0x добавит поддержку литералов UTF-8, UTF-16 и UTF-32. Но как насчет преобразований между тремя представлениями? Я планирую использовать std :: wstring везде в моем коде. Но мне также нужно манипулировать данными в кодировке UTF-8 ...

Задан 07 Mar 2009, 10:25 от chmike
  • 319 голосов
  • 9 ответов
  • 0 просмотров
9 ответов

Сохранение текстов utf-8 в json.dumps как UTF8, а не как escape-последовательность

образец кода: >>> import json >>> json_string = json.dumps("ברי צקלה") >>> print json_string "\u05d1\u05e8\u05d9 \u05e6\u05e7\u05dc\u05d4"Проблема: она не читается человеком. Мои (умные) пользователи хотят проверять или даже ...

Задан 20 Aug 2013, 14:18 от Berry Tsakala
  • 5 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Php тело письма расшифровывается в обычный

Я связываю извлечение некоторого контента из нескольких одинаковых писем с помощью php, но не могу. С этим: $body = imap_body($imap_o, $email_n);Я получил: Pour = le r=E9cup=E9rer, il suffit de le t=E9l=E9charger, de le r=E9ceptionner puis de ...

Задан 29 Jun 2013, 18:19 от ganlub
  • 13 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

В oracle, как мне изменить сеанс для отображения UTF8?

Я не могу понять, зашифрованный синтаксис Oracle для моей жизни. Это Oracle 10g Моя сессия NLS_LANGUAGE в настоящее время по умолчанию AMERICAN. Мне нужно иметь возможность отображать символы UTF8. Ниже приведены некоторые из моих попыток, все ...

Задан 04 Jan 2010, 10:44 от Aaron Fi
  • 42 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Попробуйте еще раз! : О)

я есть куча файлов, которые не в кодировке UTF-8, и я конвертирую сайт в кодировку UTF-8. Я использую простой скрипт для файлов, которые я хочу сохранить в utf-8, но файлы сохраняются в старой кодировке: header('Content-type: text/html; ...

Задан 29 Jan 2011, 21:01 от Starmaster
  • 0 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Как установить кодировку по умолчанию для консоли Windows на UTF-8

Как следует из заголовка, щелкните правой кнопкой мыши заголовок окна и укажите только кодировки 436 и 937м китаец, так что прости мой ломаный английский), е...

Задан 18 Mar 2013, 04:26 от Narcotics
  • 0 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Как установить кодировку по умолчанию для консоли Windows на UTF-8

Как следует из заголовка, щелкните правой кнопкой мыши заголовок окна и укажите только кодировки 436 и 937 (я китаец, так что простите мой ломаный английский), есть ли способ добавить «UTF-8» или «65001» к опциям? Ввод chcp.com 65001 каждый раз ...

Задан 18 Mar 2013, 05:26 от Narcotics
  • 10 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

(Spring + JSP + jQuery-AJAX + JSON) настройка среды для проблемы UTF-8?

Я делаюchat project вjava с участиемSpring 3.x который нуждаетсяMulti-language support. Вот что я сделал. Мой JSP имеет: <%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"%> ...

Задан 02 Jul 2013, 09:11 от Human Being
  • 0 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Нарушение ограничения целостности: 1062 Повторяющаяся запись для сортировки utf8_unicode_ci

У меня есть таблица с именем тега с уникальным ограничением на столбец имени: CREATE TABLE `tag` ( `id` int(11) NOT NULL AUTO_INCREMENT, `name` varchar(255) COLLATE utf8_unicode_ci NOT NULL, PRIMARY KEY (`id`), UNIQUE KEY `UNIQ_389B7835E237E06` ...

Задан 07 Jun 2013, 22:54 от Michael Thessel
  • 14 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

Как я могу отфильтровать символы Emoji из моего ввода, чтобы я мог сохранить в MySQL <5.5?

У меня есть приложение Django, которое берет данные твитов из API Twitter и сохраняет их в базе данных MySQL. Насколько я знаю (я до сих пор разбираюсь в тонкостях кодирования символов), я использую UTF-8 везде, включая кодирование ...

Задан 05 Dec 2012, 18:08 от BigglesZX
  • 16 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Рад, что смог помочь тебе. До свидания :)

в Google просто находит инструкции по переходу с одного формата на другой, но я не могу найти, как именно удостовериться, какой из них у меня первый. Как я могу: Проверьте, какая кодировка символов в таблице?Проверьте, какой механизм ...

Задан 23 May 2011, 22:07 от GeekedOut
  • -2 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Как реализовать формат UTF-8 в приложении Swing?

В моем приложении чата Swing у меня есть кнопка отправки, одна текстовая область и текстовое поле. Если я нажимаю кнопку «Отправить», мне нужно отправить текст из текстового поля в текстовую область. Он отлично работает на английском, но не на ...

Задан 10 Dec 2012, 15:38 от Human Being
  • 25 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

не беспокойтесь - я был просто озадачен :)

я есть большой CSV-файл, который я собираюсь загрузить в таблицу MySQL. Однако эти данные кодируются в формате utf-8, потому что они содержат некоторые неанглийские символы. Я уже установил набор символов соответствующего столбца в таблице в ...

Задан 10 Feb 2011, 13:51 от Hossein
  • 13 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Я попытался запустить \ encoding UTF8 в psql, но выдает ошибку как 'UTF8: неверное имя кодировки или процедура преобразования не найдена

аю CSV-файл в моем сценарии SQL и копирую его данные в таблицу Postgre SQL. Строка кода ниже:

Задан 09 Feb 2017, 06:52 от Sahil Doshi
  • 1 голос
  • 1 ответ
  • 0 просмотров
1 ответ

используйте CP1251 от 'греческого charset'

аюсь создать скрипт на PHP для конвертации некоторых файлов в UTF-8. У меня есть файл на греческом языке, где Notepad ++ указывает, что это кодировка "ANSI". Когда я загружаю его на сервер, он определяет его кодировку как UTF-8 (что-то не так, ...

Задан 25 Jun 2011, 23:16 от Paris
  • 11 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

Python получить код символа в другой кодировке?

Учитывая код символа как целое число в одной кодировке, как вы можете получить код символа, скажем, в utf-8 и снова как целое число?

Задан 22 Dec 2011, 07:16 от user975135
  • 55 голосов
  • 6 ответов
  • 0 просмотров
6 ответов

Преобразование UTF-8 с спецификацией в UTF-8 без спецификации в Python

Два вопроса здесь. У меня есть набор файлов, которые обычно UTF-8 с спецификацией. Я хотел бы преобразовать их (в идеале на месте) в UTF-8 без спецификации. Кажется, чтоcodecs.StreamRecoder(stream, encode, decode, Reader, Writer, errors) бы ...

Задан 17 Jan 2012, 16:37 от timpone
  • 15 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

 это известная ошибка в Perl.

у создать модуль для собственного использования по умолчанию, например: use My::perldefs;со следующим содержанием(в основном на ...

Задан 20 Jun 2011, 14:29 от jm666
  • 32 голосов
  • 9 ответов
  • 0 просмотров
9 ответов

Что такое многобайтовый набор символов?

Относится ли термин многобайтовый к кодировке, чьи символы могут - но не обязательно должны быть - шире, чем 1 байт (например, UTF-8), или он относится к наборам символов, которые в любом случае шире, чем 1 байт (например, UTF)? -16) Другими ...

Задан 14 Apr 2009, 19:17 от prinzdezibel
  • 2 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

R, Windows и символы иностранных языков

Это была давняя проблема с R:он может читать нелатинские символы в Unix, но я не могу читать их в Windows, Я воспроизводил эту программу на нескольких англоя...

Задан 23 Nov 2015, 23:53 от user27636
  • 2 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

 или же

Задан 02 Feb 2017, 21:25 от Joe Caraccio
  • 57 голосов
  • 10 ответов
  • 0 просмотров
10 ответов

результат чувствителен к регистру, но не чувствителен к акценту.

я есть таблица MySQL с общей сортировкой utf8. В таблице я вижу две записи: плохой плохой Я использую запрос, который выглядит следующим образом: SELECT * FROM `words` WHERE `word` = 'abád'Результат запроса дает оба слова: плохой плохой Есть ...

Задан 01 Feb 2009, 13:42 от 2 revs
  • 5 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

работает нормально ...

аюсь вставить символы хинди в массив с такими элементами, как String[] arr = {"आपका स्वागत है","आपका स्वागत है"}; но это дает ошибку, т.е. "some characters cannot be mapped using "Cp1252" character encoding" сохраняя это.

Задан 02 May 2011, 13:07 от Gkapoor
  • 0 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Как избежать нежелательных / мусорных символов при чтении данных с нескольких языков?

Я анализирую новостные ленты RSS более чем на 10 разных языках.Весь синтаксический анализ выполняется в java, и данные хранятся в MySQL до того, как мой API,...

Задан 26 Apr 2015, 17:41 от HIRA THAKUR
  • 17 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

В чем разница между «utf8_unicode_ci» и «utf8_unicode_520_ci»

Я недавно обновил WAMPServer и теперь в phpMyAdmin я вижу оба сопоставленияutf8_unicode_ci а такжеutf8_unicode_520_ci, Я использовал "utf8_unicode_ci" для турецких приложений, но мне интересно, что отличается в новом*_520 сверка?

Задан 19 Sep 2013, 21:04 от jeff
  • 7 голосов
  • 5 ответов
  • 0 просмотров
5 ответов

перейдите к файлу и попробуйте (сохранить AS), и вы можете по умолчанию увидеть кодировку файла. (В каком формате кодирования он сохраняется)

ыло интересно, как окна интерпретируют символы, например: Я сделал файл с Hexeditor с 3 байтамиE3 81 81, Эти байты являются"ぁ" символ в кодировке UTF-8. Я открываю блокнот, и он отображает"ぁ" Я не указал кодировку файла, я просто создал байты. ...

Задан 20 Jul 2011, 22:28 от nEAnnam
  • 9 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Internet Explorer не отображает китайские символы из URL

Я работаю над требованием отображать (делать читабельными) символы из URL.Когда я использую Google Chrome, он отображает параметры на китайском языке, даже е...

Задан 09 Jan 2013, 21:17 от user1532449
  • 4 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Вы можете преобразовать этот результат в строку Unicode, используя

жный дубликат: кодирование / декодирование строки [https://stackoverflow.com/questions/4896194/string-encode-decode] Теперь тема выглядит так: =? UTF-8? B? 0J / RgNC + 0LLQtdGA0LrQsA ==? =

Задан 10 Mar 2011, 12:27 от anton
  • 0 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Unicode символ Visual C ++

Я пытаюсь заставить мою программу работать с символами Юникода. Я использую Visual Studio 2010 на компьютере с Windows 7 x32. Я хочу напечатать символ королевы ("\ ul2655"), и он просто не работает. Я установил свое решение для использования ...

Задан 23 Oct 2013, 17:40 от Robert Lucian Chiriac
  • 12 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

Как идентифицировать / удалить символы не-UTF-8 в R

Когда я импортирую набор данных Stata в R (используя сторонний пакет), импорт иногда содержит символы, которые не являются допустимыми UTF-8. Само по себе это достаточно неприятно, но оно ломает все, как только я пытаюсь преобразовать объект в ...

Задан 25 Jun 2013, 07:13 от Marcel Hebing
  • 5 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

Как прочитать файл в кодировке UTF-8, содержащий китайские символы, и правильно вывести их на консоль?

Я пишу сканер для поиска некоторых китайских веб-файлов. Извлеченные файлы кодируются в utf-8. И мне нужно прочитать этот файл, чтобы разобраться, например, извлечь URL и китайские иероглифы. Но я обнаружил, что когда я читал файл в переменную ...

Задан 25 Nov 2013, 14:13 от Bruce Yang
  • 2 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Как лучше всего справиться с 16-битным безобразием wchar_t в Windows?

Я пишу слой-обертку для использования с mingw, который предоставляет приложению виртуальную среду UTF-8. Функции, которые имеют дело с именами файлов, являют...

Задан 12 Jul 2010, 13:11 от R..
  • 13 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

UTF-8 безопасный эквивалент ord или charCodeAt () в PHP

Мне нужно иметь возможность использовать ord (), чтобы получить то же значение, что и функция charCodeAt () javascript. Проблема состоит в том, что ord () не...

Задан 27 Jun 2018, 10:05 от nwellnhofRila
  • 5 голосов
  • 6 ответов
  • 0 просмотров
6 ответов

Проблема кодирования (UTF-8) в PHP

Я хочу вывести следующую строку в PHP: &#246; &#252; &#223; €Следовательно, я&#39;мы закодировали его в utf8 вручную: &#195;¶ &#195;&#188; А.Я. &#194; €Итак,...

Задан 07 Sep 2009, 08:16 от caw
  • 7 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Как я могу преобразовать входной файл в кодировку UTF-8 в Perl?

Я уже знаю, как преобразовывать содержимое строки за строкой в кодировке не utf8 в кодировку UTF-8, используя что-то вроде следующего кода: # outfile.txt is in GB-2312 encode open my $filter,"<",'c:/outfile.txt'; while(<$filter>){ #convert each ...

Задан 23 Oct 2009, 09:08 от Mike
  • 3 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Как бороться с буферизованными строками из C в Swift?

Я работаю с синтаксическим анализатором libxml2 для чтения больших XML-файлов. Большинству обработчиков обратного вызова предоставляется указатель на символ ...

Задан 19 Dec 2015, 15:33 от bouke
Page 1 of 23
1 2 3 4 5