Лучшие python-unicode вопросы ИТ разработчиков

  • 7 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Python, конвертируйте 4-байтовый символ, чтобы избежать ошибки MySQL «Неверное строковое значение:»

Мне нужно преобразовать (в Python) 4-байтовый символ в какой-то другой символ. Это для того, чтобы вставить его в мою базу данных utf-8 mysql без ошибки, так...

Задан 28 Sep 2012, 06:38 от user984003
  • 7 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Open () и codecs.open () в Python 2.7 ведут себя странно по-разному

У меня есть текстовый файл с первой строкой символов Unicode и всех других строк в ASCII. Я пытаюсь прочитать первую строку как одну переменную, а все остальные строки как другую. Тем не менее, когда я использую следующий код: # -*- coding: ...

Задан 21 Apr 2013, 12:04 от Kriattiffer
  • 7 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Python, конвертируйте 4-байтовый символ, чтобы избежать ошибки MySQL «Неверное строковое значение:»

Мне нужно преобразовать (в Python) 4-байтовый символ в какой-то другой символ. Это делается для того, чтобы вставить его в мою базу данных utf-8 mysql без по...

Задан 23 May 2017, 12:10 от Communityuser984003
  • 17 голосов
  • 6 ответов
  • 0 просмотров
6 ответов

UnicodeDecodeError: (кодек 'utf-8') при чтении CSV-файла [дубликат]

На этот вопрос уже есть ответ здесь:UnicodeDecodeError при чтении CSV-файла в Pandas с Python 9 ответовя пытаюсь прочитать csv, чтобы создать фрейм данных - ...

Задан 20 Nov 2015, 05:22 от Satya
  • 107 голосов
  • 7 ответов
  • 0 просмотров
7 ответов

Python - кодек 'ascii' не может декодировать байт

Я действительно смущен. Я пытался закодировать, но ошибка сказалаcan't decode.... >>> "你好".encode("utf8") Traceback (most recent call last): File "<stdin>", line 1, in <module> UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4 in position ...

Задан 10 Mar 2012, 05:10 от thoslin
  • 20 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Python 2.7 строчные

Когда я использую.lower() в Python 2.7 строка не преобразуется в строчные буквыŠČŽ, Я читаю данные из словаря. Я пытался с помощьюstr(tt["code"]).lower(), tt["code"].lower(). Какие-либо предложения ?

Задан 30 Mar 2012, 12:41 от Yebach
  • 1092 голосов
  • 24 ответа
  • 0 просмотров
24 ответа

UnicodeEncodeError: кодек 'ascii' не может кодировать символ u '\ xa0' в позиции 20: порядковый номер не в диапазоне (128)

У меня проблемы с работой символов юникода из текста, полученного с разных веб-страниц (на разных сайтах). Я использую BeautifulSoup. Проблема в том, что ошибка не всегда воспроизводима; иногда он работает с некоторыми страницами, а иногда он ...

Задан 30 Mar 2012, 12:06 от Homunculus Reticulli
  • 1 голос
  • 3 ответа
  • 0 просмотров
3 ответа

Вот

ел бы перебрать строку и вывести все смайлики. Я пытаюсь перебрать символы и сравнить их ссписок смайликов [https://raw.githubusercontent.com/vincentmwong/emoji_list/master/emoji_list/__init__.py] . Тем не менее, Python, кажется, разбивает ...

Задан 12 Oct 2017, 14:13 от Vinicius Fortuna
  • 6 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

UnicodeDecodeError: кодек «utf8» не может декодировать байт 0x80 в позиции 3131: недопустимый начальный байт

Я пытаюсь прочитать данные Twitter из файла JSON с помощью Python 2.7.12.Код, который я использовал, такой:

Задан 22 Jul 2016, 04:11 от wannabhappy
  • 36 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Удаление Unicode \ u2026 как символы в строке в python2.7

У меня есть строка в Python2.7, как это, This is some \u03c0 text that has to be cleaned\u2026! it\u0027s annoying!Как мне преобразовать это в это, This is some text that has to be cleaned! its annoying!

Задан 10 Mar 2013, 10:17 от Sandeep Raju Prabhakar
  • 12 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

), а затем с помощью quote_plus. Это должно сделать.

я есть строка Unicode, как'%C3%A7%C3%B6asd+fjkls%25asd' и я хочу расшифровать эту строку. я использовалurllib.unquote_plus(str) но это работает неправильно. ожидается:çöasd+fjkls%asdрезультат:çöasd fjkls%asdдвойные символы utf-8 (%C3%A7 а ...

Задан 28 Feb 2011, 07:29 от user637287
  • 3 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Pytesseract: UnicodeDecodeError: кодек 'charmap' не может декодировать байт

Я запускаю большое количество OCR на скриншотах с Pytesseract. Это работает хорошо в большинстве случаев, но небольшое количество вызывает эту ошибку:

Задан 03 Oct 2015, 21:24 от Nickpick
  • 4 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

Python для показа специальных символов

Я знаю, что есть множество тем по этой проблеме, но мне не удалось найти ту, которая решает мою проблему. Я пытаюсь напечатать строку, но при печати на ней не отображаются специальные символы (например, æ, ø, å, ö и ü). Когда я печатаю строку, ...

Задан 02 Apr 2012, 09:21 от simonbs
  • 1 голос
  • 0 ответов
  • 0 просмотров
0 ответов

Вывести строку в кодировке Юникод в консоль ОК, но не удается при перенаправлении в файл Как исправить?

У меня есть Python 2.7.1 на упрощенной китайской версии Windows XP, и у меня есть такая программа (windows_prn_utf8.py): #!/usr/bin/env python # -*- coding: utf8 -*- print unicode('\xE7\x94\xB5', 'utf8')Если я запускаю его на консоли Windows ...

Задан 29 Jul 2013, 07:57 от Jimm Chen
  • 0 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Python2 имеет байты и строку в виде знака без знака и юникод как UCS-2 (поэтому кодовые точки выше 65535 будут кодироваться с 2 символами (UCS2) в Python2 и только одним символом (UTF-32) в Python3)

, где и как Python неявно применяет кодирование к строкам или неявное транскодирование (преобразование)? И каковы эти кодировки по умолчанию (т.е. подразумеваемые)? Например, каковы кодировки: строковых литералов? s = "Byte string with ...

Задан 24 Apr 2018, 00:49 от ivan_pozdeev
  • 9 голосов
  • 5 ответов
  • 0 просмотров
5 ответов

Как записать русские символы в файл?

В консоли, когда я пытаюсь вывести русские символы Это дает мне ???????????????Кто знает почему?Я пытался записать в файл - в этом случае та же ситуация.напр...

Задан 07 Jul 2010, 20:59 от Pol