Вопрос по ascii, unicode – Что такое код символа ASCII для '-'?
Я работаю над расшифровкой текста. Я пытаюсь найти код символа для—
символ, чтобы не быть принятым за-
, в ASCII. Я пытался безуспешно. Кто-нибудь знает, как его конвертировать?
mdash
обозначен номером 151.
raina77ow
Когда фактическая тире em недоступна, как в наборе символов ASCII, используется двойной ("-") или тройной дефис-минус ("---"). В Юникоде символом тире является U + 2014 (десятичное 8212).
Em тире не является частью набора символов ASCII.
char check = s.charAt(0)
, когда s =—
, что я получу? Вы говорите, что если я сделаюint check = s.charAt(0)
Я получу 8212?
Adam Sh
s = '\u2014'
thomasrutter
—
известен как Em Dash. Это код символа\u2014
. Это не символ ASCII, поэтому вы не можете декодировать его с помощью набора символов ASCII, потому что его нет в таблице символов ASCII. Возможно, вы захотите использовать вместо него UTF8.
\u2014
как вы сказали
thomasrutter
—
не является частью набора ASCII.
Но если вы хотите конвертировать его в другой формат (например, U + hex), вы можете использоватьэт онлайн инструмент. Поместите своего персонажа в первое зеленое поле и нажмите «Преобразовать» (над полем)
далее вы найдете несколько различных кодов, включая U + шестнадцатеричный:
U+2014
Не стесняйтесь редактировать этот ответ, если ссылка не работает или оставьте комментарий, чтобы я мог найти замену.
но только в Unicode, обычно кодируется UTF-8.
В UTF-8 символы кодируются 2- или 3-байтовыми последовательностями (или иногда более длинными), где ни один из двух или трех байтов не является допустимым кодом ASCII, где все они находятся вне диапазона ASCII от 0 до 127 .
Один подозревает, что вышесказанное лишь частично отвечает на ваш вопрос, но если это так, то это, вероятно, потому, что ваш вопрос, случайно, только частично задан. Для получения более подробной информации вы можете расширить свой вопрос с более подробной информацией.