Вопрос по excel, unicode, internationalization, mysql – Текст на бенгальском языке не отображается в файле Unicode CSV

9

У меня есть файл Excel на бенгальском языке. Для правильного отображения бенгальского текста мне нужны бенгальские шрифты, установленные на ПК.

Я конвертировал файл Excel в CSV с помощью Office 2010. Но он показывает только «?» знаки вместо бенгальских персонажей. Затем я использовал Документы Google для преобразования, с той же проблемой, но с нечитаемыми символами, а не с "." Я вставил выдержки из этого файла в файл HTML и попытался просмотреть его в своем браузере безуспешно.

Что я должен сделать, чтобы получить файл CSV из файла .xlsx на бенгали, чтобы я мог импортировать его в базу данных MySQL?

Edit: Ответ принят вэто ТАК вопрос заставил меня перейти на Google Docs.

Ваш Ответ

2   ответа
0

когда мне нужен CSV-файл с символами Unicode Bangla, и у меня работает следующий метод.

Upload your excel file (with Bangla Unicode character) to Google Drive Now open the uploaded file with Google Sheets From Google Sheets -> File -> Download As Comma-separated values (CSV, Current sheet) The downloaded CSV is the desired CSV with Bangla Unicode characters.

Note: Хотя файл, который я открыл с помощью Excel, показывает символы мусора, но он работал для меня в веб-приложении и показывает правильный символ.

3

По ответам на вопросExcel в CSV с кодировкой UTF8Документы Google должны сохранять CSV правильно, в отличие от Excel, который уничтожает все символы, которые не могут быть представлены в & # x201C; ANSI & # x201D; кодировка используется. Но, может быть, они это изменили, или что-то не так, или анализ ситуации неверен.

Для правильно закодированного Bangla (бенгальский), обработанного в программах MS Office, не должно быть необходимости в каких-либо & # x201C; шрифтах Bangla & # x201D ;, поскольку шрифт Arial Unicode MS (поставляется с Office) содержит символы Bangla. Итак, действительно ли данные находятся в какой-то нестандартной кодировке, основанной на специально закодированном шрифте? В этом случае его сначала следует преобразовать в Unicode, хотя, возможно, каким-то образом им можно управлять с помощью программ, которые последовательно используют этот конкретный шрифт.

В Excel при использовании функции «Сохранить как» вы можете выбрать & # x201C; текст Unicode (* .txt) & # x201D ;. Он сохраняет данные в виде TSV (значения, разделенные табуляцией) в кодировке UTF-16. Затем вам может понадобиться преобразовать его, чтобы использовать запятую в качестве разделителя вместо табуляции и / или из UTF-16 в UTF-8. Но это работает, только если исходные данные правильно закодированы.

@Istiaque Ахмед, похоже, исходные данные неправильно закодированы. Если он использует нестандартную 8-битную кодировку, он может выглядеть нормально для программ, которые используют определенный шрифт, но не работает, когда используются обычные шрифты, и преобразования данных могут испортить данные. Какой шрифт Bangla вы используете?
Я сделал преобразование, выбравsave as введите as & apos; текст в кодировке Юникод (.txt) & apos; , но все же эти "?" Марки появились как и раньше. Istiaque Ahmed
шрифт «Вринда»; Istiaque Ahmed
Как сделать это преобразование, чтобы использовать запятую в качестве разделителя вместо табуляции и / или из UTF-16 в UTF-8? Файл Excel хорошо показал шрифты Bangla. Поэтому я могу предположить, что исходные данные были правильно закодированы. право ? Istiaque Ahmed
Я озадачен. Вринда имеет кодировку Unicode, поэтому все должно идти хорошо, и все прошло нормально, когда я тестировал на своем компьютере (используя Win 7, Excel 2007). Вы уверены, что проблема не в программном обеспечении, которое вы используете для открытия файла? (Я тестировал, открывая в Word 2007, и при запросе на кодировку указывал & # x201C; Unicode & # x201D ;.)

Похожие вопросы