Содержание:
CSV (Значения, разделенные запятыми) — это распространенный формат хранения табличных данных (числовых и текстовых) в виде обычного текста. Этот формат файлов популярен и устойчив благодаря тому, что огромное количество программ и приложений понимают CSV, по крайней мере, как альтернативный формат файла для импорта/экспорта. Более того, формат CSV позволяет пользователю заглянуть в файл и сразу обнаружить проблему с данными, если таковая имеется, изменить разделитель CSV, правила цитирования и так далее. Это возможно, поскольку CSV — это простой текст, и даже не очень опытный пользователь легко разберется в нем без специальной подготовки.
В этой статье мы узнаем быстрые и эффективные способы экспорта данных из Excel в CSV и научимся конвертировать файл Excel в CSV без искажения всех специальных и иностранных символов. Методы, описанные в статье, работают во всех версиях Excel 2013, 2010 и 2007.
Как конвертировать файл Excel в CSV
Если вы хотите экспортировать файл Excel в какое-либо другое приложение, например в адресную книгу Outlook или базу данных Access, сначала преобразуйте лист Excel в файл CSV, а затем импортируйте файл. . CSV в другое приложение. Ниже приводится пошаговое руководство по экспорту книги Excel в формат CSV с помощью инструмента Excel: «Сохранить как.
- В книге Excel откройте вкладку Файл (Файл) и нажмите Сохранить как (Сохранить как). Кроме того, диалоговое окно Сохранение документа (Сохранить как) можно открыть, нажав клавишу F12.
- В Тип файла (Сохранить как тип) выберите CSV (через запятую) (CSV (разделены запятыми)).Помимо CSV (с разделителями-запятыми), доступно несколько других вариантов формата CSV:
- CSV (через запятую) (CSV (разделены запятыми)). В этом формате данные Excel хранятся в виде текстового файла, разделенного запятыми, и его можно использовать в другом приложении Windows и в другой версии операционной системы Windows.
- CSV (Макинтош). В этом формате книга Excel сохраняется в виде файла, разделенного запятыми, для использования в операционной системе Mac.
- CSV (MS DOS). Сохраняет книгу Excel в виде файла, разделенного запятыми, для использования в операционной системе MS-DOS.
- Юникод текст (Текст в Юникоде (*txt)). Этот стандарт поддерживается практически всеми существующими операционными системами, включая Windows, Macintosh, Linux и Solaris Unix. Он поддерживает символы практически всех современных и даже некоторых древних языков. Поэтому, если книга Excel содержит данные на иностранных языках, я рекомендую сначала сохранить ее в формате Юникод текст (Текст Unicode (*txt)), а затем преобразуйте в CSV, как описано далее в разделе «Экспорт из Excel в формат CSV UTF-8 или UTF-16».
Примечание: Все упомянутые форматы сохраняют только активный лист Excel.
- Выберите папку для сохранения файла CSV и нажмите Сохранить (Сохранить). После нажатия Сохранить (Сохранить) появятся два диалоговых окна. Не волнуйтесь, эти сообщения не указывают на ошибку, так и должно быть.
- Первое диалоговое окно напоминает вам, что В файл выбранного типа можно сохранить только текущий лист. (Выбранный тип файла не поддерживает книги, содержащие несколько листов). Чтобы сохранить только текущий лист, просто нажмите OK.Если вы хотите сохранить все листы книги, то нажмите аннулирование (Отмена) и сохраните все листы книги по отдельности с соответствующими именами файлов или вы можете выбрать сохранение другого типа файла, поддерживающего несколько страниц.
- После нажатия кнопки OK в первом диалоговом окне появится второе, предупреждающее, что некоторые функции станут недоступны, поскольку не поддерживаются форматом CSV. Так и должно быть, просто нажмите Да (Да).
Вот как лист Excel можно сохранить в виде файла CSV. Быстро и легко, и здесь вряд ли могут возникнуть какие-либо трудности.
Экспорт из Excel в CSV с кодировкой UTF-8 или UTF-16.
Если лист Excel содержит какие-либо специальные или иностранные символы (тильда, ударение и тому подобное) или иероглифы, то преобразовать лист Excel в CSV описанным выше способом не получится.
Дело в том, что команда Сохранить как > CSV (Сохранить как > CSV) искажает все символы, кроме ASCII (американский стандартный код обмена информацией). А если на листе Excel (перенесенном в Excel, например, из документа Word при копировании/вставке текста) есть двойные кавычки или длинные тире – такие символы тоже будут уничтожены.
Простое решение – сохранить лист Excel как текстовый файл Юникод (.txt), а затем преобразуйте его в CSV. Таким образом, все символы, отличные от ASCII, останутся нетронутыми.
Прежде чем двигаться дальше, позвольте мне кратко объяснить основные различия между кодировками UTF-8 и UTF-16, чтобы в каждом отдельном случае вы могли выбрать подходящий формат:
- UTF-8 — более компактная кодировка, в которой для каждого символа используется от 1 до 4 байтов. Чаще всего рекомендуется использовать этот формат, когда в файле преобладают символы ASCII, так как большинству этих символов требуется 1 байт памяти. Еще одним преимуществом является то, что кодировка файла UTF-8, содержащего только символы ASCII, ничем не будет отличаться от того же файла ASCII.
- UTF-16 использует от 2 до 4 байтов для хранения каждого символа. Обратите внимание, что не во всех случаях файл UTF-16 требует больше места в памяти, чем файл UTF-8. Например, японские символы занимают от 3 до 4 байтов в UTF-8 и от 2 до 4 байтов в UTF-16. Таким образом, имеет смысл использовать UTF-16, если данные содержат азиатские символы, включая японские, китайские и корейские. Основным недостатком этой кодировки является то, что она не полностью совместима с файлами ASCII и требует использования специальных программ для отображения таких файлов. Имейте это в виду, если планируете импортировать полученные файлы из Excel куда-нибудь еще.
Как конвертировать файл Excel в CSV UTF-8
Предположим, у нас есть лист Excel с иностранными символами, в нашем примере это японские имена.
Чтобы экспортировать этот лист Excel в файл CSV, сохранив все иероглифы, сделаем следующее:
- В Excel откройте вкладку Файл (Файл) и нажмите Сохранить как (Сохранить как).
- Введите имя файла в поле Тип файла (Сохранить как тип) выберите Юникод текст (Текст Unicode (*.txt)) и нажмите Сохранить (Сохранять).
- Откройте созданный файл в любом стандартном текстовом редакторе, например в Блокноте.
Примечание: Не все простые текстовые редакторы полностью поддерживают символы Юникода, поэтому некоторые из них могут отображаться в виде прямоугольников. В большинстве случаев это никак не повлияет на конечный файл, и вы можете просто проигнорировать это или выбрать более продвинутый редактор, например Notepad++.
- Поскольку наш текстовый файл Unicode использует символ табуляции в качестве разделителя, и мы хотим преобразовать его в CSV (с разделителями-запятыми), нам необходимо заменить символы табуляции запятыми.
Примечание: Если нет строгой необходимости получить файл с разделителями-запятыми, а нужен любой CSV-файл, понятный Excel, то этот шаг можно пропустить, так как Microsoft Excel прекрасно понимает файлы с разделителем – табуляцией.
- Если вам все же нужен CSV-файл (через запятую), выполните в Блокноте следующие действия:
- Выделите символ табуляции, щелкните по нему правой кнопкой мыши и в контекстном меню нажмите Копировать (Копировать) или просто нажмите Ctrl + Cкак показано на рисунке ниже.
- Нажмите Ctrl + Hоткрыть диалоговое окно Замена (Заменить) и вставьте скопированный символ табуляции в поле. То, что (Найти то, что). В этом случае курсор переместится вправо – это означает, что вставлен символ табуляции. В поле Чем (Заменить на) введите запятую и нажмите Заменить все (Заменить все).
В Блокноте результат будет примерно такой:
- Нажмите Файл > Сохранить как (Файл > Сохранить как), введите имя файла и в раскрывающемся списке Кодирование (Кодировка) выберите UTF-8… Затем нажмите кнопку Сохранить (Сохранять).
- Запустите проводник Windows и измените расширение файла с .текст on . CSV.Изменить расширение по-другому .текст on . CSV Вы можете сделать это прямо в Блокноте. Для этого в диалоговом окне Сохранить как (Сохранить как) в поле Тип файла (Сохранить как тип) выберите вариант Все файлы (Все файлы) и к имени файла в соответствующем поле добавьте «.csv», как показано на рисунке ниже.
- Откройте CSV-файл в Excel, для этого на вкладке Файл (Филе) обмять Откройте > Текстовые файлы (Открыть > Текстовые файлы) и проверьте, в порядке ли данные.
Примечание: Если ваш файл предназначен для использования вне Excel и обязательным является формат UTF-8, то не вносите никаких изменений в лист и не сохраняйте его повторно в Excel, так как это может привести к проблемам со считыванием кодировки. Если какая-то часть данных не отображается в Excel, откройте этот же файл в Блокноте и исправьте в нем данные. Не забудьте еще раз сохранить файл в формате UTF-8.
Как конвертировать файл Excel в CSV UTF-16
Экспорт в CSV-файл UTF-16 выполняется намного быстрее и проще, чем экспорт в UTF-8. Дело в том, что Excel автоматически применяет формат UTF-16, когда вы сохраняете файл как Юникод текст (Текст в Юникоде).
Для этого сохраните файл с помощью инструмента Сохранить как (Сохранить как) в Excel, а затем в проводнике Windows измените расширение созданного файла на . CSV, Выполнено!
Если вам нужен файл CSV с точкой с запятой или точкой с запятой в качестве разделителя, замените все символы табуляции запятыми или точками с запятой соответственно в Блокноте или любом другом текстовом редакторе по вашему выбору (подробные инструкции о том, как это сделать, см. ранее в этой статье).
Другие способы конвертировать файлы Excel в CSV
Описанные выше способы экспорта данных из Excel в CSV (UTF-8 и UTF-16) универсальны, т.е. подходят для работы с любыми спецсимволами и в любой версии Excel с 2003 по 2013 год.
Существует множество других способов конвертировать данные из Excel в формат CSV. В отличие от решений, показанных выше, эти методы не приведут к созданию чистого файла UTF-8 (это не относится к OpenOffice, который может экспортировать файлы Excel в нескольких вариантах кодировки UTF). Но в большинстве случаев полученный файл будет содержать правильный набор символов, который затем можно безболезненно преобразовать в формат UTF-8 с помощью любого текстового редактора.
Преобразование файла Excel в CSV с помощью Google Таблиц
Как оказалось, преобразовать файл Excel в CSV с помощью Google Sheets очень легко. При условии, что Google Диск уже установлен на вашем компьютере, выполните следующие 5 простых шагов:
- В Google Диске нажмите кнопку Создавай (Создать) и выберите Настольные (Таблица).
- В меню Файл (Филе) обмять Импортировать (Импорт).
- Нажмите Скачать (Загрузить) и выберите файл Excel для загрузки со своего компьютера.
- В диалоговом окне чертенокорт файла (Импортировать файл) выберите Заменить таблицу (Заменить таблицу) и нажмите Импортировать (Импорт).
Наконечник: Если файл Excel относительно небольшой, то для экономии времени можно перенести данные из него в таблицу Google с помощью копирования/вставки.
- В меню Файл (Филе) обмять Скачать как (Скачать как), выберите тип файла CSV – файл будет сохранен на компьютере.
Наконец, откройте сгенерированный файл CSV в любом текстовом редакторе, чтобы убедиться, что все символы сохранены правильно. К сожалению, файлы CSV, созданные таким образом, не всегда корректно отображаются в Excel.
Сохраните файл .xlsx как .xls, а затем преобразуйте в файл CSV.
Никаких дополнительных комментариев этот метод не требует, так как все и так понятно из названия.
Это решение я нашел на одном из форумов, посвященных Excel, не помню на каком. Честно говоря, я никогда не пользовался этим методом, но по мнению многих пользователей, некоторые специальные символы теряются при сохранении напрямую из . XLSX в . CSV, но останется, если сначала . XLSX Сохранить как . Xls, а потом как . CSV, как мы это делали в начале этой статьи.
В любом случае, попробуйте этот метод создания файлов CSV из Excel самостоятельно, и если он сработает, это сэкономит вам время.
Сохранение файла Excel в формате CSV с помощью OpenOffice
OpenOffice — это набор приложений с открытым исходным кодом, включающий приложение для работы с электронными таблицами, которое отлично справляется с экспортом данных из Excel в формат CSV. Фактически, это приложение дает вам доступ к большему количеству опций при преобразовании электронных таблиц в файлы CSV (кодировка, разделители и т. д.), чем Excel и Google Sheets вместе взятые.
Просто откройте файл Excel в OpenOffice Calc, нажмите Файл > Сохранить как (Файл > Сохранить как) и выберите тип файла. CSV-текст (Текст CSV).
Следующий шаг – выбор значений параметров. Кодирование (наборы символов) и Разделитель полей (Разделитель полей). Конечно, если мы хотим создать CSV-файл UTF-8 с запятыми в качестве разделителей, выберите UTF-8 и введите запятую (,) в соответствующие поля. Параметр Разделитель текста (Разграничитель текста) обычно оставляют без изменений – кавычки («). Следующий клик OK.
Точно так же для быстрого и безболезненного преобразования Excel в CSV можно использовать другое приложение — LibreOffice. Согласитесь, было бы здорово, если бы в Microsoft Excel была возможность еще и корректировать настройки при создании CSV-файлов.
В этой статье я рассказал об известных мне методах преобразования файлов Excel в CSV. Если вы знаете более эффективные способы экспорта из Excel в CSV, расскажите, пожалуйста, об этом в комментариях. Спасибо за внимание!