enca

「Linux」- 识别文件编码、转换文件编码 @20210215

房东的猫 提交于 2021-02-15 19:05:28
问题描述 当我们使用编辑器打开文件时,文件有时候会显示为乱码,也就是说编辑器没有使用正确的编码方式打开文件。此时,我们则需要切换编辑器的编码方式,使用正确的编码方式打开文件。 但是,我们应该如何得知文件的正确编码呢?(除了被告知以外) 该笔记将记录:在 Linix 中,如何获取文件的编码方式,以及如何进行文件编码转换。 问题原因 直接获取文件的编码是不太可能的。虽然文件头可能暗示了文件编码(但其实并没有类似的规范),但也有例外。例如,以 0xEF,0xBB,0xBF 开头的可能是 UTF-8 编码文件,但也可能是 ISO-8859-1 编码文件的  字符串。或者,其他的编码体系中的字符。 主流编辑器识别文件编码的方式是通过猜测 (即使 file 命令,有时也会给出错误的文件编码提示),所以编辑器里才会由 File Encoding 功能来切换编码的功能。 解决方案:获取文件编码 注意事项: 1)如上所述,工具获取文件编码的方式是通过猜测,因此工具很有可能会返回错误的文件编码,只是可靠的工具返回的结果更加可靠。 2)当工具猜测出编码之后,我们可以尝试使用该编码方式打开文件,以验证猜测结果是正确; 方案一、使用 file 命令 使用 file 命令,可以获取文件编码: # file Fontconfig_-_fonts.conf.txt Fontconfig_-_fonts

Ubuntu 下的实用工具(持续更新)

大城市里の小女人 提交于 2019-12-03 03:32:37
最近正式将工作环境从 Windows 转到 Ubuntu 上来,有很多的不适应.各种工具神马的是最头疼的,很多在 Windows 下用的很爽的工具在 Ubuntu 下并不能使用.这篇文章将记录我在使用 Ubuntu 的过程中发现的好用的工具,一是给自己做一个备份,二是给大家提供一个参考。 文本文件编码转换工具: enca 安装: $sudo apt-get install enca 命令格式: $enca -L 当前语言 -x 目标编码 文件名 例如,例如要把当前目录下的所有文件都转成utf-8: $enca -L zh_CN -x utf-8 * MarkDown编辑器: ReText ReText 是一个使用 Markdown 语法和 reStructuredText (reST) 结构的文本编辑器,编辑的内容支持导出到 PDF、ODT 和 HTML 以及纯文本,支持即时预览、网页生成以及 HTML 语法高亮、全屏模式,可导出文件到 Google Docs 等。 本文将持续更新 来源: oschina 链接: https://my.oschina.net/u/252629/blog/143002