Linux系统查找替换非UTF-8编码文件的方法

　　UTF-8是Linux系统下的一种可变长度的字符万国码，使用UTF-8码就可以支持多种语言。但是某些文件并不是UTF-8编码的，这个时候我们可以用命令来查找替换非UTF-8码，下面就来介绍一下Linux系统查找替换非UTF-8编码文件的方法。

　　开始之前，请先安装enca这个软件包。enca是Linux等系统下用来查看文件编码和转换文件编码的工具。

　　下面一行Linux命令能够查找当前目录下所有文件中，哪些文件不是UTF-8编码。我对文件加了些限制，用find命令时候，排除了所有目录下的.svn目录，且只查找后缀为.php的文件。

　　命令1：

　　jw@~/sqlite>

　　find 。！ -iregex ‘.*\.svn.*’ -type f -name ‘*.php’ -exec bash -c “enca -L zh_CN {}|grep GB2312 》 /dev/null && echo {}” \;

　　./sqlite_utility.php

　　./sqlite_result.php

　　./sqlite_forge.php

　　./sqlite_driver.php

　　既然找到了这些非UTF8编码的文件，接下来再用一条命令将他们都转换成UTF8编码。

　　命令2：

　　jw@~/sqlite>

　　find . ！ -iregex ‘.*\.svn.*’ -type f -name ‘*.php’ -exec bash -c “enca -L zh_CN {} | grep GB2312 》/dev/null && enconv -L zh_CN -x UTF-8 {}” \;

　　当你用命令2 全部转换完成后，如果你期待命令1的输出为空，那么你就错了。实际上英语字母的utf8编码和ASCII编码是一样的。当一个全是英文字母的文件用UTF8 w/o BOM编码保存，那么enca会识别他是一个ACSII编码的文件。所以，你猜到了，命令2做了一些无用功。

　　以上就是Linux系统查找替换非UTF-8编码文件的方法了，这样一来就不用担心Linux文件不是UTF-8编码而无法显示其他语言了。

版权声明

本文仅代表作者观点，不代表本站立场。
本文系作者授权发表，未经许可，不得转载。
本文地址：/jtjc/Linux/2021-03-08/26686.html

上一篇 : 如何使用DD命令测试Linux磁盘的性能？

下一篇 : Ubuntu如何恢复被误删除的GNOME Panel？

留言与评论（共有 0 条评论）

1000元配置

2000元配置

3000元配置

4000元配置

5000元配置

6000元配置

7000元配置

8000元配置

9000元配置

万元配置

i3配置

i5配置

i7配置

APU配置

R5配置

R7配置

游戏攻略

软件教程

Win10教程

Win7教程

Mac教程

Linux教程

U盘教程

Server教程

Linux系统查找替换非UTF-8编码文件的方法

版权声明

热门文章

最近发表

标签列表

| 桂ICP备2023010378号-4

Powered By EmpireCMS

Linux系统查找替换非UTF-8编码文件的方法

版权声明

相关文章

热门文章

最近发表

标签列表

var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?1cc50873f5e983e8073d99a425b87921"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); | 桂ICP备2023010378号-4

Powered By EmpireCMS

| 桂ICP备2023010378号-4