`

linux shell 中文件编码查看及转换方法

阅读更多
一、查看文件编码。
    在打开文件的时候输入:set fileencoding
    即可显示文件编码格式。



二、文件编码转换
    1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式
        在打开的文件中输入:set fileencoding=utf-8

    2、使用iconv转换,iconv的命令格式如下:

        iconv -f encoding -t encoding inputfile
        比如将一个 编码的文件转换成GBK编码
        iconv -f UTF-8 -t GBK file1 -o file2

iconv的用法:

用法: iconv [选项...] [文件...]
Convert encoding of given files from one encoding to another.
输入/输出格式规范:
  -f, --from-code=NAME       原始文本编码
  -t, --to-code=NAME         输出编码
信息:
  -l, --list                 列举所有已知的字符集
输出控制:
  -c                         从输出中忽略无效的字符
  -o, --output=FILE          输出文件
  -s, --silent               suppress warnings
      --verbose              打印进度信息
  -?, --help                 给出该系统求助列表
      --usage                给出简要的用法信息
  -V, --version              打印程序版本号

将GB2312编码的文件内容转换为UTF-8
iconv -f GB2312 -t UTF-8 file-name > new-file-name

将UTF-8编码的文件内容转换为GB2312
iconv -f UTF-8 -t GB2312 file-name > new-file-name
注意:转换前一定要将重要的文件备份,特别是转换文件内容的时候

三、文件名编码转换:

    从linux往windows拷贝文件或者从windows往Linux拷贝文件,有时会出现中文文件名乱码的情况,出现这种问题的原因是因为,windows的文件名 中文编码默认为GBK,而Linux中默认文件名编码为UTF8,由于编码不一致,所以导致了文件名乱码的问题,解决这个问题需要对文件名进行转码。
    在Linux中专门提供了一种工具convmv进行文件名编码的转换,可以将文件名从GBK转换成UTF-8编码,或者从UTF-8转换到GBK。

    1、先看一下你的系统上是否安装了convmv,如果没安装的话在终端输入下面的命令安装:
       sudo yum -y install convmv

    2、下面看一下convmv的具体用法:
       convmv -f 源编码 -t 新编码 [选项] 文件名
       常用参数:
          -r 递归处理子文件夹
          --notest 真正进行操作,请注意在默认情况下是不对文件进行真实操作的,而只是试验。
          --list 显示所有支持的编码
          --unescap 可以做一下转义,比如把%20变成空格
    比如我们有一个utf8编码的文件名,转换成GBK编码,命令如下:
    convmv -f UTF-8 -t GBK --notest utf8编码的文件名

    这样转换以后"utf8编码的文件名"会被转换成GBK编码(只是文件名编码的转换,文件内容不会发生变化)
分享到:
评论

相关推荐

    linux下目录文件字符编码转换shell脚本

    使用方法:./fconv type1 type2 dir 含义:from 'type1' to 'type2' in directory 'dir'

    新版Linux Shell编程实训(全)20170518.docx

    前言 10 场景说明 11 基础知识简介 14 ...附录Shell编码规范说明 295 1. 什么时候使用shell 295 2.Shell文件和解释器调用 295 3.环境 296 4.注释 296 5.格式 298 6.特性及错误 304 7.命名转换 308 8.调用命令 311

    shell脚本 字体转换 gb2312到UTF-8

    这是shell写的一个小脚本 为了让那些在linux下查看windows下的一些文件提供方便 只需将后缀改成.sh 再将其拷贝到你要转换的文件夹下 运行就OK

    linux下图片批量转base64

    #功能说明:批量将图片文件转换未base64编码文件(txt格式) #使用说明:将需要转换的批量图片与当前脚本存到到同一目录, # 给当前脚本赋予可执行权限 # 执行脚本即可生成与之对应的txt文件,文件内存放base64编码 #...

    shell脚本卸载数据模板(Oracle)

    脚本中包括数据卸载,编码转换(GBK转UTF8),获取批次号(不同批次卸数使用),尾行加行数,FTP上传、以及增加注释了文件切割成多个文件的语句(针对大文件进行切割使用)。 注意:配置/etl/shell/config中的环境...

    Linux下实现UTF-8和GB2312互相转换的方法

    下面小编就为大家带来一篇Linux下实现UTF-8和GB2312互相转换的方法。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧,祝大家游戏愉快哦

    批量转换目录下文件编码的shell脚本代码

    一例批量转换目录下文件编码的shell脚本代码。 需求描述:由于从window转linux过来,很多原来win下的gbk文件需要转换成utf8。 以下脚本仅判断非utf8文件转换成utf8文件,并且默认非utf8文件为gbk,如果文件类型不...

    Unix 编码变换脚本

    本脚本运行在linux里,实现从windows到Unix 编码变换Shell脚本CRLF→LF,UTF8转换

    Shell脚本专家指南

    《Shell脚本专家指南》旨在为Linux、Unix以及OSx系统管理员提供短小精悍且功能强大的shell实现解决方案,教会读者如何使用现有调试器调试shell脚本。全书分为3个部分:脚本技术基础、系统交互和高级技术、有用的脚本...

    Shell脚本遍历目录并批量修改文件编码

    在将windows上的jsp网页移植到linux环境中时,发现一个个的转换编码及修改默认编码类型太慢,写此脚本进行尝试文件遍历~ 好久不写,手生了。 代码如下: #!/bin/bash # # SPATH=”/root/chengji/WebRoot” DPATH=”/...

    exit命令 退出shell

    exit命令用来退出当前的shell或退出终端 ,并返回给定值。 执行exit可使shell以指定的状态值退出。...与该功能相关的Linux命令:iconv命令 – 转换文件编码syslog命令 – 系统默认的日志守护进程ulim

    ODEX文件转换成DEX文件工具

    将dexopt-wrapper放到/data/local目录中,使用adb shell执行linux命令行,使用cd命令进入/data/local目录, cd /data/local ./dexopt-wrapper android123.apk android123.odex 二、合并odex和 少dex的apk 为完整...

    linux_c API函数大全

    LINUX C函数库API 1.字符测试篇 15 1.1 15 isalnum(测试字符是否为英文或数字) 15 1.2 15 isalpha (测试字符是否为英文字母) 15 1.3 16 isascii(测试字符是否为ASCII 码字符) 16 1.4 17 iscntrl(测试字符是否...

    Coptic Encoder:在旧版科普特字符集之间进行代码转换的完整系统。-开源

    其次,与直接输入Unicode相比,键入传统编码然后将其转换为Unicode要容易得多。 该软件包的目的是充当Unicode的垫脚石,其中包括一些经过硬编码以利用多种编码的旧式字体,以及UNIX shell脚本(以多种shell语言在...

    Linux高级bash编程

    高级bash编程 高级Bash脚本编程指南(一) 目录 ++++ 第一部分.... 1. 为什么使用shell编程 2.... 2.1.... 2.2....第二部分.... 3.... 4.... 4.1.... 4.2.... 4.3.... 4.4.... 5.... 5.1.... 5.2.... 6.... 7.... 7.1.... 7.2.... Uudecod 编码后的...

    cmd操作命令和linux命令大全收集

    ping -t -l 65550 ip 死亡之ping(发送大于64K的文件并一直ping就成了死亡之ping) ipconfig (winipcfg) 用于windows NT及XP(windows 95 98)查看本地ip地址,ipconfig可用参数“/all”显示全部配置信息 tlist -t 以...

    MadEdit编辑器

    功能可运行于Linux、Windows系统 具有繁、简体中文的界面 有三种编辑模式∶文本、区块、十六进制在十六进制模式中,可打开超大文件(最大为32GB) 用户可以在编辑时候切换文字编码,就像在网页浏览器中那样支持多种...

    宋劲彬的嵌入式C语言一站式编程

    6. Shell脚本的调试方法 32. 正则表达式 1. 引言 2. 基本语法 3. sed 4. awk 5. 练习:在C语言中使用正则表达式 33. 信号 1. 信号的基本概念 2. 产生信号 2.1. 通过终端按键产生信号 2.2. 调用系统函数向进程发信号 ...

    普联架构设计技术方案.pptx

    二、软件开发平台方案 普联软件开发平台概念 数据存储原理 业务模型及业务搭建原理 指标模型及指标搭建原理 分析模型及分析方法 业务流程管理 BIS平台及开发平台外延 普联架构设计技术方案全文共28页,当前为第2页...

Global site tag (gtag.js) - Google Analytics