首页 > 编程语言 > 详细

Java工具-----native2ascii

时间:2019-01-15 15:13:57      阅读:167      评论:0      收藏:0      [点我收藏+]

概述

使用

native2ascii [-option] [inputfile[outputfile]]

  • option 选项
    • -reverse:将Unicode转换为本地编码。
    • -encoding:指定转换编码;未指定时,使用本地编码。
  • inputfile
    输入文件;未指定时,屏幕输入。
  • outputfile
    输出文件;未指定时,屏幕输出。

native2ascii

$ native2ascii
这是一个测试案例123abc
\u8fd9\u662f\u4e00\u4e2a\u6d4b\u8bd5\u6848\u4f8b123abc

native2ascii [inputfile]

$ cat zh_CN.txt
这是一个测试文件
123
abc
$ native2ascii zh_CN.txt
\u8fd9\u662f\u4e00\u4e2a\u6d4b\u8bd5\u6587\u4ef6
123
abc

native2ascii [inputfile[outputfile]]

$ cat zh_CN.txt
这是一个测试文件
123
abc
$ cat zh_CN_output.txt  
$ native2ascii zh_CN.txt zh_CN_output.txt
$ cat zh_CN_output.txt
\u8fd9\u662f\u4e00\u4e2a\u6d4b\u8bd5\u6587\u4ef6
123
abc

native2ascii -encoding GB2312 [inputfile[outputfile]]

$ env | grep LANG
NLS_LANG=AMERICAN_AMERICA.JA16SJISTILDE
LANG=ja_JP.UTF-8
$ cat GB2312.txt
?ˇ??????t-------encoding=GB2312
$ cat GB_encoding_output.txt
$ native2ascii -encoding GB2312 GB2312.txt GB_encoding_output.txt
$ cat GB_encoding_output.txt
\u8fd9\u662f\u4e00\u4e2a\u6d4b\u8bd5\u6587\u4ef6-------encoding=GB2312

由于源文件(GB_encoding_output.txt)的编码与系统本地的编码不一致,所以会显示乱码。

native2ascii -reverse -encoding utf-8 [inputfile[outputfile]]

$ env | grep LANG
NLS_LANG=AMERICAN_AMERICA.JA16SJISTILDE
LANG=ja_JP.UTF-8
$ cat GB_encoding_reverse_output.txt
$ native2ascii -reverse -encoding utf-8 GB_encoding_output.txt GB_encoding_reverse_output.txt
$ cat GB_encoding_reverse_output.txt
这是一个测试文件-------encoding=GB2312

这里例子利用前一个例子结果(GB_encoding_reverse_output.txt),将源文件(GB_encoding_output.txt)中的内容,最后转换为了UTF-8,所以能够在屏幕上正常显示。

小结

从上面几个例子,还可以知道,可以利用该工具转变文件编码,需要注意的是,在转换为Unicode时,编码要与源文件一致,不然可能会产生乱码:

$ env | grep LANG
NLS_LANG=AMERICAN_AMERICA.JA16SJISTILDE
LANG=ja_JP.UTF-8
$ native2ascii -encoding utf-8 GB2312.txt GB_encoding_output.txt
$ native2ascii -reverse -encoding utf-8 GB_encoding_output.txt GB_encoding_reverse_output.txt
$ cat GB_encoding_reverse_output.txt
??????????????-------encoding=GB2312

由于转换为Unicode时,使用的编码与源文件不一致,最后结果便是乱码。

Java工具-----native2ascii

原文:https://www.cnblogs.com/ephemerid/p/10271793.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!