完美的解決方法從辟謠開始:
1)JDOM是否生成UTF-8的文件與Format是否設(shè)置無關(guān),只有輸出其他字符編碼才需要設(shè)置,見下面的注釋。
2)JDOM輸出UTF-8文件亂碼的根本原因并非在JDOMAPI,而是在JDK。
具體描述:
JDOM的輸出類XMLOutputter有兩個output接口,除了都具有一個Document參數(shù)外,分別接受Writer和OutputStream參數(shù)。
這給我們一個錯覺,兩個接口可以任意使用。
首先我們用output(doc,System.out)來做測試,此時得到亂碼,
然后我們改為output(doc,new PrintWriter(System.out))來測試,輸出不是亂碼,
也就是說在控制臺的時候一定要用一個Writer接口包裝一下。
然后我們用output(doc,new FileWriter(path))來做測試,結(jié)果卻得到亂碼,
然后我們改為output(doc,new FileOutputStream(path))來測試,輸出不是亂碼,
也就是說在輸出文件的時候一定要用一個OutputStream接口包裝一下。
瘋了吧?呵呵,很搞笑是吧。經(jīng)過到JDOM的源碼中調(diào)試,發(fā)現(xiàn)沒有任何問題,問題出在了JDK里面。
JDK內(nèi)的對應(yīng)接口處理:
1)PrintWriter類有參數(shù)為OutputStream的構(gòu)造方法,因此可以從System.out包裝到PrintWriter
2)FileWriter類沒有參數(shù)為OutputStream的構(gòu)造方法,因此不能從FileOutputStream包裝到FileWriter
3)如果PrintWriter類用了參數(shù)為Writer的構(gòu)造方法(Writer實(shí)現(xiàn)為FileWriter),最后輸出也是亂碼
4)如果用一個FileOutputStream來包裝一個控制臺輸出,也是亂碼
因此,對于JDK內(nèi)的各種輸出體系,各種InputStream、OutputStream、reader和writer要充分認(rèn)識,否則極容易出現(xiàn)一些意想不到的問題。
測試的JDOM版本:1.0、1.1
測試代碼:
view plaincopy to clipboardprint?
import java.io.File;
import java.io.FileOutputStream;
import java.io.FileWriter;
import java.io.PrintWriter;
import java.util.HashMap;
import org.jdom.Document;
import org.jdom.Element;
import org.jdom.output.Format;
import org.jdom.output.XMLOutputter;
public class BuildXML {
public static void main(String[] args) throws Exception{
File xmlfile=new File("C:EditTempxmlabc.xml");
//中文問題 //GBK 是沒有問題的,但UTF-8就是有問題的
//原因:
//1)對于磁盤文件,必須使用輸出流 FileOutputStream
// FileWriter out=new FileWriter(xmlfile);會導(dǎo)致亂碼
//2)對于控制臺輸出,則必須使用PrintWriter,如果直接使用System.out也會出現(xiàn)亂碼
// PrintWriter out=new PrintWriter(System.out);
FileOutputStream out=new FileOutputStream(xmlfile);
Element eroot=new Element("root");
eroot.addContent((new Element("code")).addContent("代碼"));
eroot.addContent((new Element("ds")).addContent("數(shù)據(jù)源"));
eroot.addContent((new Element("sql")).addContent("檢索sql"));
eroot.addContent((new Element("order")).addContent("排序"));
Document doc=new Document(eroot);
XMLOutputter outputter = new XMLOutputter();
//如果不設(shè)置format,僅僅是沒有縮進(jìn),xml還是utf-8的,因此format不是必要的
Format f = Format.getPrettyFormat();
//f.setEncoding("UTF-8");//default=UTF-8
outputter.setFormat(f);
outputter.output(doc, out);
out.close();
}
}
1)JDOM是否生成UTF-8的文件與Format是否設(shè)置無關(guān),只有輸出其他字符編碼才需要設(shè)置,見下面的注釋。
2)JDOM輸出UTF-8文件亂碼的根本原因并非在JDOMAPI,而是在JDK。
具體描述:
JDOM的輸出類XMLOutputter有兩個output接口,除了都具有一個Document參數(shù)外,分別接受Writer和OutputStream參數(shù)。
這給我們一個錯覺,兩個接口可以任意使用。
首先我們用output(doc,System.out)來做測試,此時得到亂碼,
然后我們改為output(doc,new PrintWriter(System.out))來測試,輸出不是亂碼,
也就是說在控制臺的時候一定要用一個Writer接口包裝一下。
然后我們用output(doc,new FileWriter(path))來做測試,結(jié)果卻得到亂碼,
然后我們改為output(doc,new FileOutputStream(path))來測試,輸出不是亂碼,
也就是說在輸出文件的時候一定要用一個OutputStream接口包裝一下。
瘋了吧?呵呵,很搞笑是吧。經(jīng)過到JDOM的源碼中調(diào)試,發(fā)現(xiàn)沒有任何問題,問題出在了JDK里面。
JDK內(nèi)的對應(yīng)接口處理:
1)PrintWriter類有參數(shù)為OutputStream的構(gòu)造方法,因此可以從System.out包裝到PrintWriter
2)FileWriter類沒有參數(shù)為OutputStream的構(gòu)造方法,因此不能從FileOutputStream包裝到FileWriter
3)如果PrintWriter類用了參數(shù)為Writer的構(gòu)造方法(Writer實(shí)現(xiàn)為FileWriter),最后輸出也是亂碼
4)如果用一個FileOutputStream來包裝一個控制臺輸出,也是亂碼
因此,對于JDK內(nèi)的各種輸出體系,各種InputStream、OutputStream、reader和writer要充分認(rèn)識,否則極容易出現(xiàn)一些意想不到的問題。
測試的JDOM版本:1.0、1.1
測試代碼:
view plaincopy to clipboardprint?
import java.io.File;
import java.io.FileOutputStream;
import java.io.FileWriter;
import java.io.PrintWriter;
import java.util.HashMap;
import org.jdom.Document;
import org.jdom.Element;
import org.jdom.output.Format;
import org.jdom.output.XMLOutputter;
public class BuildXML {
public static void main(String[] args) throws Exception{
File xmlfile=new File("C:EditTempxmlabc.xml");
//中文問題 //GBK 是沒有問題的,但UTF-8就是有問題的
//原因:
//1)對于磁盤文件,必須使用輸出流 FileOutputStream
// FileWriter out=new FileWriter(xmlfile);會導(dǎo)致亂碼
//2)對于控制臺輸出,則必須使用PrintWriter,如果直接使用System.out也會出現(xiàn)亂碼
// PrintWriter out=new PrintWriter(System.out);
FileOutputStream out=new FileOutputStream(xmlfile);
Element eroot=new Element("root");
eroot.addContent((new Element("code")).addContent("代碼"));
eroot.addContent((new Element("ds")).addContent("數(shù)據(jù)源"));
eroot.addContent((new Element("sql")).addContent("檢索sql"));
eroot.addContent((new Element("order")).addContent("排序"));
Document doc=new Document(eroot);
XMLOutputter outputter = new XMLOutputter();
//如果不設(shè)置format,僅僅是沒有縮進(jìn),xml還是utf-8的,因此format不是必要的
Format f = Format.getPrettyFormat();
//f.setEncoding("UTF-8");//default=UTF-8
outputter.setFormat(f);
outputter.output(doc, out);
out.close();
}
}