`
zhujianjia
  • 浏览: 478073 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Android 解析RSS时遇到中文无法解析的问题

阅读更多

当Android在解析XML时遇到GBK或者gb2312编码时会无法解析或者出现乱码,故需要在解析时判断一下RSS的编码方式,

并使用InputStreamReader(rssUrl.openStream(),encodingName)指明编码方式,就可以解析了。

 

//防止遇到某些编码(如GBK)时出现错误
//得到探测器代理对象 
CodepageDetectorProxy detector =   CodepageDetectorProxy.getInstance(); 
//向代理对象添加探测器 
detector.add(JChardetFacade.getInstance());   
//得到编码字符集对象 
Charset charset =  detector.detectCodepage(rssUrl); 
//得到编码名称 
String encodingName = charset.name(); 
Log.e("RssReader_Encoding", encodingName);
//指定编码生成字符流
if(encodingName.equals("GBK") || encodingName.equals("gb2312")){
	is = new InputSource(new InputStreamReader(rssUrl.openStream(),encodingName));  
}
else{
	 is = new InputSource(rssUrl.openStream());  
}
xmlreader.parse(is);

 采用一个现成的开源项目:cpdetector可以判断编码方式,它所在的网址是:http://cpdetector.sourceforge.net/。它的类库很小(见附件),只有500K左右。具体方法可参照下方链接。


链接:判定文件编码或文本流编码的方法

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics