c#抓取网页内容乱码的解决方案

时间：2015-03-25 16:45:19 阅读：251 评论：0 收藏：0 [点我收藏+]

   写过爬虫的同学都知道，这是个很常见的问题了，一般处理思路是: 使用HttpWebRequest发送请求，HttpWebResponse来接收，判断HttpWebResponse中”Content-Type”中的具体编码，再利用StreamReader 将信息流转为具体的编码就OK了。

下面提供第一种思路的一般方法：

c#抓取网页内容乱码的解决方案

 

这种方法基本上解决了大部分的编码问题。 之所以说基本上也是因为有一些网页，在HttpWebResponse 返回的头部中”Content-Type” 有时候不能正确的匹配到具体编码类型，这个时候就会读到乱码。

下面提供一个我使用的方法，这个方法可以正确的将页面转码：

c#抓取网页内容乱码的解决方案

原文：http://www.cnblogs.com/xuxiaoshuan/p/4365782.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)