且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

下载网页内容,并编译生成CHM文件

更新时间:2022-08-21 13:39:45

  看了园子里的一系列关于生成CHM的文件的方式,主要是这些:

C#生成CHM文件(入门篇)
C#生成CHM文件(中级篇)
C#生成CHM文件(应用篇)

http://www.cnblogs.com/alexis/archive/2010/10/16/1853275.html

  自己就想写一个从网上下载页面,然后将页面编译成CHM的小程序。现在把源代码提供出来:

下载网页内容,并编译生成CHM文件

  主要的难点是网页编码的判断,目前是先对Request的HEAD里面的Content-Type中进行判断,如果这里没有获取到,在根据默认的编码解析网页内容,获取网页内部的Content-Type标签数据。如果这两种都无法获取到,这个网页就有可能会出现乱码,如果哪位有更好的解决方案,还望不吝赐教!

  HTML的解析,我用的是开源的Winista.Htmlparser.Net,感觉挺方便,园子里也有相应的教程,我就不多说了。




本文转自齐师傅博客园博客,原文链接http://www.cnblogs.com/youring2/archive/2012/04/24/2467747.html,如需转载请自行联系原作者