阿里云折扣码

轻云博客 > Asp .net网站开发 > 读取html页面内容

读取html页面内容

作者:Aisencici / 日期:2014-5-9 14:11:00 / 分类:Asp .net网站开发 / 浏览:3538

获取本地页面内容

 string strFilePath = System.AppDomain.CurrentDomain.BaseDirectory + "/111/111.html";
        htmlContent = File.ReadAllText(strFilePath, Encoding.GetEncoding("GB2312"));

获取远程页面内容

public static string GetPageSource(string URL)
    {
        Uri uri = new Uri(URL);

        HttpWebRequest hwReq = (HttpWebRequest)WebRequest.Create(uri);
        HttpWebResponse hwRes = (HttpWebResponse)hwReq.GetResponse();

        hwReq.Method = "Get";
        hwReq.KeepAlive = false;
        //将该属性设置为 true 以发送带有 Keep-alive 值的 Connection HTTP 标头。
        //应用程序使用 KeepAlive 指示持久连接的首选项。
        //当 KeepAlive 属性为 true 时,应用程序与支持它们的服务器建立持久连接。
        //注意    使用 HTTP/1.1 时,Keep-Alive 默认情况下处于打开状态。
        //将 KeepAlive 设置为假可能导致将 Connection: Close 标头发送到服务器。

        StreamReader reader = new StreamReader(hwRes.GetResponseStream(), System.Text.Encoding.GetEncoding("gb2312"));


        return reader.ReadToEnd();
    }

本文标签:读取html页面内容
From:Aisencici
分享到: