Dzwebs.Net

撰写电脑技术杂文十余年

获取某网址上的所有电子邮件地址的ASP.NET代码

Admin | 2009-2-22 12:49:38 | 被阅次数 | 7674

温馨提示!

如果未能解决您的问题,请点击搜索;登陆可复制文章,点击登陆

using System.Text.RegularExpressions;
using System.IO;
using System.Net;

// 获取网页html代码
string html = GetPageHtml("http://www.dz37w.com","gb2312");

// 获取网页所有email
Regex regex = new Regex(@"([A-Z0-9a-z]+([-+.][A-Z0-9a-z]+)*@[A-Z0-9a-z]+([-.][A-Z0-9a-z]+)*\.[A-Z0-9a-z]+([-.][A-Z0-9a-z]+)*)");
MatchCollection match = regex.Matches(html);
for (int i = 0;i < match.Count;i++)
{
  if (match[i].Success)
  {
    Response.Write(match[i].Groups[0].Value + "<br>");
  }
}

//用户自定义函数
protected string GetPageHtml(string url, string charset)
{
  WebRequest request = WebRequest.Create(url);
  HttpWebResponse response = (HttpWebResponse)request.GetResponse();
  Stream dataStream = response.GetResponseStream ();
  StreamReader reader = new System.IO.StreamReader(dataStream, System.Text.Encoding.GetEncoding(charset));           
  string pageHtml = reader.ReadToEnd ();
  reader.Close ();
  dataStream.Close ();
  response.Close ();

  return pageHtml;
}

  请注意,自行修改根据目标网址修改"gb2312"编码;


该杂文来自: 网站开发杂文

上一篇:如何动态设置让网站会员才能复制网站文章

下一篇:如何禁止网站的配置文件Web.config通过浏览器能打

网站备案号:

网站备案号:滇ICP备11001339号-7

版权属性:

Copyright 2007-2021-forever Inc. all Rights Reserved.

联系方式:

Email:dzwebs@126.com QQ:83539231 访问统计