C#中处理网页等教学资料.doc
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《C#中处理网页等教学资料.doc》由会员分享,可在线阅读,更多相关《C#中处理网页等教学资料.doc(40页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、如有侵权,请联系网站删除,仅供学习与交流C#中处理网页等本文利用C#和.NET提供的类来轻松创建一个抓取网页内容源代码的程序 。HTTP是WWW进行数据访问最基本的协议之一,在.NET的基本类型库类中提供了两个对象类:HTTPWebRequest和HTTPWebResponse,分别用来向某资源发送请求和获得响应。为了得到一个资源的内容,我们先指定一个想要抓取的URL地址,用HTTPWebRequest对象进行请求,用HTTPWebResponse对象接收响应的结果,最后用TextStream对象来提取我们想要的信息,并在控制台打印出来。 下面就是看看如何实现这样的功能:第一步:打开VS.NE
2、T,点“文件”-“新建”-“项目”,项目类型选择“Visual C#项目”,模板选“Windows应用程序”,第二步:在Form1里加入Label1,Button1,TextBox1,TextBox2四个控件,TextBox2的Multiline属性改为True,第三步:在Form1窗体上点击右键,选“查看代码”,然后在最顶端输入: using System.IO; using System.Net; using System.Text; 在 private void button1_Click(object sender, System.EventArgs e) 的括号之间输入下面的代码:
3、byte buf = new byte38192; HttpWebRequest request = (HttpWebRequest)WebRequest.Create(textBox1.Text); HttpWebResponse response = (HttpWebResponse)request.GetResponse(); Stream resStream = response.GetResponseStream(); int count = resStream.Read(buf, 0, buf.Length); textBox2.Text = Encoding.Default.Ge
4、tString(buf, 0, count); resStream.Close(); 第四步:点“Save all”按钮,按“F5”运行应用程序,在“请输入URL地址:”后面的单行文本框里输入 HTML 代码”按钮,就可以看到该地址的代码了!下面,我们就对上面的程序做一个分析:上面的这个程序的功能是抓取网页GetResponseStream()方法来得到响应的文本流了,最后用Stream对象的Read()方法把返回的响应信息放到我们最初创建的字节数组buf中,Read()有3个参数,分别是:要放入的字节数组,字节数组的开始位置,字节数组的长度。最后把字节转换成字符串,注意:这里采用的采用的是D
5、efault编码,它使用默认的编码方式,我们就不用再进行字符编码之间的转换了。也可以利用WebRequest和WebResponse实现以上的功能,代码如下: WebRequest request = WebRequest.Create(textBox1.Text); WebResponse response =request.GetResponse(); 输入其它的URL看看是不是很方便! C#编码标准编码习惯 cuike519(翻译)1. 避免将多个类放在一个文件里面。 2. 一个文件应该只有一个命名空间,避免将多个命名空间放在同一个文件里面。3. 一个文件最好不要超过500行的代码(不包
6、括机器产生的代码)。4. 一个方法的代码长度最好不要超过25行。5. 避免方法中有超过5个参数的情况。使用结构来传递多个参数。6. 每行代码不要超过80个字符。7. 不要手工的修改机器产生的代码。a) 如果需要编辑机器产生的代码,编辑格式和风格要符合该编码标准。b) Use partial classes whenever possible to factor out the maintained portions. 8. 避免利用注释解释显而易见的代码。a) 代码应该可以自解释。好的代码由可读的变量和方法命名因此不需要注释。9. Document only operational assum
7、ptions, algorithm insights and so on. 10. 避免使用方法级的文档。a) 使用扩展的API文档说明之。b) 只有在该方法需要被其他的开发者使用的时候才使用方法级的注释。(在C#中就是/)11. 不要硬编码数字的值,总是使用构造函数设定其值。12. 只有是自然结构才能直接使用const,比如一个星期的天数。13. 避免在只读的变量上使用const。如果想实现只读,可以直接使用readonly。public class MyClass public readonly int Number; public MyClass(int someValue) Numbe
8、r = someValue; public const int DaysInWeek = 7; 14. 每个假设必须使用Assert检查a) 平均每15行要有一次检查(Assert)using System.Diagnostics; object GetObject() object obj = GetObject(); Debug.Assert(obj != null); 15. 代码的每一行都应该通过白盒方式的测试。16. 只抛出已经显示处理的异常。17. 在捕获(catch)语句的抛出异常子句中(throw),总是抛出原始异常维护原始错误的堆栈分配。catch(Exception exc
9、eption) MessageBox.Show(exception.Message); throw ; /和throw exception一样。 18. 避免方法的返回值是错误代码。19. 尽量避免定义自定义异常类。20. 当需要定义自定义的异常时:a) 自定义异常要继承于ApplicationException。b) 提供自定义的序列化功能。21. 避免在单个程序集里使用多个Main方法。22. 只对外公布必要的操作,其他的则为internal。23. Avoid friend assemblies, as it increases inter-assembly coupling.24. A
10、void code that relies on an assembly running from a particular location. 25. 使应用程序集尽量为最小化代码(EXE客户程序)。使用类库来替换包含的商务逻辑。26. 避免给枚举变量提供显式的值。/正确方法 public enum Color Red,Green,Blue /避免public enum Color Red = 1,Green = 2,Blue = 3 27. 避免指定特殊类型的枚举变量。/避免 public enum Color : long Red,Green,Blue 28. 即使if语句只有一句,也要
11、将if语句的内容用大括号扩起来。29. 避免使用trinary条件操作符。30. 避免在条件语句中调用返回bool值的函数。可以使用局部变量并检查这些局部变量。bool IsEverythingOK() /避免 if (IsEverythingOK () /替换方案 bool ok = IsEverythingOK(); if (ok) 31. 总是使用基于0开始的数组。32. 在循环中总是显式的初始化引用类型的数组。public class MyClass MyClass array = new MyClass100; for(int index = 0; index array.Lengt
12、h; index+) arrayindex = new MyClass(); 33. 不要提供public 和 protected的成员变量,使用属性代替他们。34. 避免在继承中使用new而使用override替换。35. 在不是sealed的类中总是将public 和 protected的方法标记成virtual的。36. 除非使用interop(COM+ 或其他的dll)代码否则不要使用不安全的代码(unsafe code)。37. 避免显示的转换,使用as操作符进行兼容类型的转换。Dog dog = new GermanShepherd(); GermanShepherd shephe
13、rd = dog as GermanShepherd; if (shepherd != null ) 38. 当类成员包括委托的时候a) Copy a delegate to a local variable before publishing to avoid concurrency race condition. b) 在调用委托之前一定要检查它是否为nullpublic class MySource public event EventHandler MyEvent; public void FireEvent() EventHandler temp = MyEvent; if(temp
14、 != null ) temp(this,EventArgs.Empty); 39. 不要提供公共的事件成员变量,使用事件访问器替换这些变量。public class MySource MyDelegate m_SomeEvent ; public event MyDelegate SomeEvent add m_SomeEvent += value; remove m_SomeEvent -= value; 40. 使用一个事件帮助类来公布事件的定义。 41. 总是使用接口。42. 类和接口中的方法和属性至少为2:1的比例。43. 避免一个接口中只有一个成员。44. 尽量使每个接口中包含35
15、个成员。45. 接口中的成员不应该超过20个。a) 实际情况可能限制为12个 46. 避免接口成员中包含事件。47. 避免使用抽象方法而使用接口替换。48. 在类层次中显示接口。49. 推荐使用显式的接口实现。50. 从不假设一个类型兼容一个接口。Defensively query for that interface.SomeType obj1; IMyInterface obj2; /* 假设已有代码初始化过obj1,接下来 */ obj2 = obj1 as IMyInterface; if (obj2 != null) obj2.Method1(); else /处理错误 51. 表现
16、给最终用户的字符串不要使用硬编码而要使用资源文件替换之。52. 不要硬编码可能更改的基于配置的字符串,比如连接字符串。53. 当需要构建长的字符串的时候,使用StringBuilder不要使用string54. 避免在结构里面提供方法。a) 建议使用参数化构造函数b) 可以重裁操作符55. 总是要给静态变量提供静态构造函数。56. 能使用早期绑定就不要使用后期绑定。57. 使用应用程序的日志和跟踪。58. 除非在不完全的switch语句中否则不要使用goto语句。59. 在switch语句中总是要有default子句来显示信息(Assert)。int number = SomeMethod()
17、; switch(number) case 1: Trace.WriteLine(Case 1:); break; case 2: Trace.WriteLine(Case 2:); break; default : Debug.Assert(false); break; 60. 除非在构造函数中调用其他构造函数否则不要使用this指针。/ 正确使用this的例子 public class MyClass public MyClass(string message ) public MyClass() : this(hello) 61. 除非你想重写子类中存在名称冲突的成员或者调用基类的构造函
18、数否则不要使用base来访问基类的成员。/ 正确使用base的例子public class Dog public Dog(string name) virtual public void Bark( int howLong) public class GermanShepherd : Dog public GermanShe pherd(string name): base (name) override public void Bark(int howLong) base .Bark(howLong); 62. 基于模板的时候要实现Dispose()和Finalize()两个方法。63. 通
19、常情况下避免有从System.Object转换来和由System.Object转换去的代码,而使用强制转换或者as操作符替换。class SomeClass /避免: class MyClass void SomeMethod(T t) object temp = t; SomeClass obj = (SomeClass)temp; / 正确: class MyClass where T : SomeClass void SomeMethod(T t) SomeClass obj = t; 64. 在一般情况下不要定影有限制符的接口。接口的限制级别通常可以用强类型来替换之。public cl
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- C# 处理 网页 教学 资料
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内