在ASP.net中,我们可以创建WSDL文件来描述当前提供的HTML或XML或者任何其他非二进制格式)页,可以使用WSDL来生成客户端代理,并使用Visual Studio.NET或WSDL.exe命令行工具创建代理类。最后通过 RegEx 来分析已命名的HTML页和提取值。以下介绍完整的实现过程:
一、为网站编写WSDL文件
我们以访问http://movies.yahoo.com/电影网站中“本周票房排行榜”(Top Box office)的数据为例,检索出票房排名第一的影片名称。
通过查看http://movies.yahoo.com/网页的HTML源文件,可以看到排名第一影片的链接是:Finding Nemo,为此可在 WSDL 的响应节中添加 标记。这些标记采用一个称为 pattern 的属性,这是与页面上作为属性值的文本部分相对应的正则表达式。这里我们创建的正规表达式是:“pattern="d=hv&cf=info&id=[0-9]*">(.*?)
XMLns:http="http://schemas.XMLsoap.org/wsdl/http/" XMLns:mime="http://schemas.XMLsoap.org/wsdl/mime/" XMLns:soapenc="http://schemas.XMLsoap.org/soap/encoding/" XMLns:soap="http://schemas.XMLsoap.org/wsdl/soap/" XMLns:s0="http://tempuri.org/" targetNamespace="http://tempuri.org/" XMLns="http://schemas.XMLsoap.org/wsdl/" XMLns:msType="http://microsoft.com/wsdl/mime/textMatching/"> "ignoreCase="true"/>
在上面的WSDL中,定义了BarnesAndNoble类,指定进行检索的站点http://movies.yahoo.com/,由于是一般的通用网站,此服务不使用SOAP,而是使用HTTP GET进行请求。
二、构建WEB服务代理
在Visual Studio.NET中,右键单击“解决方案资源管理器”中的“引用”,选择“添加WEB引用”,就可以打开“添加WEB引用”对话框,
在此对话框中,输入刚才创建好的WSDL文件所在的地址,Visual Studio.NET从指定的位置获取WSDL并验证它。单击“添加引用”按钮,就可以将此WSDL描述的WEB服务的引用添加到当前的工程中。
通过以上操作,Visual Studio.NET在后台自动分析WSDL,并创建了代表Web服务的代理对象,并高速缓存了WSDL的本地副本。如果WSDL内容发生变化,需要手工“更新WEB引用”。
WEB服务代理的源代码如下:
Public Class BarnesAndNoble
Inherits System.Web.Services.Protocols.HttpGetClientProtocol
'
Public Sub New()
MyBase.New
Me.Url = "http://movies.yahoo.com/"
End Sub
'
(System.Web.Services.Protocols.TextReturnReader), GetType (System.Web.Services.Protocols.UrlParameterWriter))> _ Public Function GetBookDetails(ByVal isbn As String) As GetBookDetailsMatches Return CType(Me.Invoke("GetBookDetails", (Me.Url + ""), New Object() {isbn}),GetBookDetailsMatches) End Function ' Public Function BeginGetBookDetails(ByVal isbn As String, ByVal callback As System.AsyncCallback, ByVal asyncState As Object) As System.IAsyncResult Return Me.BeginInvoke("GetBookDetails", (Me.Url + ""), New Object() {isbn}, callback, asyncState) End Function ' Public Function EndGetBookDetails(ByVal asyncResult As System.IAsyncResult) As GetBookDetailsMatches Return CType(Me.EndInvoke(asyncResult),GetBookDetailsMatches) End Function End Class Public Class GetBookDetailsMatches (.*?)", lgnoreCase:=true)> _ Public Rank As String End Class 如果在“解决方案资源管理器”中展开“Web References”部分,可以看出具体表达方式: 三、在WEB应用程序中编写代码,使用BarnesAndNoble Web服务。 Private Sub Button1_Click(ByVal sender As System.Object, ByVal e As System.EventArgs) Handles Button1.Click Dim bn As New localhost.BarnesAndNoble() Dim match As localhost.GetBookDetailsMatches match = bn.GetBookDetails("") rank.Text = match.Rank End Sub 在以上程序中,首先调用New localhost.BarnesAndNoble(),创建代理的一个范例bn。bn再调用GetBookDetails()方法传入参数,最后访回一个Rank值(排名第一的影片名称)。 通过编写WSDL,访问由 WSDL 中的功能化名称调用的 Matches 对象,就可以将任何 HTML 部分作为属性来访问,我们可以轻松地将WEB站点转换为WEB服务。以上程序在Windows2000 Server、Visual Studio.NET中调试通过。

