• 您的位置我爱Aspx >> 综合资讯 >> 基于 Web 的数据挖掘
  • 基于 Web 的数据挖掘

  • 作者:yezi  来源:yezi blog  日期:2007-8-1 22:39:14  关键字:web,数据
  • 记下我们观察到的内容,现在要考虑页面所生成的 XHTML。搜 索“Appar Temp”的文本(如图 4 所示)说明该文本确实在一个包含我们所需的所有数据的表中。我们将把该表作为引用点或锚。

    图 4:通过查找包含文本“Appar Temp”的表找到锚

    现在,我们需要找到这个锚的方法。因为我们正准备使用 XSL 来转换我们 的 XML,所以可以使用 XPath 表达式来完成这个任务。我们将使用以下这个普通的表达式:

    程序代码:

    /html/body/center/table[6]/tr[2]/td[2]/table[2]/tr/td/table[6]

    这个表达式指定了从根 <html> 元素到锚的路径。这个普通的方法将导致我们对页面布局的修改非常容易遭到破坏。较好的方法是根据周围的内容指定锚。通过使用这个方法,我们把 XPath 表达式重新 构造成:

    程序代码:

    //table[starts-with(tr/td/font/b,'Appar Temp')]

    ...更好一些,可以利用 XSL 将 XML 树转换成字符串的方法:

    我对这篇文章有话说?
  • 广告位招租,广告代号:content_468_15
  • 上一篇:比较老了--hotmail邮箱升级到25m
    下一篇:N秒后自动转到另一个页面的代码