Information discovery from semi-structured record sets on the Web.
万维网(World Wide Web ,简称Web) 从上世纪九十年代出现以来在深度和广度上都得到了巨大的发展,大量的Web应用前所未有地改变了人们的生活。Web的发展形成了个庞大而有价值的信息资源,然而由于Web 内容异质性给自动信息抽取所造成的困难,这个信息源并没有被充分地利用。因此, Web信息抽取是Web信息应用过程中非常关键的一环。一般情况下,一个网页用来描述一个单独的对象或者一组相似的对象。例如,关于某款数码相机的网页描述了该相机的各方面特征,而一个院系的教授列表则描述了一组教授的基本信息。相应地, Web信息抽取可以分为两大类,即面向单个对象细节的信息抽取和面向组对象记录的信息抽...
Other Authors: | |
---|---|
Format: | Others |
Language: | English Chinese |
Published: |
2012
|
Subjects: | |
Online Access: | http://library.cuhk.edu.hk/record=b5549518 http://repository.lib.cuhk.edu.hk/en/item/cuhk-328411 |