网页表示模型包含了:网页标识、网页类型、内容类别、标题、关键词、摘要、正文、相关链接这样几项信息元素。
网页类型是根据网页内容的表现形式进行划分的,网页可分为三类:有主题网页(topic)、Hub网页(hub)、图片网页(pic)。
有主题网页是指网页中通过文字描述了一件或多件事物,是有一定主题的;如一张具体的新闻网页就是典型的有主题网页。
Hub网页是指专门用来提供网页导 向的网页,因而是超链聚集的网页;如门户网站的首页就是典型的Hub网页。
图片网页是指网页的内容是通过图片的形式体现的,其中文字很少,仅仅是对图片的 一个说明;如某个机构包含图片的人员介绍网页就是典型的图片网页,随着现在互联网技术的发展,网页的表示模型也可分出更多的类别,希望大家能够准确灵活应 用。
将网页分为上述三个类型是因为三类网页在用途和处理方法上存在较大的差别。其中 Hub网页与其它两类网页的区别在于网页在Web上发挥的作用不同,Hub网页通常不会具体的讲述一件事物,而是提供关于相关信息的链接集。而图片网页与 其它两类网页的区别在于处理的方法不同,由于图片网页的内容是通过图片表达的而不是通过文字,因而,传统信息处理领域的方法对图片网页是不够有效的。三类 网页间的区别导致很多应用领域都会对它们作适当的区别。
内容类别是从语义上对网页的内容进行分类,它是搜索引擎获取网页语义信息的一个直接手段,在Web上的研究领域中有着广泛的使用。它是通过特定的分类器对网页内容分类得到的,依赖于一定的分类体系。
重庆网络公司立即购买
地址:重庆市渝中区上清寺鑫隆达B座28-8
邮编:400015
电话:023-63612462
EMAIL:cnjl_net@163.com
2022 渝ICP备09007657号-7
网警备案号:500103015-00277