基于内容作弊的新闻垃圾网页。查询关键词与网页相关度主要与查询词词频和查询词对应文档数量的动态的垃倒数成正比,所以作弊者往往针对这两个因素入手制造垃圾网页。他们往往会挑选一些很热门的基于圾网
搜索引擎优化的简写是词汇以吸引用户的注意力,同时这些词汇对应的资源往往又是正规网站稀缺的,以保证查询词对应文档数量较少,例如“WIN10 免费下载”、“速度与激情7 免费观看”等,将这些词汇在页面主体、内容标题和HTML头重复的作弊堆砌,以保证查询词词频较大。这种作弊方式被称为关键词堆砌,不过现在主流的新闻搜索引擎几乎都能识别单一使用这种方式制造的垃圾网页了。
还有一些垃圾网页制作者利用一些自动化工具将搜索引擎搜索返回结果中的动态的垃摘要信息抓取出来组成垃圾网页的内容,使得其在内容上与关键词有极高的相关度,达到欺骗的目的。不过随着多数搜索引擎禁用了被抓取功能后,这种作弊方式也不多见了。基于圾网另外一种作弊方式就是内容
搜索引擎优化的简写是垃圾网页制作者找一页具有正常内容的网页,将要作弊的关键词稀稀拉拉相对均匀的混入夹杂其中,这种方式相对简单的关键词堆砌具有较大的迷惑性,如果网民不仔细阅读或者搜索引擎没有语义识别功能就很难识别出来。
上面几种作弊方式对于骗取广告点击,骗取访问流量比较有用,但是作弊对于一些本身以内容欺诈为目的的垃圾网页还不能完全达到目的,因为网民在被骗进来之后很快就会关闭或者离开网页。于是新闻一种称为伪装型垃圾网页的技术应运而生。它是动态的垃指垃圾网页的制造者通过技术手段分别为搜索引擎和用户访问的浏览器准备一个网页的两个版本。早期采取的基于圾网技术包括利用CSS将堆砌的关键词字号缩小、字体颜色透明或者与背景颜色一致等加以隐藏。内容而现在主要通过内容替换、作弊重定向跳转、Java Script脚本等技术进行伪装。
本文地址:https://www.hy755.cn//article/22556.htmlhttp://dkhk.osvso.com/html/04b899990.html