>
技术难点和技术趋势
从以上过滤手段来看,它们都受制于内容分类的效率和准确性。如何提高内容分类的效率和准确性,是各个厂商钻研的难题。
实际上,每个月都有新注册的超过100万个网站出现在互联网上,也就是说互联网是变化的,这种变化是永不停息的。我们不可能把所有的网站和网页都进行归类并放在数据库当中,这样的话,这个数据库的规模将会远远超过实际应用中硬件平台性能所能承受的最大限制。最好的办法还是挑选一部分网站放在数据库当中,这些网站至少具有两个特征:访问量比较大;包含不良内容。对于那些访问量不大,或者内容“不咸不淡”的网站,大可以忽略不计。
在变化之外,每个企业或者每个人的浏览习惯都是不一样的,也可能有些人特别喜欢浏览一些冷门的网站,这就涉及一个个性化的问题。为了对这些访问进行控制和过滤,内容过滤产品本身还要具有一定的智能,能够自动分析页码:[1] [2] [3] [4] [5] [6] 第5页、共6页 |