手动检测敏感词 然后过滤它们的方法(优化所必需的)

摘要

大多数网站会过滤敏感词汇。为什么?因为服务器、域名和搜索引擎不允许你有敏感词,所以很容易在网站中无意中插入敏感词,因为它很大,很容易导致被K或网站提示的风险。那么我们如何过滤掉这个

大多数网站会过滤敏感词汇。为什么?因为服务器、域名和搜索引擎不允许你有敏感词,所以很容易在网站中无意中插入敏感词,因为它很大,很容易导致被K或网站提示的风险。那么我们如何过滤掉这个问题呢?

从搜索结果来看

一般来说,任何单词的搜索结果都不会是几十个或几百个。当然,除非它是一个非常片面的词,大多数索引词的搜索量将达到数十万甚至数百万的搜索结果。因此,如果您看到一个单词的搜索结果只有几十或几百个,并且有一个索引,那么这个单词很可能是敏感的。当然,有些词会被别人用来刷指数,但这种情况比较少见。

例如,上图中的单词“av Kojiro”可以清楚地看到这个单词的索引是数千,但是搜索结果只有39。当然,没有人会为这个词的索引付费,因为它毕竟不是一个品牌词,所以可以断定这个词绝对是一个敏感词。当然,这种词的词汇索引是由百度严格监控的。如果监控不那么严格,但它是一个敏感词,那么我们需要更多的方法来检测它。

从下拉框和相关搜索中,

然后最简单的方法是从百度下拉框和相关搜索中检查这个词是否敏感。如果它是敏感的,那么下拉框在大多数情况下不会出现,相关的搜索也不会同时出现。即使索引很大,也不会有更多的搜索,因为百度会手工屏蔽这些词。

当然,一些长尾词仍会显示下拉框和相关搜索,但它们仍是敏感词,仍会提示存在风险,同时,它们很容易被k。

所有医学词汇都是敏感词汇

如果你是在医学领域,我可以坦率地告诉你,你所有的话都是敏感的话。当然,这并不意味着敏感词不能被排名,但是如果你不在医学领域,你最好不要涉及这段内容,这也是很多外部论坛之前没有发布医学内容的主要原因。

我们可以搜索任何医学词汇,我们可以清楚地发现所有的医学词汇都是大品牌的问答网站。我们为什么要给问答网站排名,以及为什么要给大品牌的问答网站排名,有两个原因。

1.问答网站基本上不是商业性的。对问答网站而不是企业站或医院站进行排名的主要原因是问答真正帮助用户解决问题,而企业或医院站都是营销。一个产品给你一个排名问题没关系。如果医院给你一个排名问题,这是一个人的生命问题。魏则西事件再次敲响了百度的警钟。

2.对大型问答网站而不是小型问答网站进行排名也是为了百度自己的用户体验。大型问答平台对问答的监控和管理非常严格,而小型问答平台的管理并不严格,人们总是被要求在问答中吃药,甚至官方也会为你推荐药物。

由监控系统检测到

然后,如果你的网站真的很大,手动过滤很麻烦,最好选择一个检测系统来检测这样敏感的词。一般来说,有两种系统可以检测这类敏感词。首先,当我们安装程序时,大多数内容管理系统都有这样一个数据库,它会自动过滤掉敏感的词并过滤掉它们。即使你发表敏感的词,你也会提示你不允许发表它们。例如,当我在做Jiuwen.com的时候,我有这样一个程序来过滤相关的医疗。

目前评论:0 条

发表评论