网站敏感词过滤的实现(附敏感词库)
现在基本上所有的网站都需要设置敏感词过滤,似乎已经成了一个网站的标配,如果你的网站没有,或者你没有做相应的处理,那么小心相关部门请你喝茶哦。 最近在调研Java web网站的敏感词过滤的实现,网上找了相关资料,经过我的验证,把我的调研结果写出来,供大家参考。 一、敏感词过滤工具类 把敏感词词库内容加载到ArrayList集合中,通过双层循环,查找与敏感词列表相匹配的字符串,如果找到以*号替换,最终得到替换后的字符串。 此种方式匹配度较高,匹配速度良好。 初始化敏感词库: //初始化敏感词库 public void InitializationWork ( ) { replaceAll = new StringBuilder ( replceSize ) ; for ( int x = 0 ; x < replceSize ; x ++ ) { replaceAll . append ( replceStr ) ; } //加载词库 arrayList = new ArrayList < String > ( ) ; InputStreamReader read = null ; BufferedReader bufferedReader = null ; try { read = new InputStreamReader ( SensitiveWord . class .