+
95
-

回答

免费的:中文违禁词敏感词库

点击打开链接

还有一个sensitive-word

sensitive-word是一款java的敏感词库,6w+,比较丰富,基于DFA(确定性有限自动机)算法构建的高效工具,旨在为用户提供一个安全、合规的文本处理环境。

该框架能够精准识别并过滤掉可能触发敏感问题的文字内容,包括但不限于政治敏感、商业广告、非法营销、网络翻墙等违反国家法律法规的词汇。

此外,我们的框架具备多项实用功能,包括繁体与简体中文的相互转换、全角与半角字符的互换、汉字转换为拼音,以及模糊搜索等,以满足不同场景下的文本处理需求。这些功能不仅增强了敏感词过滤的灵活性和准确性,也为用户提供了更为丰富和便捷的文本处理工具。

示例代码:

final String text = "五星红旗迎风飘扬,毛主席的画像屹立在天安门前。";

String word = SensitiveWordHelper.findFirst(text);
Assert.assertEquals("五星红旗", word);

https://github.com/houbb/sensitive-word

收费就比较多,比如百度、阿里云、腾讯云的内容安全服务,直接调用api即可,不过人家是按文字数量和次数收费的。

例如阿里云内容审查评级代码:点击打开链接

百度云内容审查代码:点击打开链接

网友回复

我知道答案,我要回答