免费的:中文违禁词敏感词库
还有一个sensitive-word
sensitive-word是一款java的敏感词库,6w+,比较丰富,基于DFA(确定性有限自动机)算法构建的高效工具,旨在为用户提供一个安全、合规的文本处理环境。
该框架能够精准识别并过滤掉可能触发敏感问题的文字内容,包括但不限于政治敏感、商业广告、非法营销、网络翻墙等违反国家法律法规的词汇。
此外,我们的框架具备多项实用功能,包括繁体与简体中文的相互转换、全角与半角字符的互换、汉字转换为拼音,以及模糊搜索等,以满足不同场景下的文本处理需求。这些功能不仅增强了敏感词过滤的灵活性和准确性,也为用户提供了更为丰富和便捷的文本处理工具。
示例代码:
final String text = "五星红旗迎风飘扬,毛主席的画像屹立在天安门前。";
String word = SensitiveWordHelper.findFirst(text);
Assert.assertEquals("五星红旗", word);https://github.com/houbb/sensitive-word
收费就比较多,比如百度、阿里云、腾讯云的内容安全服务,直接调用api即可,不过人家是按文字数量和次数收费的。
例如阿里云内容审查评级代码:点击打开链接
百度云内容审查代码:点击打开链接
网友回复
如何破解绕开seedance2.0真人照片生成视频 限制?
python有哪些算法可以将视频中的每个帧图片去除指定区域水印合成新的视频?
iphone的激光雷达数据能否实时传输到three三维空间中?
豆包sora等ai视频生成大模型生成的视频水印如何去除?
python如何实现在电脑上拨号打电话给手机?
具身机器人与人形机器人区别?
nodejs如何将一个完整的js代码文件切割成不同的部分混淆后动态加载进入html运行?
为啥windows.onerror捕获js错误是这样的{"message":"Script error.","source":"","lineno":0,"colno":0,"stack":null,
2026年ai将全面接管编程?
WebMCP是干啥的?


