免费的:中文违禁词敏感词库
还有一个sensitive-word
sensitive-word是一款java的敏感词库,6w+,比较丰富,基于DFA(确定性有限自动机)算法构建的高效工具,旨在为用户提供一个安全、合规的文本处理环境。
该框架能够精准识别并过滤掉可能触发敏感问题的文字内容,包括但不限于政治敏感、商业广告、非法营销、网络翻墙等违反国家法律法规的词汇。
此外,我们的框架具备多项实用功能,包括繁体与简体中文的相互转换、全角与半角字符的互换、汉字转换为拼音,以及模糊搜索等,以满足不同场景下的文本处理需求。这些功能不仅增强了敏感词过滤的灵活性和准确性,也为用户提供了更为丰富和便捷的文本处理工具。
示例代码:
final String text = "五星红旗迎风飘扬,毛主席的画像屹立在天安门前。"; String word = SensitiveWordHelper.findFirst(text); Assert.assertEquals("五星红旗", word);
https://github.com/houbb/sensitive-word
收费就比较多,比如百度、阿里云、腾讯云的内容安全服务,直接调用api即可,不过人家是按文字数量和次数收费的。
例如阿里云内容审查评级代码:点击打开链接
百度云内容审查代码:点击打开链接
网友回复
如何编写一个chrome插件实现多线程高速下载大文件?
cdn版本的vue在网页中出现typeerror错误无法找到错误代码位置怎么办?
pywebview能否使用webrtc远程控制共享桌面和摄像头?
pywebview6.0如何让窗体接受拖拽文件获取真实的文件路径?
如何在linux系统中同时能安装运行apk的安卓应用?
python有没有离线验证码识别ocr库?
各家的ai图生视频及文生视频的api价格谁最便宜?
openai、gemini、qwen3-vl、Doubao-Seed-1.6在ui截图视觉定位这款哪家更强更准?
如何在linux上创建一个沙箱隔离的目录让python使用?
pywebview如何使用浏览器自带语音识别与webspeech 的api?