免费的:中文违禁词敏感词库
还有一个sensitive-word
sensitive-word是一款java的敏感词库,6w+,比较丰富,基于DFA(确定性有限自动机)算法构建的高效工具,旨在为用户提供一个安全、合规的文本处理环境。
该框架能够精准识别并过滤掉可能触发敏感问题的文字内容,包括但不限于政治敏感、商业广告、非法营销、网络翻墙等违反国家法律法规的词汇。
此外,我们的框架具备多项实用功能,包括繁体与简体中文的相互转换、全角与半角字符的互换、汉字转换为拼音,以及模糊搜索等,以满足不同场景下的文本处理需求。这些功能不仅增强了敏感词过滤的灵活性和准确性,也为用户提供了更为丰富和便捷的文本处理工具。
示例代码:
final String text = "五星红旗迎风飘扬,毛主席的画像屹立在天安门前。"; String word = SensitiveWordHelper.findFirst(text); Assert.assertEquals("五星红旗", word);
https://github.com/houbb/sensitive-word
收费就比较多,比如百度、阿里云、腾讯云的内容安全服务,直接调用api即可,不过人家是按文字数量和次数收费的。
例如阿里云内容审查评级代码:点击打开链接
百度云内容审查代码:点击打开链接
网友回复
python如何实现torrent的服务端进行文件分发p2p下载?
如何在浏览器中录制摄像头和麦克风数据为mp4视频保存下载本地?
go如何编写一个类似docker的linux的虚拟容器?
python如何写一个bittorrent的种子下载客户端?
ai能通过看一个网页的交互过程视频自主模仿复制网页编写代码吗?
ai先写功能代码通过chrome mcp来进行测试功能最后ai美化页面这个流程能行吗?
vue在手机端上下拖拽元素的时候如何禁止父元素及body的滚动导致无法拖拽完成?
使用tailwindcss如何去掉响应式自适应?
有没有直接在浏览器中运行的离线linux系统?
nginx如何保留post或get数据进行url重定向?