免费的:中文违禁词敏感词库
还有一个sensitive-word
sensitive-word是一款java的敏感词库,6w+,比较丰富,基于DFA(确定性有限自动机)算法构建的高效工具,旨在为用户提供一个安全、合规的文本处理环境。
该框架能够精准识别并过滤掉可能触发敏感问题的文字内容,包括但不限于政治敏感、商业广告、非法营销、网络翻墙等违反国家法律法规的词汇。
此外,我们的框架具备多项实用功能,包括繁体与简体中文的相互转换、全角与半角字符的互换、汉字转换为拼音,以及模糊搜索等,以满足不同场景下的文本处理需求。这些功能不仅增强了敏感词过滤的灵活性和准确性,也为用户提供了更为丰富和便捷的文本处理工具。
示例代码:
final String text = "五星红旗迎风飘扬,毛主席的画像屹立在天安门前。"; String word = SensitiveWordHelper.findFirst(text); Assert.assertEquals("五星红旗", word);
https://github.com/houbb/sensitive-word
收费就比较多,比如百度、阿里云、腾讯云的内容安全服务,直接调用api即可,不过人家是按文字数量和次数收费的。
例如阿里云内容审查评级代码:点击打开链接
百度云内容审查代码:点击打开链接
网友回复
为啥所有的照片分辨率提升工具都会修改照片上的图案细节?
js如何在浏览器中将webm视频的声音分离为单独音频?
微信小程序如何播放第三方域名url的mp4视频?
ai多模态大模型能实时识别视频中的手语为文字吗?
如何远程调试别人的chrome浏览器获取调试信息?
为啥js打开新网页window.open设置窗口宽高无效?
浏览器中js的navigator.mediaDevices.getDisplayMedia屏幕录像无法录制SpeechSynthesisUtterance产生的说话声音?
js中mediaRecorder如何录制window.speechSynthesis声音音频并下载?
python如何直接获取抖音短视频的音频文件url?
js在浏览器中如何使用MediaStream与MediaRecorder实现声音音频多轨道混流?