有没有什么技术可以判断内容是chatgpt等ai生成的?
现在chatgpt为首的ai可以创作小说、图片、视频、三维、代码等内容,逼真程度让人无法相信这是电脑生成的,那么有没有什么技术可以判断内容是否是机器生成的,还是人类创作的。
网友回复
通过模型水印识别是否是chatgpt生成的内容,人类无法看到模型水印,但是计算机可以。
这是一种现在被常用于大规模语言模型(LLM)中的方法,能让AI生成的文本带有“特殊标记”。即把信号嵌入到生成的文本中,让算法能从一小段token中检测出来。
最近,OpenAI方面也表示,考虑在ChatGPT中添加水印,以降低模型被滥用带来的负面影响。 这篇最新论文的作者,就想验证下这个想法到底靠不靠谱。他们通过给LLM中嵌入水印,然后再进行检测。其中水印的嵌入不会影响文本生成质量。 具体来说,大规模语言模型每次生成一个token,每个token将从包含大约5万个词汇的词汇表中进行选择。在新token生成之前,该方法会从基于最近已生成的token为随机数生成器(RNG)提供“种子”,以此来压一个水印。
然后使用RNG,能将词汇表分为黑名单和白名单,并要求LLM接下来只能从白名单中选择词汇。 如果整段文本中,白名单中的词汇越多,就意味着越有可能是AI生成的。 黑白名单的区分,基于一个原则: 人类使用词汇的随机性更强。 举例来说,如果在“美丽的”后面生成词汇,水印...
点击查看剩余70%