midphase-AI生成内容检测工具没啥用?容易存在误判
据《 华盛顿邮报》报道,美国有多达210万名教师正在运用 Turnitin 的一种新的人工智能检测东西,试图揪出哪些运用 ChatGPT 等东西在课堂上做弊的行为的学生。
不过,从成果来看,这款检测东西并不是那么好用,或许存在误判学生运用 AI 东西来完结论文和作业。
当下,AI谈天机器人不断改进和升级,相比之下,能够区分人工智能生成的文本和人类编写的文本的东西却远远落后。这意味着,其实教师很难通过AI检测东西判断出哪些作业和论文是运用 AI 东西来完结的。
Turnitin 宣称其检测器的准确率为98%。,但在对Turnitin的测验中,记过运用的16个检测样本(包含人工编撰的、人工智能生成的和混合来源的论文),该东西有一半以上检测成果是错误的。
尽管该公司确实在其网站上指出,其东西的成果不应该被用来指控学生做弊,但这并不能阻止教师现实中仍会凭借这款东西来进行判断。如果你去看看reddit的ChatGPT版块,会发现无数学生被指控在论文中运用人工智能的例子。
像Turnitin这种AI检测器其实一直面临着困扰,即使是OpenAI自家开发的AI检测东西,检测的成果也远远达不到完美的规范。
鉴于人工智能模型的最新进展,这个问题注定会变得愈加扎手。随着GPT-4和谷歌Bard等AI谈天机器人的升级,它们逃避检测的能力会越来越强。别的,谈天机器人和人类之间的界限越来越模糊。
曾在OpenAI和谷歌工作过的英伟达人工智能科学家吉姆·范(Jim Fan)告诉福勒:“我不认为AI检测东西是长时间可靠的,人工智能会变得越来越强壮,它的写作方法会越来越像人类。”