中国工业和信息化部-新视角! 研究发现:大语言模型通过阅读文档学会使用工具
中国工业和信息化部:本文概要:
1. 研讨发现,言语模型经过阅览文档成功学会运用东西,乃至可以创造新的办法。
2. 运用文档练习的模型在零样赋性能上与仅运用演示练习的模型适当乃至更好。
3. 经过阅览文档,言语模型可以学习杂乱的图画处理和视频跟踪功用。
站长之家(ChinaZ.com)8月7日 音讯:根据一篇新的研讨论文,言语模型可以经过阅览东西和API文档来学习运用东西,并在某些情况下乃至创造新的办法。与传统的经过演示练习的办法相比,仅运用文档的模型在零样赋性能上表现适当或更好。
该团队运用文档和演示对六种不同使命的多个模型进行了练习,并比较了它们的性能。仅运用文档,零样赋性能等于或优于仅从演示中学习的模型。然后,在扩展到包括200个东西的数据集后,榜首个模型的性能明显优于第二个模型。
在图画处理范畴,该模型可以经过学习新的、最早进的图画处理模块的文档来履行杂乱的图画处理和视频跟踪功用,而无需进一步演示。该团队特别强调,该模型可以重现最近发布的图画处理技能,例如 Grounded-SAM 和 Track Anything 的视频跟踪,展示了该办法在主动常识发现方面的潜力。
image.png
论文指出:“总的来说,我们经过关注LLM的内部规划和文档推理能力,而不是经过演示清晰辅导他们的行为,提醒了LLM运用东西的新视角。”
这项研讨提醒了阅览文档关于言语模型学习东西运用的重要性,以及文档关于扩展和主动常识发现的潜力。