Hugging Face · Daily Papers
阿拉伯语及其方言的指令引导诗歌生成
Instruction-Guided Poetry Generation in Arabic and Its Dialects
来自 Mohamed Bin Zayed University of Artificial Intelligence
摘要
长期以来,诗歌一直是阿拉伯语使用者的重要艺术形式,也是表达思想与文化身份认同的有力媒介。尽管现代阿拉伯语使用者仍然重视诗歌,但现有关于 Large Language Models (LLMs) 中阿拉伯语诗歌的研究,主要集中在阐释或元数据预测等分析任务上,例如押韵模式和标题预测。
相比之下,我们的工作关注阿拉伯语诗歌创作的实际需求,通过引入可控生成能力,帮助用户写作诗歌。具体而言,我们提出了一个大规模、经过精心整理的基于 instruction 的数据集,涵盖 Modern Standard Arabic (MSA) 以及多种阿拉伯语方言。该数据集支持根据预定义标准(包括风格和押韵)进行诗歌写作、修改和续写等任务,也支持诗歌分析。
实验表明,在该数据集上 fine-tuning LLMs 后得到的模型,能够根据自动化指标以及阿拉伯语母语者的人工评估,有效生成符合用户需求的诗歌。数据和代码可在 https://github.com/mbzuai-nlp/instructpoet-ar 获取。