一声棒喝,本不立文字
偏要著録,已是二义

Hugging Face · Daily Papers

阿拉伯语及其方言的指令引导诗歌生成

Instruction-Guided Poetry Generation in Arabic and Its Dialects

Abdelrahman Sadallah, Kareem Elozeiri, Mervat Abassy, Rania Elbadry, Mohamed Anwar, Abed Alhakim Freihat, Preslav Nakov, Fajri Koto
来自 Mohamed Bin Zayed University of Artificial Intelligence
二〇二六年五月一日 · arXiv:2604.27766 · PDF · Code

长期以来,诗歌一直是阿拉伯语使用者的重要艺术形式,也是表达思想与文化身份认同的有力媒介。尽管现代阿拉伯语使用者仍然重视诗歌,但现有关于 Large Language Models (LLMs) 中阿拉伯语诗歌的研究,主要集中在阐释或元数据预测等分析任务上,例如押韵模式和标题预测。

相比之下,我们的工作关注阿拉伯语诗歌创作的实际需求,通过引入可控生成能力,帮助用户写作诗歌。具体而言,我们提出了一个大规模、经过精心整理的基于 instruction 的数据集,涵盖 Modern Standard Arabic (MSA) 以及多种阿拉伯语方言。该数据集支持根据预定义标准(包括风格和押韵)进行诗歌写作、修改和续写等任务,也支持诗歌分析。

实验表明,在该数据集上 fine-tuning LLMs 后得到的模型,能够根据自动化指标以及阿拉伯语母语者的人工评估,有效生成符合用户需求的诗歌。数据和代码可在 https://github.com/mbzuai-nlp/instructpoet-ar 获取。

译自 Hugging Face · Daily Papers · arXiv:2604.27766 · 录于 二〇二六年五月一日