新华社电 “早春江上雨初晴,杨柳丝丝夹岸莺。画舫烟波双桨急,小桥风浪一帆轻。”
谁能想到,这是人工智能以“早春”为关键词创作的一首诗。作者“九歌”,由清华大学计算机科学与技术系孙茂松教授带领学生团队历时三年研发而成。
在综艺节目《机智过人》中,微软的聊天机器人小冰以一曲中国风歌曲《桃花梦》“险胜”人类对手。当歌手唱出“茫茫夜雨中,往事如风,耳边桃花笑春风,梦里你我相逢”这般古风浓郁的句子,很多观众以为这是人类所作。写诗、作曲、绘画,人工智能创作的春天悄然到来……
技术上“熟读唐诗三百首”
微软亚洲研究院副院长周明是一个文艺爱好者。他和研究团队教会了小冰写现代诗,作曲则是新技能。
周明说,神经机器翻译、聊天机器人、阅读理解和创作是自然语言处理技术应用的四个主要方面,难度逐渐递增,创作处于金字塔顶端,最难突破。
“一开始,人们找不到怎么针对创作建模,因为它是感性的。写诗、作词,都是一些文采飞扬、灵感突现的东西,很难捕捉。”他说。得益于近年来深度学习和神经网络技术的进步,人工智能创作才屡获亮眼成绩。
周明介绍,小冰写歌是一个“编码与解码”过程。研究人员首先用流行歌曲训练人工智能机器人。训练充分后,就可开始创作:把歌曲主题以关键词形式输入后,就会被编码成人工智能可以理解的语言,机器人再以人能理解的方式解码输出,成为一句歌词;然后把这句词与原来输入的关键词合并作为新的输入,就可得到第二句,如此循环得到整首歌词。同样,也可输入歌词,对应翻译成曲谱。
“九歌”学写诗,也是“熟读唐诗三百首,不会作诗也会吟”。
“九歌”主创者、清华大学研究生矣晓沅输入了30多万首唐朝以来的古诗作为语料库,利用深度学习模型让计算机学习。除了对诗句平仄、押韵规定外,并未人为给出任何规则,而是让计算机自己学习古诗中的“潜规则”。
“计算机怎样作出这样的诗,我们也不知其中规则。”孙茂松说,这是深度学习的“黑箱”现象。在他看来,每首古诗像一串项链,项链上的珠子就是字词。深度学习模型先把项链彻底打散,然后通过自动学习,作诗时,再将不同珠子重穿成新项链。
古人作诗多为抒发情志,风格偏悲愁,这也让“九歌”写的诗有些“伤春悲秋”。团队希望通过强化一些轻松情绪样本的训练,让“九歌”变得积极一些。此外,如何在保证全诗一致性的基础上写出更长的诗歌,也是新挑战。
实现“人人都是诗人、画家或音乐家”
除了写诗作曲,人工智能还进化出了写小说、作画等新技能。日本研发的人工智能所创作的科幻小说《电脑写小说的那一天》,骗过了所有人类评审,成功入围日本微小说文学奖;谷歌人工智能还能进行绘画创作,有画作被拍出了8000美元高价。
人工智能已在棋牌、电子游戏等领域战胜人类,在艺术创作领域的最新进步,是否意味着它在这方面超越人类也为时不远?
周明认为,目前人工智能创作还只是基于大数据的模仿,离真正人类的创作智能还差得很远,“训练人工智能创作方面的数据还不够多,比如说给歌词谱曲的数据;其次是灵感不够,因为光凭数据,只是一个追随者,写词作曲都似曾相识,没有一种灵感突然迸发的感觉。”
在孙茂松看来,目前人工智能创作是颇受限制的创造性,理论上并未超出前人在千百年诗歌创作实践中无意识“界定”的创作空间。古人写诗是“功夫在诗外”,常根据经历有感而发,有内容有意境,而机器暂时难以做到“托物言志”或“借景抒情”。
关于人工智能在创作领域超越人类的担心,专家认为是杞人忧天。“在音乐创作、诗歌、散文等需要很深内涵或灵感的领域,我个人认为机器基本不大可能达到人的状态,但会对人创作产生辅助。”周明说。
不过,人工智能可提升专业创作者的效率,“如在写作时想不到用某个词,但人工智能为你联想出一个词,让你发现原来可以这么写。”对普通人而言,“九歌”等人工智能创作系统可降低创作门槛,实现“人人都可以是诗人、画家或音乐家”的梦想。
孙茂松说,团队未来计划对“九歌”系统升级,让它判断人作诗的好坏,如在韵脚、平仄方面是否有误,在遣词造句方面是否词不达意或句不成篇,帮助人改进创作技能;还可通过大数据对古代文献进行“人文计算”、定量分析研究。
除了创作本身,研究机器创作还可为人工智能其他领域带来意想不到的好处,开启多领域交叉学科的创新。
“在让小冰学习音乐创作前,我们不曾想到音乐也可以用自然语言技术处理。”周明说,“所以自然语言一旦突破,就可带动认知智能突破,带动整个人工智能突破,就有很多原来不敢想象的场景可以落地了。”