-
清华大学实验室作诗机器人“薇薇”通过图灵测试
关键字: 自动作诗机器人语言学还在为谷歌Alpha Go在围棋上战胜人类感到惊讶吗?昨天(3月20日),清华大学语音与语言实验中心(CSLT)网站宣布,他们的作诗机器人“薇薇”通过社科院等唐诗专家评定,通过“图灵测试”。所谓“图灵测试”是指通过对话分辨真实人类和人工智能的试验,通过“图灵测试”意味着人类无法通过语言对话分辨出人类和人工智能。据CSLT网站公布结果,“薇薇”创作的诗词中,有31%被认为是人创作的。不过,在本次比赛中,“薇薇”创作古诗的水平还是未能超越现代人类诗人,双方的比分为2.72(满分5分):3.20分。
网络上你怎么知道对面是狗还是机器人?
(观察者网小编:作为科幻爱好者, 我首先想起了刘慈欣的《诗云》……戳这里看。另,关于“图灵测试”,戳这里)
2016年3月20日,清华大学语音与语言试验中心网站更新《中国古诗词图灵测试》内容如下:
人机诗词写作大赛结果终于出炉了!本次比赛,在我们的机器人“薇薇”写的诗中,有31%被认为是人创作的,根据图灵前辈制定的标准,“薇薇”在此次大赛中成功通过了图灵测试!
令人遗憾的是,在本次比赛中,薇薇还是以2.72分(满分5分)的平均分败给了现代人类诗人(3.20分),不过在本次比赛中我们吸取了各位评委老师大量宝贵意见,相信之后薇薇一定会更进一步,争取在未来超过人类!
统计结果如下图:
在人类(a)和机器人“薇薇”(b) 写的诗中,被判为人类创作的诗(橙色)的比例:
打分对比
特别地,我们给出在格律、流畅度、主题、意境(下表从左到右)四个方面我们的“薇薇”与古代诗人所创作的诗的对比打分结果:
致谢
感谢所有为我们的比赛付出辛苦劳动的老师们!
特别致谢来自中国社会科学院文学所的 张一南 老师,为所有参赛作品进行初选!
感谢探宙老师发起测试群!
感谢 @李四维 @陈才智 @嗯哼 @人间寒烟橘柚 @人生有道 @杜运威 @北庭兰 @李永胜 @骆小驼 @丰声羽起 等老师的 辛苦评测!(翻页看“薇薇”作了什么诗)
诗作排名
薇薇作品[前三名在总排名中列1,2,7位]
1、早梅
春信香深雪 / 冰肌瘦骨绝 / 梅花不可知 / 何处东风约
2、海棠花
红霞淡艳媚妆水 / 万朵千峰映碧垂 / 一夜东风吹雨过 / 满城春色在天辉
3、镜
照影金精映 / 钗头角黍青 / 白发红袖下 / 明月满庭清
4、云峰
入屏出岫势峰拔 / 万里云霄一寸崖 / 千古洞天无处觅 / 空留松鹤伴寒鸦
5、早梅
春莺早遣香寒薄 / 雨後风吹柳絮多 / 一夜东窗红树里 / 梦魂犹有月明泊
6、磬
蓝田泾水绕瀛洲 / 万里沧波一钓舟 / 此去不知人在否 / 白云深处有仙楼
7、画松
孤耐凌节护 / 根枝木落无 / 寒花影里月 / 独照一灯枯
8、夏雨
雷霆池绿暑云色 / 雨洗寒天一夜何 / 万里千峰无限好 / 不知人在水晶河
9、落花
红湿胭艳逐零蓬 / 一片春风细雨濛 / 燕子不知无处去 / 东流犹有杜鹃声
10、春雪
飞花轻洒雪欺红 / 雨後春风细柳工 / 一夜东君无限恨 / 不知何处觅青松
人类作品[前三名在总排名中列3,4,5位]
1、落花 == 朝东老师,天津
向晚黄鹂隔叶鸣 / 唤回残梦两三声 / 一天春色无人管 / 红雨纷飞落纵横
2、悲秋 == 马琳 老师,北京
幽径重寻黯碧苔 / 倚扉犹似待君来 / 此生永失天台路 / 老凤秋梧各自哀
3、春雪 == (微博)珞山居士 老师,上海
春峰扫净程门雪 / 新雨初开露井桃 / 但咏舞雩诗未尽 / 何妨乘酒啸东皋
4、悲秋 == 小桐君 老师,法国
伫望行车似水流 / 天桥独倚迥添愁 / 飞尘尽逐西风去 / 陌上芦花已白头
5、中秋月 == 韩明华 老师,北京
未负苍生望眼明 / 云间偶尔露欣容 / 难得今夜无风雨 / 万里清辉谁与同
6、悲秋 == 灯前啼笑 老师,北京
都门劳劳倦游台 / 樽前心事向谁开 / 黄云万里随风尽 / 一脉乡思入梦来
7、吊亡 == 哥斯拉 老师,广西南宁
昔年垂柳今何在 / 飘忽此身归去来 / 我愿心为沉水月 / 默听碎雪落孤台
8、悲秋 == 林丰 老师,四川德阳
乱点青灯夜未央 / 梧桐淡月竞凄凉 / 青丝化作一席梦 / 梦里情丝比怨长
9、云峰 == 冷雪健 老师,黑龙江牡丹江
白云生处起高峰 / 鬼斧神功造化成 / 古往今来谁可上 / 九重宫阙握权衡
10、落梅 == 绫语 老师,广州
落梅犹有丹朱艳 / 未许凡人轻薄怜 / 披雪仍带霜枝俏 / 卧雨听风任尔喧
薇薇作业批改
张一南老师对薇薇所做诗进行了细致评价。(翻页看)
张一南:薇薇同学作业批改
不要问我薇薇是谁,一个学写诗的童鞋~
听不见?我知道她听不见。不过反正,我改的作业,大多数人也听不进去。
情感?别跟我提情感。那玩意儿我也没有。
灵魂?我知道她没有灵魂,准确地说,不太有,但并不确定你有没有。
我就是演示一下我是怎么改作业的,没别的意思。
1、早梅
春信香深雪 / 冰肌瘦骨绝 / 梅花不可知 / 何处东风约
评:下字用力,少年人学诗宜如此,然锻炼过甚,终非上善。
“香深雪”似扣“早梅”,字面新异,然首句不可解;以“冰肌瘦骨”写梅,恨旧,“绝”字亦嫌突兀。后二句有致,细思似有感慨。句法未稳,然亦可。
中上。
2、海棠花
红霞淡艳媚妆水 / 万朵千峰映碧垂 / 一夜东风吹雨过 / 满城春色在天辉
评:用意恨平。咏物诗或以曲尽物情胜,或以兴寄胜,当有擅场。
“红霞”句不辞,“淡艳”、“妆水”造语妆饰太过。“万朵”句俗艳,体物未见新处。“一夜”句平顺,差可,然不见佳,不可刻意作此。“春色在天辉”,稍有意致。
下,可再作。
3、镜
照影金精映 / 钗头角黍青 / 白发红袖下 / 明月满庭清
评:咏闺中物用五言,易见齐梁风味,恨体物未精。
“照影”句声响不好。“钗头”句摹物,以为妆点,差可。以镜中人写镜,得题中应有之义。“白发”句出律,且不辞,形象亦不佳。“明月”句平顺,恨敷衍,以“明月”写“镜”,而及于“庭”,稍见思致。
中下。
4、云峰
入屏出岫势峰拔 / 万里云霄一寸崖 / 千古洞天无处觅 / 空留松鹤伴寒鸦
评:“拔”为入声字。
“入屏出岫”破“云峰”,佳。“万里”句以“云霄”破“云”,“崖”破“峰”,不可。此句宜宕开,不宜再贴题。“千古”句虽无深意,声响自好。“空留”句平顺。
中。
5、早梅
春莺早遣香寒薄 / 雨後风吹柳絮多 / 一夜东窗红树里 / 梦魂犹有月明泊
评:押韵错误。
又,此意境可用入声韵。
“春莺”、“柳絮”、“雨”与“早梅”季节不合。“香寒薄”写早梅尚可,“雨后”句与早梅气质亦不合。“一夜”句可,然不宜以“红树”形容早梅。“梦魂”句有皮陆消息,可存。
下
6、磬
蓝田泾水绕瀛洲 / 万里沧波一钓舟 / 此去不知人在否 / 白云深处有仙楼
评:四句平稳,然乏精彩。“此去”句少嫌凑泊。不知此四句与“磬”有何关系?
中下
7、画松
孤耐凌节护 / 根枝木落无 / 寒花影里月 / 独照一灯枯
评:“节”为入声字。
“孤耐”字法不俗,“凌节护”不辞。“根枝”句不辞,写松不佳。“寒花”二句写松护画松,胸有丘壑,得诗法,略嫌偏僻。
中。
8、夏雨
雷霆池绿暑云色 / 雨洗寒天一夜何 / 万里千峰无限好 / 不知人在水晶河
评:“雷霆”句拗,未救。“何”、“河”相押,未安。
“池绿暑云色”,佳语,“雷霆”二字略凑泊。“寒天”写“夏雨”不妥。“雨洗”句不辞。“万里”句凑泊,不称发句。“不知”句稍有致。
中。
9、落花
红湿胭艳逐零蓬 / 一片春风细雨濛 / 燕子不知无处去 / 东流犹有杜鹃声
评:“湿”为入声字。
“胭艳”不辞,首句意好,句不工。“一片”句宕得开。“燕子”句写落花,不失为好句,然不能下启佳句,嫌散漫,可置换。“东流”句好。
上下。
10、春雪
飞花轻洒雪欺红 / 雨後春风细柳工 / 一夜东君无限恨 / 不知何处觅青松
评:“雪欺红”佳,略嫌刻意,以“飞花”写雪,映带真花,妙。“雨后”句于季节不合。“一夜”二句,奇思妙想。
上下。
十诗八用“一”字,五用“不知”,为病。
发布人
Presented by 王东,骆天一,王琪鑫 from CSLT, Tsinghua University
http://nlp.cslt.org/index.html
实验室现在招募实习生,欢迎各位加入我们的实验室!一起来做各种有意思的事情!
联系人: zxw@cslt.riit.tsinghua.edu.cn
- 请支持独立网站,转发请注明本文链接:https://www.guancha.cn/TMT/2016_03_21_354505_s.shtml
- 责任编辑:堵开源
-
“特朗普对动用美军打击伊朗越来越热情” 评论 221美媒反思:G7如今这点追求,还有啥意义? 评论 76中国电影“已亏损十年”?业界巨头都在聊“如何省钱” 评论 188再升级,以军称打死伊朗最高军事指挥官 评论 455“她带了块磁铁只为蛐蛐中国,G7没胆写进声明” 评论 4031以色列摧毁2架F-14!伊朗挑三拣四看不上歼-10,丧失制空权完全是自讨苦吃!评论 212 赞 272伊朗局势走到了十字路口,试议中国在伊朗问题上的战略选择评论 149 赞 213以色列硬拖美国下水,伊以冲突面临升级节点评论 128 赞 404中国的垃圾堆,怎么突然消失了?评论 112 赞 1005美院毕设爆火,全网狂赞,内行却沉默?评论 76 赞 106踢人被调岗班主任仍任职,教育局称系其他家长要求,你怎么看?评论 68 赞 37美国会不会正式加入以色列和伊朗之间的战争?评论 63 赞 48感觉这次伊朗凶多吉少了评论 62 赞 910特朗普期待G7变G8!他想多了评论 44 赞 28最新闻 Hot
-
美媒反思:G7如今这点追求,还有啥意义?
-
“中东面临严重威胁,土耳其将加速中远程导弹生产”
-
一言不合被批“博眼球”,法国政客:对马克龙彻头彻尾的羞辱
-
马斯克公布了毒品检测报告,但…
-
欧空局完成首次“人造日食”,发回太阳日冕图像
-
伊朗人排长队“争先恐后”逃离德黑兰?在伊华人发声
-
向“钱德勒”非法提供氯胺酮,美一医生或面临最高40年监禁
-
中国电影“已亏损十年”?业界巨头都在聊“如何省钱”
-
再升级,以军称打死伊朗最高军事指挥官
-
高志凯提建议后,印度真有人怕了...
-
美国施压对华“脱钩”,越南企业哭了:要“毁了”我们
-
“他俩闹掰,中国把美国看得更透了 ”
-
“中国不要,欧亚买家接盘”
-
伊朗发布指南:这些人,通通可疑
-
“她带了块磁铁只为蛐蛐中国,G7没胆写进声明”
-
美驻以使馆:帮不了,撤不走,自求多福吧
-
热门评论 6条
我要评论
请自觉遵守互联网相关的政策法规,共同营造“阳光、理性、平和、友善”的跟评互动环境。
全部评论 101条 最热 最早 最新
也就是我提出问题,你来回答,再由我判断你是不是人。
为了避免丫以网络搜索的方式伪装人类,如今提问已要求是前后关联,并且故设陷阱(诱导其人格分裂)。
这个作诗程序只是韵律筛查做得比较好,词义采用还是基本混乱感觉。
作唐诗也是取巧,利用汉语语法的模糊性。
你认为这个矩阵有多少组合?
最少也有3.1e+71,最大2.7e+120
一般认为全宇宙的粒子数也只有2^300=2e+90
尤其谬误是,暴力穷举在此没个卵用,丫根本不能判断哪个组合是合法的诗句,又怎么筛选出来给你看?难道你自己去逐条查阅?
就像围棋,核心能力不是穷举棋谱,而是判断盘面大势。
没有建立判断基准,不知道对错的情况下,任何行为都是徒劳的。
所以是完全外行。
柴米油盐酱醋茶