微软:人工智能推理又出新应用计算机也能猜字谜
曾几何时,在孩子们的童年还没有被各类智能手机和电脑游戏所占领的年代,父母和长辈们会不时兴致勃勃地把尚且年幼的孩子叫到跟前,出一些字谜让他们猜,而后饶有兴致地分享各类字谜的解法。随着时代的车轮不断向前,猜字谜这项有趣的中国传统民间文化逐渐消失在了人们的视野中。现在,我们很难有机会在除了元宵节之外的日子体验猜字谜游戏的乐趣。即便能够体验,现代的青年人恐怕在面对各类字谜时,也会显得无从下手吧。
元宵节当天,微软亚洲研究院在已有的微软对联平台上推出了一个新功能——微软猜字谜。当用户输入谜面后,系统自动分析谜面,而后迅速给出谜底。更有趣的是,这款系统还可以为用户自动生成谜面。当用户输入谜底(单个字)后,系统可自动生成若干谜面供用户选择。
字谜是中国文化独有的内容,是以一个或几个汉字为谜底的谜语。这种谜语的编写或是利用了汉字的造字规律,或是利用了汉字形、音、义某一方面的特点,既有趣味,又有知识内涵。根据谜面的不同,字谜可分为:字形谜、字义谜、典故谜等多个类别。由于中国字义谜和典故谜的构成更为复杂,此次微软亚洲研究院推出的计算机自动猜字谜系统主要针对的是字形谜,即谜面是根据谜底(一个字)的字形而设计的。
这款字谜系统由微软亚洲研究院自然语言计算组开发,耗时四个月。开发这样一个系统,研究人员需要首先进行大量的数据挖掘工作,并从收集到的大量字谜中挑选出字形谜。而后建模,用统计机器学习的方法对模型进行训练,得到一个能将各类自然语言描述转化为特定偏旁部首的优化模型。最后,将得出的各类偏旁部首映射到有可能的字,即谜底。在这款字谜系统的页面中,我们不仅在输入字形谜的谜面后可以看到最佳答案,而且还可以看到推理的过程,这对于猜字谜的思维训练是非常有帮助的。
自然语言计算组负责人,微软亚洲研究院首席研究员周明是机器翻译和自然语言处理等领域的专家,曾主导了微软对联系统的开发。他表示:猜字谜是在微软对联系统之后,我们对人工智能的又一个有意义的尝试。这些创新集中体现了NLP 2.0的战略思想,即对基于互联网的平台,对大数据进行搜集、利用统计机器学习方法自动学习建立智能模型、然后快速上线获得用户反馈从而把用户引入到创新的过程之中。猜字谜系统的水平也会不断提升。
当然,推出这款基于字形谜的计算机自动猜字谜系统仅仅是个开始,微软亚洲研究院的研究员们还将继续深入研究,推出包括更多类型的字谜系统,以及扩展到字谜之外的其他类型的谜语。