要在你的朋友圈里找出一位没有看过《权力的游戏》的朋友是不是特别困难。这部由美国作家乔治·R·R·马丁所写的小说,经过HBO改编成电视剧后圈粉无数,甚至连人工智能系统也是它的粉丝。

加拿大人工智能初创公司Maluuba日前就推出了一款机器学习系统,可以让计算机像人类一样阅读文章,理解小说故事的情节。

不同于图片和声音识别技术,让机器正确理解人类知识和语言更加困难。这也是人工智能遇到的重大挑战之一。因为语言理解领域缺乏大规模标记数据集,机器学习时,很难对该领域的相关环境进行模拟。尽管互联网上包含无数的网页,上面拥有无数的文字内容,但还没有人能找到以机器能够理解的形式将内容输给机器。简单地说,机器还没有掌握人类学习知识的方法。

因此,让机器学会阅读理解人类语言是一个里程碑式事件,也是真正人工智能应该达到的目标。谷歌、Facebook和IBM等公司也在关注机器学习阅读理解能力。但从目前的测试结果看,这家加拿大的初创公司已经领先谷歌等巨头,走在了前面。

EpiReader对自然语言的理解超过谷歌、Facebook

Maluuba推出的系统名为EpiReader,研究人员设计这个系统的目的在于用来解决特定类型的理解任务。研究人员会将一段文字的默写字词抹去,EpiReader需要根据上下文语境来补全信息。据研究人员介绍,EpiReader使用了2层神经网络,这是一种模拟人类大脑神经元的计算机系统。第一层神经网络能让系统基于对于段落的理解挑选可能存在的答案,第二层神经网络用来评估第一层给出的答案,并最终给出一个正确的回答。

Maluuba用了大量的文本对EpiReader进行了测试。与去年谷歌DeepMind用CNN和《每日邮报》的30万篇新闻稿,Facebook用98本儿童经典读物做文本测试相比,EpiReader测试的文本数量更多,能让机器构建起词汇语义理解的框架。

从测试结果看,EpiReader在填空题中分别得到了74%和67.4%的准确率。根据《the Verge》的报道,国内许多人工智能的专家认为,这个测试结果是目前所有机器学习语义理解中的最高分,打败了谷歌的DeepMind,Facebook和IBM沃森在今年3月份公布的结果。

有趣的是,Maluuba还让EpiReader阅读了《权力的游戏》第5季中的部分章节,EpiReader阅读完后,迅速理解了故事内容。当工作人员问它,是谁刺死了John Snow(《权力的游戏》男主之一)时,机器直接给出了准确的回答:守夜人。现在如果你问苹果手机的Siri助手,它可能还完全不知道你在说什么,从而将你推到搜索网页来寻找答案。

除了《权力的游戏》,EpiReader还读过《哈利波特与魔法石》,也能正确回答研究人员提出的问题。

“这样的算法可以用到使用者手册、病人病例记录或者消费者服务的文件中。”Maluuba产品副总监Mohamed Musbah在接受《MIT科技评论》采访时说。

目前,该公司的产品已经运用到消费类电子产品和设备制造商上。比如,LG 旗舰G系列手机的voicemate应用就采用了Maluuba技术。2013年2月,Maluuba正式宣布向Windows Phone平台迁移。Maluuba的Windows Phone 8版本拥有 Android 版本的大部分功能,例如可以搜索餐馆、影院、新闻和企业(以及进行语音购物)、设置闹钟、提醒和会议安排、打电话、发短信和邮件、指示方向和天气,甚至还集成了Outlook日历。

虽然功能与Siri、微软的Cortana相似,但Maluuba的工作人员显然不愿意自己被一个领域里的助手角色束缚。他们的目标是能做出代替人类阅读的程序,人类以后可以借助EpiReader,在任何地方找到想要的书籍,得出答案。

比起人工智能的图像、语音识别,语义理解更有市场

“我们真的很想在EpiReader系统里融入人类更高的推理和阅读理解能力,融入我们思考世界的方式。” Maluuba研发总监Adam Trischler在接受媒体采访时说。

Maluuba成立于2011年8月份,目前,公司在加拿大的蒙特利尔和滑铁卢两个地方设有研发实验室。这两个地方也是加拿大人工智能发展的重镇。公司大部分的研究人员来自蒙特利尔大学和加拿大滑铁卢大学,两个学校在计算机和深度学习两个领域里的学术成就,闻名世界。

2015年8月,Maluuba 融资900万加元(A轮)用于进一步推进深度学习研究。同年12 月,Maluuba在蒙特利尔开设了一个新的研发实验室。其中有13名深度学习方向的研究人员。据Maluuba官网介绍,公司关注机器学习中的两个细分研究领域:对话和机器理解。同时,也关心研发解决通用问题的人工智能,对解决真实世界问题更感兴趣。他们相信自己能找出更好的人机交互方式。

“这种技术在未来可以接入用户所有的交互过程中。”蒙特利尔大学机器学习算法研究所负责人,同时也是Maluuba的顾问Yoshua Bengio教授在接受《the Verge》采访时说,“Maluuba的技术非常特别,理解别人说什么、写什么,这个潜在的市场非常巨大,甚至比计算机视觉处理还大。我认为,这是我们如何与计算机交互的方式,未来它会无处不在。”

关注中国IDC圈官方微信:idc-quan或微信号:821496803 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2017-07-19 16:20:35
云技术 Uszkoreit 博士:深度学习还不足以解决NLP 核心问题
Uszkoreit 博士认为,语言技术是人工智能的核心部分,但当前的深度学习方法还不足以解决 NLP 领域的核心问题。他提到汉语在语义理解上的潜力。说起不久前 NLP 领域的大论战 <详情>
2017-07-19 13:56:16
区块链 区块链或将极大促进人工智能发展
那么区块链和人工智能结合,会带来什么呢,区块链+人工智能,会出现什么样的场景呢? <详情>
2017-07-19 09:42:40
大数据资讯 科技巨头争夺“量子霸权”,量子计算机或迎来爆发点
多年来,Google一直在将时间和金钱投入到一个雄心勃勃的梦想中:开发能真正运行的量子计算机。现在它正在考虑将量子计算应用到商业中。 <详情>
2017-07-18 14:29:37
市场情报 万达做好云+人工智能时代企业业务模式创新的使能者
近日,在中国云服务联盟成立大会上,万达网络科技集团万达云计算公司首席执行官刘克鸿表示,万达云将围绕企业数字化转型的核心战略需求来提供云计算服务,打造"三位一体、A <详情>
2017-07-18 11:33:00
运维管理 当数据中心遇上机器学习,你要失业了!
机器学习是人们迄今为止挖掘大数据潜力而发现的最强大的工具,而数据中心行业是受益最大的行业之一。 <详情>
总投资90亿元的中国移动厦门数据中心,一期电源工程项目候选人公示
2018-10-18 17:39:56
微型数据中心,是趋势?还是鸡肋?
2018-10-18 15:41:04
华云数据中标上药控股私有云千万级项目
2018-10-18 15:35:33
中国电信中层人事“大地震” 多名二级干部将进行调整
2018-10-18 15:30:48
央视海外 CDN 采购:腾讯云、网宿科技、金山云入围,价格分别为 509万元、460万元、981万元
2018-10-18 15:23:00
斯柯达计划将HPC计算量提升至15千兆次 扩建其数据中心
2018-10-18 15:12:00
北京通管局公布45家不合格电信设备生产企业 微软、小米上榜
2018-10-18 15:04:07
阿里云宣布新一轮降价:部分产品降90%
2018-10-18 14:53:59
赵丽颖婚讯导致微博崩溃,说明云计算在国内发展依然任重道远
2018-10-18 14:34:40
中国移动流量稳步增长,约11.4万台的大规模基站用综合机柜集采开启
2018-10-18 14:22:22
云南移动NB-IoT网络质量管理项目,诺基亚入围但只能三选一
2018-10-18 14:05:40
三大运营商展示“5G速度”:16个网络视频同时播放不卡顿
2018-10-18 13:54:44
维谛技术为深圳机场航站楼高效运营提供保障
2018-10-18 13:36:48
现场直播|光迅科技数据与接入产品业务部市场经理张玓:下一代光互联技术及其在开放数据中心的应用
2018-10-18 13:27:08
现场直播|Mellanox资深系统工程师于若信:面向未来数据的网络技术
2018-10-18 13:12:04