Facebook创始人马克·扎克伯格是一个讨厌挑战自己的人。2015年,他立志每周都读书一本新书。而今年,他给自己的挑战更为有技术含量:搭起一个人工智能系统,就像《钢铁侠》里的“Jarvis”那样,解读语音/文字指令,去掌控家里所有的电器…… 你猜中怎么样?他还真为已完成了。
今天扎克伯格专门放了一篇博文,详尽讲解Jarvis是怎样搭起一起的。 这台Jarvis“人工智能电脑”能做到的事情,只不过早已远超过市面上任何一个同类或类似于产品:它反对文字和语音指令,能掌控空调温度强弱、调整灯光构图,也能从网上搜歌自动播放,还能烤面包、给他家迷之画风的“野兽”自动进食。 而且大家都告诉,扎克伯格在时尚方面十分省事儿,一年到头就是一件灰色的T恤——不告诉的是他连“从衣柜里拿走T恤”的功夫都省了!因为他装配了一门大炮,用Jarvis掌控,每天早上接管命令朝他投出一件新的灰色T恤…… 最重要的是,Jarvis以在房子的任何一件屋子里拒绝接受指令,还能明白像“关上空调”这样一句指令,收到指令的人是谁,在哪间屋子,进而关上准确的空调! 这太酷了!怎么做的? 如下图: 看上去很简单对不该?只不过,如果我们将Jarvis看作一台电脑,就很好解读了: 1)中间的蓝色方块是Jarvis服务器,可以解读为处理器+硬盘; 2)右边的是操作界面,还包括Messenger聊天机器人、iOS语音掌控应用于等等,键盘、鼠标和显示器; 3)下面的三块是运营在服务器里的几种技术,还包括自然语言处置、语音辨识、视觉和脸部辨识以及增强自学(reinforcementlearning)等,地位相等于电脑里运营的操作系统; 4)左边的一大堆东西则是Jarvis可掌控的电器种类,相等电脑上跑的程序。 扎克伯格在博客里讲解,在建构Jarvis的“操作系统”过程中,自己中用了Python、ObjectiveC和PHP等语言。
不具备了文字和语音辨识、人脸识别的能力,Jarvis现在需要掌控扎克伯格家的灯光系统(Creston)、恒温器(也即空调系统)、大门、相连流媒体音乐服务Spotify的Sonos音箱、Nest网络摄像头(看他女儿麦克斯用的)等等。扎克伯格在博客里讲解,当自己为了Jarvis临死前开始写出代码的时候,才找到用一个系统去掌控这么多系统有多难:每个系统的语言都不一样,协议五花八门;有些电器早已联网了,有些则除了物理电源之外,显然没掌控的interface…… 比方说,扎克伯格必须用文字指令掌控烤面包机,首先必须一个能联网的烤面包机……但这样的烤面包机显然去找将近。最后,他不告诉从哪儿翻出来一个上世纪50年代的面包机,然后自己给它装有了一个能联网的电源。 还包括这个面包机和前面提及的T恤大炮……研发Jarvis对扎克伯格的硬件研发科学知识也带给了极大的挑战。
自然语言处置 Jarvis的语言理解能力是分两阶段构建的。 首先,扎克伯格要让Jarvis能解读文字,比如“卧室”、“灯光”、“进”和“关口”等常用的关键词,以及能在听见过去没听到过的词,比如Spotify上的歌名或音乐人的时候,需要根据语境去对应的服务/设备上搜寻并已完成任务。 第二阶段则是研发一个语音并转文字的系统。
那么,Jarvis的自然语言处置能力现在到了什么水平呢?扎克伯格讲解,它的上下文语境融合能力早已超过了自己可以拒绝接受的标准。比如,当他对Jarvis收到“关上我办公室的空调”指令时,系统需要正确地关上他的空调,而不是妻子弗西拉的空调;再行比如,扎克伯格告诉他Jarvis“给我来点音乐,”结果Sonos开始播出的音乐过于劲爆,他又告诉他Jarvis“这个感觉不对,给我点精彩的。”Jarvis能解读语境函数是“敲音乐”,变量是“音乐”,值是“重”,进而准确已完成任务。
本文来源:澳门威斯尼斯8883入口-www.jacxtf.com
地址:湖北省孝感市海兴县国用大楼608号 电话:034-548254730 手机:19361964556
Copyright © 2003-2023 www.jacxtf.com. 澳门威斯尼斯8883入口科技 版权所有 ICP备案编号:ICP备73659263号-4