正文
不过,Eliza 的脚本是一位严厉阴沉的德国计算机科学家编写的,而智能芭比娃娃的脚本则是由来自美泰公司和普尔史特林公司的一支团队共同编写的。除此之外,Eliza 的自然语言处理能力充其量只能用粗糙来形容,智能芭比娃娃的能力却依托的是机器学习、声音识别和处理能力领域的最新进展,而且,像亚马逊的 Alexa、苹果的 Siri 和在这股“语音计算”浪潮中萌生出的其他产品一样,智能芭比娃娃可以发出真人的语音。
在普尔史特林的员工转向创作其他角色时,我仍和他们保持着联系。直到公司的 CEO、皮克斯的前 CTO——Oren Jacob 告诉我,普尔史特林的野心可不仅限于娱乐产业而已。“我希望打造一种技术,可以让人们与不存在于现实中的角色对话,要么是一些虚构的人物,比如巴斯光年,”他说道,“要么是已故的人物,比如马丁·路德·金。”
2016年4月24日,父亲确诊患上癌症。碰巧在几天后,我发现普尔史特林计划公开他们制造对话机器人的软件。不久之后,所有人都可以利用这款软件来制造自己的对话机器人了。
一个想法几乎是瞬时之间在我脑海中成型。连续数周内,我往返于父亲一连串的医生预约、药物测试和手术治疗之间,我始终都把这个想法埋在心底。
我做梦都想打造一款“父亲机器人”,一款聊天机器人,它模仿的不是小孩的玩具,而是一个活生生的人——我的父亲。
而且,我已经开始了原始资料的收集工作:那卷收录在我书架上的91970个文字。
我一直都摆脱不了这个想法,它在我脑海中一直膨胀,我不管它是不是合理。就在这时,我碰巧读到网上的一篇文章,如果我再迷信一点,可能真的就以为这是一股未知力量给我的神谕了。这篇文章讲述的是谷歌的两位研究员所做的一项神秘项目,他们将2600万句电影台词输入到神经网络中,打造了一款聊天机器人,这款机器人可以通过概率机器逻辑调取网络语料库中的信息。研究员接着问了它一堆哲学问题。
“活着的意义是什么?”一天,他们问道。
机器人的答案让我震惊,仿佛像是在挑战我。
“获得永生。”它回复道。
“等等,”这是母亲至少第三次问我这个问题了,“你能再和我说一下聊天机器人是怎么回事吗?”
如今已是八月,我决定是时候告诉他们我的想法了。在我考虑打造一款“爸爸机器人”意味着什么时,我列出了所有的好处和坏处。
坏处显而易见。一边制造“爸爸机器人”,一边眼睁睁地看着真正的父亲一步步走向死亡,是件很痛苦的事情。而且,身为记者,我很清楚,我可能最后要写一篇类似于此的文章,这会让我闹心并有很深的负罪感。最重要的是,我担心这款机器人会影响我和父亲的关系,毁掉我对父亲的美好记忆。或许这款机器人能唤起家人对父亲的回忆,但毕竟离“真实的父亲”太远,反而会让他们毛骨悚然。
我提心吊胆地将这个想法告诉了我的父母。我告诉他们,“爸爸机器人”的意义在于以一种更加有活力的方式讲述父亲的生平故事。鉴于现有技术的局限,加上我这个码农缺乏经验,这款机器人永远也只不过是我父亲的一道影子而已。即便如此,我还是希望它能用我父亲那种独特的方式与人交流,至少能体现一下父亲的个性。“你们觉得怎么样?”我问道。
父亲同意了,尽管答案含糊其辞,语气还有些抽离。他是一个异常乐观的人,但最终诊断还是渐渐将他推向了虚无主义。他只是耸了耸肩,然后说:“好的。”
家里其他人的反应则显得更加热情。我的母亲在弄清这个想法后,表示她喜欢这个主意。我的弟、妹也表示同样的看法。“这为什么会成为一个问题呢?”弟弟一下就感受到了我的不安,但不觉得会影响到什么。我提议所做的事情的确很奇怪,他表示,但这并不意味着这就是件坏事。“我能想象到自己有多渴望和爸爸机器人聊聊天。”他说道。
一锤定音。如果有一丝希望可能让人通过数字获得永生,那我盼望第一个获得永生的人就是我的父亲。
我的父亲是这样的一个人:生于1936年1月4日,被身为希腊移民的父母拉扯大,他们从加州的特雷西搬到了奥克兰。父亲是加州大学伯克利分校经济系的毕业生、ΦβK 联谊会会员、《加州人日报》的体育编辑、洛杉矶一家大律所的合伙人。作为伯克利分校加州纪念体育场的解说员,1948年至2015年间,他解说了七次主场以外的所有足球比赛。他是吉尔伯特与沙利文的死忠粉,他多次出演《皮纳福号军舰》等喜剧,还担任过轻歌剧演出公司 Lamplighters 的负责人长达35年。他的兴趣爱好广泛,从语言到建筑都有涉猎。他精通语法,爱讲笑话,是个无私的丈夫和爸爸。
以上就是我父亲的生平梗概,我希望能将它们编写进一个可以沟通、聆听、记忆的聊天机器人里。不过,首先,我得让它开口讲话。2016年8月,我坐在电脑前,第一次启动普尔史特林提供的工具。
为了不让付出的劳动付之东流,我决定,至少在最初,爸爸机器人可以通过文字和操作者沟通。不太清楚编程的方向,我敲下了“你好吗?”作为机器人的开场白。
现在,机器人已经可以向外界打招呼,是时候让它学习聆听了。这要求我能预测操作者可能输入的回复,为此,我输入了很多明确的指令:“很好”、“不错”、“糟透了”等等。每一条回复都是一条指令,每条指令都用绿色的语音框标识出来。每条指令下,我编写了一条合适的回复。例如,如果用户输入“很好”,我会教机器人回复,“听你这么说,我很高兴。”最近,我还编进了递补语言,可以回复我所有没有预料到的输入指令,比如,“感觉今天有失水准。”我选择让它回复,“生活就是如此啊。”
就这样,我编写出了第一组对话,一个聊天机器人就这样诞生了。
诚然,它就是 Pandorabots CEO 劳伦·坤泽口中的“垃圾机器人”。就像“黑暗府邸”一样,我已经摸索到了大门,但面前的路让我困惑。只有当机器人的代码像一座巨大迷宫的岔路一样多时,机器人才能更好地运作,用户的输入触发机器人的回复,而回复又触发新一轮的输入,如此来来往往,程序内就有了千万条内容。
导航命令随着会话结构的迂回,逐渐变得错综复杂。你预计用户可能会说的语言片段,也就是我们所说的指令,可以通过布尔逻辑支配的海量短语和同义词周详充分地写下来。多组指令组合形成可供重复使用的元规则,也就是意图,以解释更复杂的用户话语。这些意图甚至可以通过使用 Google、Facebook 和普尔史特林功能强大的机器学习引擎来自动生成。 除此之外,我还可以选择让这款机器人通过 Alexa 与我的家人交谈(尽管他的回答通过一个女性的声音放出来会有点令人不安)。
学习这些复杂难懂的指令需要数月。尽管如此,我那句站不住脚的“你好吗?”还是教会了我如何创建海量对话。
花了几周时间熟悉了这套软件后,我抽出一张纸,草草地写下了“爸爸机器人”的大纲。我决定,在简短的问候之后,用户可以选择跟机器人聊起父亲的某段人生经历。为了展示这个概念,我在纸的中心写下了“对话中心”,接着,我在四周画了射线,指向父亲生平的不同方面——希腊、特雷西、奥克兰、大学、职业等等。我还写了一个新手指南,告诉第一次使用的人如何更好地跟机器人交流。