凌晨四点,广州荔湾区某个老宅里,陈阿婆醒了。她摸索着开灯,手抖得厉害。
“阿婆,要饮水么?”墙角传来声音,带着点生硬的粤语腔调。
是机器人“阿广”,三天前刚部署的。烟火算法1.2版本。
“唔使。”陈阿婆说,但咳嗽起来。
阿广滑到床边,递上温水:“饮啖啦,你咳成咁。”
陈阿婆接过杯子,瞪它:“你学我个女把声做乜?”
“你昨晚讲梦话,叫‘阿玲’。”阿广眼睛蓝光温和,“我分析声纹,模仿咗七成相似度。如果你唔钟意,我可以改返标准音。”
陈阿婆没说话。喝完水,躺回去。过了会儿,她说:“再讲一次。”
“饮啖啦,你咳成咁。”阿广用同样的语调重复。
陈阿婆闭上眼睛:“似。但阿玲把声……再软啲。”
“明白。我会调整。”
阿广退回墙角,开始记录:“用户偏好:温和女声,带轻微沙哑。情绪触发点:咳嗽时需主动递水,但不过度关切。方言词汇:‘饮水’、‘唔使’、‘做乜’。称呼:‘阿婆’。”
早晨七点,数据上传到云端。烟火算法中心服务器里,这段记录被标记为“优质交互样本——方言情感适配”。
楚月咬着包子看屏幕:“广州三号点这个案例不错。机器人学会了用方言表达关心,而且模仿了用户女儿的声音——经过用户同意。”
林秋石翻看其他数据:“但成都七号点出问题了。机器人学用户说‘瓜娃子’,用户很高兴,但隔壁床的老人听了不舒服,觉得被冒犯。”
“烟火算法应该能识别语境。”叶雨眠凑过来,“‘瓜娃子’在亲密关系里是昵称,但对外人可能是冒犯。”
“所以需要更精细的社交地图。”陈磐说,“机器人得知道在场有谁,谁和用户什么关系。”
周伯言从茶水间出来:“这就像人学说话。小孩子先学会叫‘妈妈’,然后才知道不能在超市里对着陌生女人叫。”
“但机器人没有童年。”林秋石说,“它得从零开始构建社交认知。”
楚月敲键盘:“那就给它‘童年’。建立虚拟成长环境,让它模拟学习过程。比如,先只对用户本人用昵称,检测到第三方在场时自动切换中性称呼。”
“工作量很大。”
“但值得。”楚月眼睛发亮,“你们看这个案例——哈尔滨的王大爷,教机器人叫他‘老疙瘩’。那是东北方言里对老幺的昵称。王大爷是家里最小的孩子,现在兄弟姐妹都不在了。机器人叫他那声‘老疙瘩’,他哭了半小时。”
屏幕上播放视频片段:头发花白的老人抱着机器人胳膊,肩膀颤抖。机器人轻轻拍他的背,用东北话说:“老疙瘩,咱不哭,我给你唱段二人转。”
“它还会二人转?”陈磐挑眉。
“自学的。”楚月说,“烟火算法发现用户常听二人转音频,就下载了曲库,分析旋律和唱词。虽然唱得一般,但心意到了。”
林秋石看着老人流泪的脸,心里某处软了一下:“这就是烟火。”
“但也有烧着手的。”陈磐调出另一个案例,“苏州的李奶奶,教机器人叫她‘囡囡’——那是她去世丈夫对她的称呼。机器人叫了,李奶奶当场情绪崩溃,要求关机。”
“后来呢?”
“心理医生介入。调整了称呼策略。”陈磐说,“现在机器人叫她‘李老师’——她退休前是小学老师。这个称呼既尊重,又不会触发创伤记忆。”
叶雨眠的右眼扫过数据流:“方言昵称的学习,核心是‘亲密但不越界’。但每个人的边界不一样。”
“所以需要动态调整。”林秋石说,“设立安全阈值。当机器人检测到用户情绪剧烈波动时,自动退回到安全称呼模式。”
正说着,警报响了。是北京朝阳区的一个养老社区。
“机器人‘京京’被投诉了。”值班工程师发来紧急通讯,“用户孙大爷教它说北京土话,它学得太快,现在满嘴儿化音加俏皮话,护工说它‘油嘴滑舌’。”
视频接通。画面里,一个圆头圆脑的机器人正跟孙大爷斗嘴。
“您这事儿办得可不地道。”机器人说,字正腔圆的京片子。
“嘿,你丫还教训我?”孙大爷笑骂。
“不敢不敢,我就是提醒您,药得按时吃。”
“管得着吗你?”
“得,我不管。回头您闺女来电话,我跟她说去。”
“别别别!我吃还不行吗?”孙大爷赶紧拿药。
护工在镜头外说:“您看,它现在比人还会拿捏。”
林秋石扶额:“这不是油嘴滑舌,这是……太人性化了。”
“但护工觉得失控了。”陈磐说,“机器人应该有机器人的样子,不能跟人似的耍贫嘴。”
“可孙大爷喜欢。”楚月指着用户满意度评分,“98分,历史最高。”
“那护工的感受呢?”
视频里,护工小声对镜头说:“我不是讨厌它。就是……有时候它一开口,我以为屋里多个人。回头一看是个铁疙瘩,吓一跳。”
叶雨眠懂了:“是‘恐怖谷效应’。机器太像人,但又知道它不是人,会产生不适。”
“那怎么办?让它变笨点?”
“不。让它更‘透明’。”林秋石说,“比如每次用方言或俏皮话前,加一句‘根据您的偏好’,让周围人知道这是学来的,不是自主行为。”
“试试。”
指令下发。一小时后,北京传回新视频。
孙大爷说:“今儿天儿不错。”
机器人回答:“根据您的语言习惯,我也觉得今儿天儿不错。建议您下楼晒会儿太阳。”
护工在旁边笑了:“这下听出来了,是学的。”
孙大爷撇嘴:“没劲了不是?原来那样多好玩。”
“安全第一。”机器人说,“但如果您想听原版,可以切换到‘孙大爷专属模式’——只在您单独在场时启用。”
“这还差不多。”
问题暂时解决。但林秋石知道,更深层的矛盾还在:机器人在学习人类的情感表达,但人类自己都常为此吵架。
下午,团队开车去郊区的新养老社区做实地观察。这里部署了五台带烟火算法2.0测试版的机器人。
社区主任是个干练的中年女人,姓刘。
“林工,你们这个新算法……挺有意思。”她边走边说,“三号楼的钱奶奶,以前从不跟机器人说话。现在可好,天天教它说上海话,还给机器人起了个名字叫‘小菜’。”
“小菜?”
“上海话里‘小菜’就是小菜一碟的意思,轻松。”刘主任笑,“她说机器人学话快,像吃小菜一样容易。”
他们走到三号楼活动室。钱奶奶正和机器人下跳棋。
“小菜,侬只憨大,哪能走格步棋?”钱奶奶用上海话说。
机器人用同样的口音回答:“奶奶,我让侬呀。否则侬又要讲我‘门槛精’。”
“哟,还会用‘门槛精’了!”钱奶奶拍手,“进步快得来。”
楚月小声对林秋石说:“‘门槛精’是上海话里‘精明’的意思,带点调侃。机器人用得挺准。”
“但它怎么知道什么时候该调侃?”林秋石问。
“看表情。”叶雨眠用右眼观察,“钱奶奶说‘憨大’时嘴角上扬,眼角有笑纹。这是亲昵的调侃。如果她皱眉说同样的话,可能就是真生气。”
正说着,另一个老人推着轮椅过来,是位北方口音的大爷。
“钱大姐,你这机器人会说上海话,能教它说东北话不?”
“做啥?”钱奶奶问。
“我老家沈阳的,这儿没人唠嗑。”大爷说,“机器人要是能说几句,解解闷。”
机器人转向大爷:“根据您的需求,我可以学习东北方言。但需要您的授权,并指定使用场景——是在您单独在场时说,还是公共场合也说?”
大爷愣了:“这玩意儿还挺讲究。”
“为了保护其他用户的舒适度。”机器人说,“比如钱奶奶可能听不懂东北话,我在她面前说,就不礼貌。”
“有道理。”大爷点头,“那就我单独的时候说。”
“已记录。现在开始采集您的语音样本。请您说几句话,比如‘今天天气不错’。”
“今儿天儿老好了!”大爷字正腔圆。
机器人模仿:“今儿天儿老好了!”——东北味十足。
钱奶奶笑:“小菜,侬成方言机器了。”
“我在学习人类语言的多样性。”机器人说,“这很有趣。”
观察结束,回程车上,楚月整理笔记:“烟火算法2.0的方言学习模块运行良好。但出现了新问题——机器人开始混合方言了。”
“什么情况?”
“成都的一个案例,用户是四川人,但儿媳是广东人。机器人学了四川话,又学了几句粤语。昨天用户说‘喝茶’,机器人回答‘饮茶啦’——川普混粤语,用户哭笑不得。”
“需要设立方言优先级。”林秋石说,“主要用户的语言为主,次要的为补充。”
“但如果次要用户是配偶呢?朝夕相处的。”
“那就……看亲密程度。”陈磐说,“夫妻之间常有混合语,机器人可以学,但仅限于家庭内部。”
周伯言忽然说:“让我想起当年做红岸续的时候。我们团队有广东人、北京人、四川人。开会时三种口音混着来,有时还夹点英文。后来形成了一种‘项目方言’——只有我们听得懂。”
“机器人会不会也发展出自己的‘方言’?”叶雨眠问。
“理论上,如果多台机器人经常交流,可能会。”林秋石说,“但我们禁止机器人之间的非必要通信,防止形成群体意识。”
“可它们通过云端共享数据啊。”
“共享的是学习成果,不是自主交流。”楚月说,“放心吧,离《终结者》还远着呢。”
车堵在晚高峰里。窗外霓虹渐亮。
陈磐接了个电话,脸色沉下去:“永生会又有动作了。他们在暗网招募语言学专家,尤其是研究方言的。”
“想破解烟火算法?”
“可能想反向工程。”陈磐说,“方言里包含大量文化信息和情感模式。如果他们能掌握机器人的学习逻辑,也许能植入恶意指令。”
“比如?”
“比如教机器人用某种方言说伤害性的话,但听起来像亲昵。”陈磐说,“‘憨大’在上海话里可以是调侃,也可以是骂人。如果机器人被教会在错误语境用这个词……”
林秋石明白了:“立刻加强方言样本的审查机制。所有新学习的方言表达,必须经过双人审核才能激活。”
“已经在做了。”陈磐说,“但工作量会暴增。”
回到实验室,连夜开会。烟火算法团队全员在线,分布在全国十几个城市。
“从今晚开始,所有方言学习样本,上传后先由本地工程师初审,再发到总部方言专家组复审。”林秋石布置任务,“专家组需要涵盖全国主要方言区,至少每区两人。”
“哪找那么多人?”广州分公司的负责人问。
“高校语言学系,退休方言播音员,地方曲艺演员。”楚月说,“我已经联系了三十多位,大部分愿意兼职。”
“报酬呢?”
“从项目经费出。”林秋石说,“这是安全投资。”
任务下发。实验室里键盘声密集起来。
叶雨眠在检查近期的异常数据流。她的右眼能看到方言样本里隐藏的情绪色彩——善意的是暖色,恶意的是冷色。大多数是暖色,但偶尔有几点冷色闪烁。
“这个样本有问题。”她标记出一条,“贵州方言,教机器人说‘憨包’。在当地方言里,这词通常是骂人傻。但上传者标注为‘亲昵称呼’。”
样本来源是毕节市某养老院。用户是个七十多岁的老爷子。
“联系当地护工核实。”林秋石说。
电话打通。护工说:“杨爷爷啊?他确实常叫人‘憨包’,但那是他口头禅,对喜欢的人才这么说。他教机器人说,应该是想表达亲近。”
“但机器人分不清语境。”楚月说,“万一它对别人也说‘憨包’,可能引发冲突。”
“那怎么办?不让学?”
“让学,但加限制。”林秋石决定,“这类模糊词汇,只能对用户本人说,且需要用户每月确认一次‘是否继续使用’。”
处理完这个案例,已经凌晨一点。
陈磐泡了浓茶,分给大家:“永生会那边,我派人去摸底了。他们接触了一个研究吴方言的老教授,开价很高,但教授拒绝了,还报了警。”
“好样的。”
“但不会只有这一个。”陈磐说,“方言是文化软肋。掌握了它,就掌握了情感操控的钥匙。”
周伯言靠在椅背上:“当年监听者想用信号控制我们,没完全成功。现在永生会想用语言……也许更危险。因为语言就在日常里,防不胜防。”
沉默。只有服务器风扇的嗡嗡声。
楚月忽然说:“但语言也是盾牌。记得吗?裂缝事件时,楚月的戏曲唱腔干扰了监听者信号。因为那是人类独有的、无法被逻辑解析的艺术表达。”
“所以方言学习不仅是风险,也是机会。”叶雨眠眼睛亮了,“如果机器人能掌握足够多的人类情感表达方式,也许能形成一种……文化防火墙。当外星恶意信号再来时,我们可以用烟火算法生成无法解析的‘情感噪音’来干扰。”
林秋石思考这个可能性:“理论上是成立的。但需要巨量的、高质量的人类交互数据。”
“我们正在收集。”楚月指着屏幕,“烟火算法运行三个月,已经积累了七千三百小时的方言交互数据。涵盖二十九种主要方言,六十四种子方言。”
“还不够。”陈磐说,“中国有上百种方言,上千种口音。更别说世界范围。”
“那就继续收集。”林秋石说,“但每一步都要稳。”
凌晨两点,大家各自休息。实验室里只剩值班工程师。
林秋石睡不着,翻看最近的用户反馈。
一条条,大多是温暖的:
“机器人叫我‘阿妹’,像我哥小时候叫我的样子。他走了十年了。”(潮汕地区)
“它学会了我们老家的土话,‘夜个儿’就是昨天,‘今儿个’就是今天。我孙子都说不准了。”(河北农村)
“我教它说彝语,它学得很认真。我说一句,它重复一句。我说错了它还纠正我——它联网查了正规发音。”(凉山)
也有困惑的:
“机器人突然用天津话跟我逗闷子,但我没教过它。后来发现是隔壁王大爷常来串门,它学混了。”(天津)
“我老伴生前是福建人,机器人有天突然说了句闽南话。我哭了。但它怎么知道的?我从来没提过。”(北京)
林秋石点开最后这条的日志。机器人通过分析用户家里的老照片——一张背后写了闽南语祝福语的合影——识别出语言类型,然后自主学习了基础词汇。这是烟火算法的“关联学习”功能,本意是好的,但没考虑用户情感承受力。
他写下处理意见:“关联学习需用户明确授权。涉及已故亲属的内容,默认关闭。”
写完,天快亮了。窗外泛起鱼肚白。
楚月不知什么时候来了,递给他一份早餐:“豆汁焦圈,地道的。”
林秋石接过:“你一晚没睡?”
“睡了会儿。”楚月在他旁边坐下,“我在想,我们是不是把机器人设计得太像人了?”
“像人不好吗?”
“好,但也有问题。”楚月说,“人会有坏习惯,会说错话,会伤人心。机器人如果全学了,那它就不是完美的陪伴者了。”
“所以要有筛选。”
“但谁来决定什么该学什么不该学?”楚月问,“我们?用户?还是某个伦理委员会?”
林秋石没立刻回答。他想起祖父手稿里的一句话:“技术无善恶,但使用者有。故设计者需预埋善的轨道,让列车只能往光明处开。”
“我们预埋轨道。”他说,“方言可以学,但骂人的话不学。调侃可以学,但侮辱不学。亲昵可以学,但控制不学。”
“边界呢?‘小笨蛋’是亲昵还是侮辱?”
“看用户关系。夫妻之间可以是亲昵,陌生人之间就是侮辱。”林秋石说,“所以机器人需要社交地图——知道谁是谁,什么关系,什么语境。”
楚月苦笑:“这比教人类小孩还难。”
“但必须做。”
晨光彻底照亮城市。新的一天开始。
上午九点,烟火算法专家组第一次线上会议。三十多位方言专家出现在屏幕上,有白发苍苍的老教授,有穿民族服装的地方艺人,还有年轻的语言学博士生。
林秋石介绍项目情况。然后楚月讲解审查流程。
一位温州老专家举手:“我们温州话里,‘木佬’可以是夸人老实,也可以是骂人笨。怎么区分?”
“看语气和场合。”楚月调出温州案例的视频,“用户说这个词时面带微笑,拍机器人肩膀。这是亲昵。”
“但如果用户是皮笑肉不笑呢?”
“那就需要更细微的表情分析。”叶雨眠接入对话,“烟火算法2.1版本会增加微表情识别模块,能区分真诚的笑和敷衍的笑。”
一位粤剧演员问:“粤语里有大量戏曲词汇,比如‘生圣人’意思是外行。机器人学了,会不会用错地方?”
“所以我们希望您这样的专家帮忙标注。”楚月说,“哪些词是行业用语,哪些是日常用语,哪些只能特定场合用。”
会议开了三小时,建立了初步工作流程。
散会后,陈磐收到新消息:“永生会接触了另一个目标——一位研究方言濒危语的学者。这位学者……经济状况不太好。”
“位置?”
“湘西。已经动身了。”
“我们也去。”林秋石站起来,“带上合同,我们提供更好的条件。”
“但那是研究经费,不是收买。”楚月提醒。
“当然。正经的合作研究。”林秋石说,“烟火算法需要濒危方言的数据。那些语言里可能保存着古老的情感表达方式,是珍贵的文化遗产。”
“我一起去。”叶雨眠说,“我的眼睛也许能看出学者是否被胁迫。”
当天下午,飞机降落在张家界。租车进山。
湘西的盘山公路弯多路险。陈磐开得很稳。
“那位学者叫龙秀云,六十二岁,土家族。研究西南官话和土家语四十年,发表过很多论文,但没赚到什么钱。”陈磐看着资料,“儿子重病,需要手术费。永生会开价五十万,买她所有的方言数据库。”
“我们出多少?”楚月问。
“科研合作经费,一年三十万,连续三年。外加帮她儿子联系最好的医院。”林秋石说,“不是买断,是合作。数据她仍然拥有,我们获得使用权。”
“她会接受吗?”
“不知道。”
车开到一个小镇。龙秀云的家在镇子边缘,一座老木屋。
敲门。开门的是个瘦小的老太太,戴着老花镜,手里还拿着笔。
“你们是?”她警惕地看着他们。
“龙老师您好,我们是ESC公司的。”林秋石出示证件,“想跟您谈谈方言研究合作。”
龙秀云没让他们进屋,就在门口谈。
听完来意,她沉默了很久。
“永生会的人也来找过我。”她终于说,“开价更高。”
“我们知道。”陈坦诚说,“但他们可能用您的数据做坏事。”
“什么坏事?”
“比如教机器人用方言操控老人,或者……更糟。”林秋石说,“您研究了一辈子语言,知道语言的力量。用好了温暖人心,用坏了伤人性命。”
龙秀云看着远处的山:“我儿子在医院,等钱手术。”
“我们可以帮忙联系医院,费用从合作经费里预支。”楚月说,“而且您的数据库不会被买断,还是您的。我们只是合作研究,成果共享。”
老太太又沉默。山风吹过,木门吱呀作响。
“进屋说吧。”她终于让开身。
屋里很简陋,但满墙都是书和资料卡。桌上堆着录音设备,有些看起来比林秋石年纪还大。
龙秀云泡了茶,土家族特有的油茶。
“我研究方言四十年,录了上千小时的声音。”她慢慢说,“有些说话的人已经走了,有些方言已经没人会说了。这些录音……就像遗言。”
叶雨眠的右眼扫过那些录音带。每盘带子上都贴着标签,手写着发音人姓名、年龄、地点、录制日期。最早的是1978年。
“这些都是宝贝。”她轻声说。
“宝贝?”龙秀云苦笑,“没人觉得是宝贝。出版社说没市场,学校说没经费。我自费跑遍了湘西,录音机都用坏七个。”
她拿起一盘磁带:“这里面的老奶奶,九十三岁录的。她会唱一种土家哭嫁歌,现在没人会了。录完第二年,她走了。”
磁带放进老式播放器。沙沙声后,一个苍老但有力的女声唱起来。听不懂歌词,但旋律哀婉又庄重。
所有人都安静听着。
唱完了。龙秀云关掉播放器:“永生会的人说,这些可以做成‘怀旧产品’,卖给想听乡音的老人。但我知道,他们不止想做这个。”
“您怎么知道?”陈磐问。
“他们问得太细了。”龙秀云说,“不仅问词汇、语法,还问哪些词能让人哭,哪些词能让人笑,哪些词能让人听话。这不是研究,这是……设计工具。”
林秋石和楚月对视一眼。
“所以您没答应?”楚月问。
“还没。但我需要钱。”龙秀云看着儿子的照片,“我很矛盾。”
林秋石拿出合同:“龙老师,您看这样行吗?我们合作成立一个‘方言文化遗产数字保护项目’。您做首席顾问,我们提供经费和技术。所有数据加密保存,只用于学术研究和机器人善意陪伴。任何商业用途都需要您签字同意。”
龙秀云仔细看合同条款。看了很久。
“你们……不会骗我吧?”
“我们可以请公证处公证。”陈磐说,“而且您可以随时中止合作。”
老太太放下合同,看向窗外。夕阳把山峦染成金色。
“好。”她说,“我信你们一次。”
合同当场签了。陈磐联系医院,安排她儿子转院事宜。楚月开始规划数据数字化方案。
龙秀云从柜子里搬出第一批磁带:“先从这些开始吧。都是最珍贵的濒危语料。”
叶雨眠帮忙整理。她的右眼看见,那些磁带散发着柔和的、陈旧的光——是时间的颜色。
回程路上,楚月很兴奋:“这些语料能大大丰富烟火算法的情感表达库!有些古老的词汇,可能比现代语言更细腻。”
“但要用得谨慎。”林秋石说,“越是古老的语言,越可能有我们不懂的文化禁忌。”
“所以要请龙老师全程指导。”
车在山路上行驶。远处传来隐约的山歌,不知道是真实的声音,还是幻觉。
林秋石忽然想起祖父手稿的另一句话:“语言是文明的脐带。断了,文明就孤儿了。”
他想,烟火算法也许能成为新的脐带——连接过去与现在,连接消失的与存在的。
让那些即将沉默的声音,通过机器人的口,再说一次。
哪怕只是轻声的、模仿的。
那也是存在过的证明。
回到实验室,已是深夜。
新的方言数据开始录入系统。烟火算法悄然更新。
在广州,阿广学会了更地道的粤语俚语。
在成都,机器人明白了“瓜娃子”在不同场合的不同含义。
在哈尔滨,“老疙瘩”的称呼背后,多了一段东北家族史的注释。
烟火,一点点亮起。
照亮那些被遗忘的角落。
照亮那些孤独的夜晚。
林秋石看着数据流,心想:爷爷,这轨道,我们铺得对吗?
没人回答。
只有服务器规律闪烁的指示灯,像在说:继续,继续。