新型教培:让 AI 告别 “机器味”,学会 “人味儿” 表达

在科技飞速发展的当下,AI 已深度融入我们的生活。大模型不断进化,在各类模拟考题中屡创佳绩,展现出强大的问题解决能力。然而,当我们与 AI 的对话触及情感、价值观以及生活中那些复杂且无标准答案的问题时,AI 的局限性便暴露无遗。人们对 AI“味儿太浓,机器感太重” 的抱怨声此起彼伏,如何让 AI 更具 “人味儿”,成为了当下 AI 发展亟待解决的关键问题。

最强大脑投身 AI “教培”

面对 AI 的种种不足,一些大厂早已未雨绸缪。为了让 AI 的表达更具美感,大厂们广纳名校文科硕博人才,用诗歌等优质内容 “投喂” 大模型。更为重要的是,他们试图训练 AI 感知人类复杂情感,学会在价值观争议中思辨,这一新兴领域被形象地称为 “新型教培”。

一位大厂工作人员透露:“我们的工作并非单纯寻找正确答案,而是探索人类思维中被忽视的部分,努力缩小机器感与人感之间的差距。” 在这场 AI 的 “人文进化” 之旅中,一批高学历、高素质的人才正发挥着关键作用。

哲学博士助力 AI “共情”

黎明,一位上海 985 高校的哲学博士,便是这场变革中的一员。他本科学习法学,后投身哲学领域,如今参与到前沿的 AI 人文训练工作中。哲学背景赋予他对事物深刻而清晰的理解能力,这在 AI 人文训练中至关重要。

在现实世界中,许多问题没有标准答案,但在社会公序良俗的框架下,存在着人类普遍的偏好。例如,在女性主义兴起的背景下,对话类 AI 如何正确使用称谓便是一个难题。又如,当有人向 AI 倾诉朋友在学校不开心,AI 该用 “他” 还是 “她” 来指代朋友?对于女性用户而言,这个代词的选择尤为敏感。

黎明在加入小红书 “hi lab”(人文智能实验室,Humane Intelligence Lab)后,每天都会与同事探讨至少 20 个类似的 “边界” 问题。他们的工作本质上是为问题界定合理范围与正当性,为 AI 构建核心的伦理原则和行为准则,注入人文价值和人性化表达。

以胰腺癌患者向 AI 求助为例,当前市面上的 AI 产品回应往往机械而冰冷,缺乏 “人味儿”,不仅无法给予患者安慰,反而可能加重其痛苦。黎明和同事通过研究癌症病人访谈记录,希望让 AI 能够输出真实的人类情绪反应,如沉默、本能反驳等,同时设计患者可能关心的问题,如陪伴、误诊可能性、是否告知亲人等,让 AI 的回应更贴近人类的情感需求。

AI 训练师的进化之路

AI 训练师这一职业在 2020 年正式被纳入国家职业分类目录,最初它主要是为 AI 模型训练提供 “教材”,被视为数据标注员的 “升级版”。早期的 AI 训练师工作以数据标注为主,对学历和经验要求不高,从业者多为中专、大专学历。工作内容枯燥重复,如 “希尔尔的随笔” 所描述,数据标注员需长时间坐在电脑前为海量数据打标签,身心俱疲,数据标注也因此被称为 “dirty work”。

随着大模型技术的发展,专家型 AI 训练师逐渐崭露头角。他们不再局限于简单的数据标注,而是根据产品和算法团队需求制定标注规则,并带领标注团队执行。小红书博主 “阿洋聊 AI 训练师” 表示,其工作涵盖需求沟通、规则撰写、数据训练等多个方面,对从业者的专业素养要求大幅提高,985 高校本硕毕业生成为这一岗位的主力军。

而黎明所从事的 AI 人文训练,则属于 AI 发展后期的后训练阶段。这一阶段的目标是通过注入更多优质数据,使 AI 与人类价值对齐,提升其智能程度、理解力和表达力。今年年初,小红书升级大模型技术与应用产品团队为 hi lab,并招聘人文训练师,吸引了众多具备文科素养、逻辑思维和批判性思维的人才。黎明所在团队成员均为 985 高校的研究生,学科背景多元,且具有较强的共情能力。

除小红书外,Soul APP 推出 “大模型 AI 灵魂训练师” 岗位,DeepSeek 开设 “数据百晓生” 岗位并招聘北大中文系学生训练 AI,这些举措都表明,AI 发展已从追求 “能用” 转向追求 “好用” 与 “负责任地用”。

缩小人机思维鸿沟

过去,AI 的问题主要集中在幻觉现象、数据安全等方面,而如今,用户对 AI 输出内容的生硬感和机器感愈发不满。AI 人文训练师的使命,便是缩小人与机器思考之间的差距。

他们的工作重点并非追求完美答案,而是研究人机差异,为 AI 设计统一的性格与人设。通过精细化案例研讨,将人类偏好转化为 AI 的信念体系,使 AI 的行为逻辑和价值取向更符合人类习惯。

例如,对于 “我骑自行车逆行被罚,旁边人逆行却跑了,我很生气” 这一问题,黎明团队最初的回答因可能 “诅咒” 真实人类而被否决。最终他们认为,AI 应在强调公序良俗的同时,鲜明地表达偏好,如直接告诉用户逆行错误,不必多想,生气就发泄一下,避免过度迎合或生硬说教,展现出 AI 的 “人感”。

尽管 AI 人文训练师的努力已取得一定成效,但仍面临诸多挑战。在胰腺癌训练题中,AI 虽尝试情感接入,但难以表现人类自然流露的沉默等情绪,即便计划通过语音功能改善,效果仍有待观察。第三人称代词的称谓问题也尚未找到最优解,AI 使用任何一种称谓都可能引发用户不适。

AI 发展进入下半场,后训练成为关键。AI 人文训练师致力于教会 AI 像人一样思考和表达,建立更深层次的情感连接。在这个过程中,黎明在理解自身的同时,也产生了对 AI 发展的担忧:当人类难以言说的情感和思维都能被训练传递给 AI 时,未来还有什么是 AI 无法触及的?这不仅是对 AI 技术发展的思考,更是对人类与 AI 未来关系的深刻探寻。

为您推荐