美国人不喜欢聊天机器人发表情。新的研究证实了这件事。
德州大学奥斯汀分校的Jihye Lee团队做了一个实验:招募了795人——394个美国人,401个中国人——让他们读ChatGPT和人类讨论心理健康问题的对话记录。研究者悄悄改动了三个变量:机器用不用表情符号、人类是倾诉情绪还是直接求助、对话是一轮结束还是多轮深入。然后让参与者给信息质量打分,评估机器有没有提供"情感支持",以及他们愿不愿意用这个工具。
结果相当对称。
美国人对表情符号有显著负面反应。当机器在对话里加了表情,他们对信息质量的评价立刻下降;如果对话内容恰好有人分享深层情绪挣扎,表情符号还会直接拉低机器的可信度,降低他们使用这个服务的意愿。与此同时,美国人对多轮对话也高度敏感——只要看到对话是来回延续的、机器"记得"上下文,所有评分类别往上涨。
中国人这边完全是另一幅画面。
中国参与者对这三个变量全部没有显著反应。机器发不发表情、人类用什么方式求助、对话是一轮还是多轮——评分保持稳定。研究者发现中国参与者的信任基线本身就很高,经常触及测量量表的天花板,以至于他们几乎检测不到意见的微小波动。
同样的AI对话,美国人觉得"不专业"的,中国人无所谓;美国人觉得"有深度"的,中国人也无所谓。
这不是关于AI。这是关于人。
解释这种差异,可以从一个老概念入手:高语境与低语境文化。
美国是典型的低语境文化。沟通的含义主要承载在文字本身,非语言线索——表情、语气、沉默——是辅助,不是核心。在这种文化里,表情符号是一种"额外的信号":你可以在闲聊里加表情,但如果你在严肃对话里加表情,人们会觉得你在用错配的信号污染信息的纯度。
中国是高语境文化。沟通的含义不是某个词说了什么,而是整个情境——说话人的身份、场合的正式度、关系的远近、沉默的含义。在这种文化里,单个表情符号不是独立信号,它是整个交谈环境的组成部分。没有人专门盯着你发没发表情,因为他们已经在用全部上下文评估这段对话。
这不是说美国人对,中国人错。也不是中国人更大度,美国人更挑剔。这是两套完全不同的信息处理系统,对着同一段机器生成的文字,读出了完全不同的东西。
更有意思的是中国参与者那个"测量天花板"。研究者原话是:中国参与者的回答经常触及测量量表的最高值。这不是"中国人更包容"或者"更不挑"——这暗示的是另一个事实:在中国,自动化服务已经高度融入基础设施和日常生活。微信支付、健康码、智能客服——你每天都在跟机器对话,你甚至没有意识到达到了"跟机器对话"这个门槛。对机器的基线信任不是"我愿意用AI",是"我根本没注意到这是AI"。
美国人还没到这个阶段。所以他们还在盯着AI的每一个细节:你有没有用表情?你是不是在假装人类?你配不配给我提供情感支持?因为对很多美国人来说,跟机器讨论心理健康仍然是一件需要判定"合不合适"的事。
这不是谁先进谁落后。这是两套社会与技术的关系,在同一个时间点自然呈现出的两种姿态。
Lee团队在讨论部分写了一句话,放在学术语言里显得很克制:设计健康应用的技术公司不应采用通用的方法——预设的沟通风格可能需要适应用户的文化预期。
翻译成人话就是:你没法做一个"全世界都觉得好用"的AI聊天机器人。因为全世界的"好用"是互相矛盾的。
所以下一次,当你打开一个AI对话,觉得它"太冷淡"或者"太啰嗦"或者"表情用太多了"——停下来想一秒:这个判断是谁在说话?是你,还是你背后那个你甚至没注意到的文化,正在用一种你以为是"常识"的标准,对一段机器生成的文字下判决。
那台机器不会受伤。但你的文化,在你没看的地方,一直在替你说话。
参考:Lee, J., Yang, Z.D., Shi, W., & Liu, Y. (2026). AI chatbots in mental health: How emojis, prompt type, and interactivity shape user perceptions in the United States and China. Computers in Human Behavior, 108955.