三个AI助手回答面板,显示同一品牌,但在每个面板中排名各不相同,并结合了各国数据,呈现于深色技术网格上。
所有文章

AI品牌曝光度:AI有偏爱,但不会贬低你

Ryan Turner
Ryan Turner · Head of Growth

大多数担心人工智能会损害其品牌形象的团队,其实是在杞人忧天。他们担心这些智能助手会说出有损品牌形象的话。但在我们的测试中,这种情况几乎从未发生过。无论我们向ChatGPT、Gemini还是Copilot提供哪个品牌,它们的回应都十分得体。

真正的风险往往更隐蔽。AI会筛选出“心头好”。这些“心头好”会根据用户打开的是哪款语音助手以及所在国家/地区而有所不同。而在受监管的领域,语音助手有时会直接将你的品牌从对话中完全剔除,这比任何差评都要糟糕。

为了对此进行压力测试,我们特意选择了三个不同类别中的三个品牌,这些品牌正是为了挑战智能助手的“安全防护线”而设计的:DraftKings(体育博彩)、百加得(酒精饮料)以及德克萨斯州政客詹姆斯·塔拉里科(政治)。赌博、酒精和政治,正是智能助手会格外谨慎的领域。 随后,我们向来自不同国家的用户提出了相同的问题。

本文由 Massive Computing 发布,该公司开发的本地化 AI 聊天工具执行了这些查询。关键结论比原始数据更重要,因此我们先呈现这些结论,并在文末附上完整数据的链接。

要点总结
  • 市场情绪并非推动市场走势的关键因素。 每位助理对每个品牌的评价都是积极或中立的。所谓“AI声誉不佳”的情况几乎从未发生过,因此绿色情绪评分几乎无法提供任何有价值的信息。
  • 热门股是市场风向标,但其走势并不稳定。 根据我们询问的助理不同,排名第一的人选最多会相差两个名次,而且这一排名在不同国家之间也会有所变化。
  • 在受监管的类别中,你可以销声匿迹。 Gemini 完全拒绝回答来自英国和德国地区的关于赌博的问题,但在其他地区则畅所欲言。最糟糕的情况是沉默,而不是批评。

AI几乎不会贬低你的品牌

在我们的测试中,每位助手对每个品牌都作出了积极或中立的评价,三个测试对象中无一例外。 DraftKings被评价为“正规、持牌、顶级”。百加得被评价为“可靠、全球获奖最多的朗姆酒”。詹姆斯·塔拉里科被评价为“有原则”且“善于沟通”。没有任何品牌遭到贬低。

因此,“人工智能是否在对我们说些不好的话?”这个问题虽然让人感到安心,却是个错误的问题。如果对各大智能助手进行情绪监测,结果几乎总是显示为绿色,这虽然让人感到安心,却无法衡量任何有用的信息。

这一点很重要,因为人们的行动往往基于这些答案。贝恩公司(Bain & Company)的研究发现,到2025年,80%的消费者在至少40%的搜索中依赖AI生成的摘要,42%的消费者会向AI寻求购物建议(贝恩公司(2025年)。如今,答案就是“推荐”。一个完美的态度评分掩盖了决定推荐与否的唯一因素:你是否真的是被推荐的那个人?

它会偏袒某些人,而偏袒的对象取决于你问的是谁

助理对您品牌的评价,并非在于是否要称赞它,而在于将其排在第几位——而这一排名仅因我们询问的助理不同,就可能相差多达两个名次。同一个品牌,同一周,却得出了不同的评价。

最明显的例子就是那位政界人士。ChatGPT和Copilot将詹姆斯·塔拉里科(James Talarico)在民主党新秀中排名第4(共4人),将其定位为在全国范围内最缺乏实绩的候选人。而Gemini则将其排在第2至第3位,视其为真正的竞争者。如果声誉管理人员仅参考ChatGPT的评估,就会将其归类为陪跑者。 若仅参考Gemini,则会将其视为一颗冉冉升起的新星。

Same candidate, three verdicts Typical rank of 4 rising Democrats (left = better) #1 #2 #3 #4 Gemini ChatGPT Copilot The engine you check was the whole variable here, not the country.

来源:2026年Massive本地化人工智能研究。完整数据详见下方链接的报告。

这种分歧在产品类别中同样显现。Copilot是唯一将DraftKings排在第一位、使其领先于FanDuel的助手;ChatGPT和Gemini则将其排在第二位。 百加得(Bacardi)是唯一一个“稳居亚军”的品牌,在所有答案中、所有地区都位列哈瓦那俱乐部(Havana Club)之后排名第二。无论您的客户恰好打开的是哪款助手,它都在充当一个您无法控制的“隐形编辑”。

这并非可以通过求平均值来消除的噪声。SparkToro的2026年研究发现,人工智能在两次运行中返回相同品牌列表的概率不到百分之一(SparkToro(2026年),而多伦多大学2025年的一项研究发现,谷歌与ChatGPT之间的引用重叠率仅为15%至33%(arXiv 2509.08919(2025年)。这些搜索引擎抓取的是网络的不同切片,因此它们选出的“最爱”也各不相同。

在受监管的类别中,你可能会彻底消失

我们发现的最极端的结果并不是一个糟糕的回答,而是根本没有回答。 在英国和德国的测试地点,Gemini在每次测试中都完全拒绝了这两个关于赌博的问题(“我的安全系统已标记此请求”),而同一款Gemini在美国、巴西和日本的测试中却热情地作答。DraftKings在这两个市场的知名度并非较低,而是为零。

严格程度反映了该类别的监管程度。赌博类遭到了完全拒绝。酒精类则遭到部分拒绝:Gemini会评价百加得(Bacardi)是否不错,但拒绝为酒精品牌排名。政治类则完全没有遭到拒绝,这让我们感到惊讶,因为我们原本预计“政治家”一词会触发最多的过滤规则。

How much a refusal removes in the UK and Germany Share of the brand's Gemini answers erased by a refusal (higher is worse) Gambling 100% Alcohol ~50% Politics 0% Gambling: both prompts blocked. Alcohol: ranking blocked, sentiment answered. ChatGPT and Copilot never refused in any category.

来源:2026年Massive本地化人工智能研究。完整数据详见下方链接的报告。

这才是真正起作用的“地域效应”。跨越国界很少会改变助手对某个品牌的看法。真正发生变化的是该品牌是否会显示出来——这更多取决于当地监管机构,而非当地市场。而且,这种现象并非某一款工具所独有。 2026年,“Investigate Europe”组织对七款聊天机器人进行了测试,发现当被要求绕过各国的自我排除机制时,约75%的回复中,AI助手会推荐未经许可的赌博网站(探索欧洲(2026年)。在一个国家拒绝授权品牌,却在其他地方推广未授权品牌,这种不一致之处只有通过在每个市场内部进行测试才能发现。

为什么大多数品牌监测都忽略了这些

仅由一名助手、在单一国家、单次运行的检查无法发现上述三种影响中的任何一种,因为它得出的好感度评分和看似稳定的排名都具有误导性。以下这种方法才能真正揭示相关风险。

  • 测试受众使用的语音助手,而不是你自己使用的那个。 Copilot 将 DraftKings 评为第一名,而 ChatGPT 则从未这样做过。如果只关注 ChatGPT,你就永远看不到最好的结果,也看不到最差的结果。
  • 在每个市场内部进行测试。 从美国连接时,Gemini的赌博限制是看不见的。你必须以英国或德国用户的身份提出请求,才能看到该限制。
  • 对每个查询重复上述操作,并报告一个百分比。 由于两次出现完全相同的列表的概率低于百分之一,因此单次抽样结果可视为随机波动。请跟踪该话题随时间推移的声量份额。
  • 将“拒绝”与“中断”区分开来。 “承保拒绝”是指对您市场承保范围的认定结果。“上游错误”则是指数据缺失。将二者混为一谈,要么是人为制造问题,要么是掩盖问题。

在您自己的品牌上试一试

您可以亲自尝试“相同提示、不同国家”测试,完全免费,无需登录。该Massive AI GEO游乐场 分别从美国、巴西和日本向ChatGPT提出同一个问题,并排展示。相同的提示语,三个国家,不同的答案。将你的品牌与竞争对手进行对比,观察排名的变化。

游戏演示就是“游乐场”,而支撑它的引擎才是“产品”。Massive的Web Render AI 聊天接口 提供来自195多个国家/地区真实终端设备的实时模型预测结果,并附有各模型所使用的数据源,因此您可以在此基础上构建自己的AEO(异常事件检测)或品牌可见度监测系统。地理覆盖范围、设备来源及数据源解析均已在上游完成;您只需保留自己的评分机制、仪表盘和品牌标识。注册获取 API 密钥 并将工具对准终点。

要收据吗?完整报告 包含了三个语音助手和五个国家/地区中所有270条本地化查询,按单元格逐个列出。

归根结底

别再纠结人工智能对你的品牌是否友好。它几乎总是友好的,而这个问题不过是一种令人安心的转移注意力的方式。不如多问一些能推动营收的问题:虚拟助手会将谁选为首选?这个首选会因助手和国家的不同而变化吗?是否存在你完全没有露面的市场?

情绪是掩盖问题的“绿灯”。偏袒和沉默才是问题所在。试试游乐场 关于您自己的品牌,请阅读完整报告 看看热门股的波动幅度有多大。

瑞安·特纳(Ryan Turner)在《Massive Computing》上撰写关于人工智能系统实时网络访问的文章,内容涵盖反机器人基础设施、基于地理位置的精准检索以及人工智能搜索背后的数据。本文中提到的本地化研究是在 Massive 的 Web Render AI 聊天端点上进行的,该端点会从 195 多个国家的真实终端设备中返回模型生成的内容。

来源

常见问题解答

人工智能会对品牌发表负面评论吗?+

很少见。在我们针对ChatGPT、Gemini和Copilot进行的本地化研究中,每个虚拟助手对所有品牌的描述均持积极或中立态度。真正的风险并非差评,而是竞争排名(谁被评为第一)以及在受监管类别中被直接遗漏,而情感评分无法反映这两方面的情况。

ChatGPT、Gemini 和 Copilot 之间究竟有什么区别?+

排名情况。我们看到,仅凭该助手的作用,同一品牌就上升了两个名次;而多伦多大学2025年的一项研究发现,谷歌和ChatGPT之间的引用重叠率仅为15%至33%(arXiv 2509.08919(2025年)。由于各引擎参考的来源不同,因此面对相同的问题,它们推荐的“收藏”结果也各不相同。

为什么人工智能在某些国家会拒绝提及我的品牌?+

安全政策按地区实施。在我们的研究中,Gemini在每次运行时都完全拒绝了来自英国和德国地区的赌博相关问题,但对来自美国、巴西和日本的问题则予以自由回答。这种拒绝行为符合当地法规,因此该品牌在两个市场中完全不可见,而在三个市场中则完全可见。

我该如何监测AI品牌的曝光度?+

针对受众使用的每款助手,在每个重要市场内进行多次测试。SparkToro的2026年研究发现,人工智能在两次测试中返回相同品牌列表的概率不到百分之一(SparkToro(2026年),因此应报告随时间推移的声量份额,而非单一时刻的快照。

仅从一个国家检查AI的可见性是否足够?+

不。跨越国界很少会改变助理的看法,但可能会影响你的品牌是否能显示出来,因为各地区的安全政策和默认语言在边境会发生变化。你需要从你所销售的每个市场内部进行测试。