数据指标 — 寻找更真实的NPS

为什么你说很满意, 却迟迟不愿意推荐?

如果在专业测评上有一个「最少题目」排行榜，NPS 大概会名列前三。正是由于其题目相对较少，结果看上去又很简单（一个数值），大家总会产生一些疑惑：NPS 到底是什么？很多用户都是瞎答题，这个数据能有用么？每期也就是一个数字，用户到底怎么想的？

在不久前的文章「电商公司如何前面评估物流服务质量」中已经对 NPS 做了简单的介绍。今天这篇文章主要复盘笔者在实践中遇到的坑来回答小伙伴们的一些问题。

认识 NPS

净推荐值（Net Promoter Score，NPS），最早是由贝恩咨询公司的 Fred Reichheld（2003）针对用户忠诚度业务提出的量化指标。

核心题目是向用户提一个简单的问题，「您有多大可能会向您的朋友或同事推荐 XX 产品？（0-10 分，10 分表示非常愿意，0 分表示非常不愿意）」。

随后根据用户推荐意愿分数，将用户分成了三种类型:

推荐者（9-10 分）： 铁杆粉丝，他们不仅自己反复购买一家产品，并愿意敦促自己的朋友也这样做。
被动者（7-8 分）： 总体满意但并不狂热，他们会考虑竞争对手的产品。
贬损者（0-6分）： 使用不满意，对于产品没有忠诚度，流失率很高，会不断地抱怨或投诉。

一个良性的产品能够将 100% 的用户转化为推荐者，同理一个糟糕的产品将会带来 100% 的贬损者。我们常说的 NPS 值就是衡量这个程度的方法，即用推荐者的百分比减去贬损者的百分比（NPS = 推荐者% - 贬损者%），用这个差值直接反应用户对于产品的认可程度和购买意愿。

如我们实践中所遇到的那样，衡量用户「忠诚度」的测评方式和指标有很多，比如重复购买率、留存率等。但 NPS 作为这样一个简单粗暴的量化方式之所以能够在企业中「长盛不衰」是由于其独特的意义：

简洁化： 核心题目只有一道，用户不需要花费很长时间去回答大量的题目（比如，KANO 模型在题目数量上就很不友善），这在一定程度上保证了回收率和信息的有效性。

针对性： NPS 是一种客户管理理念，虽然 NPS 的计算逻辑认为，「真正能够影响公司发展的并不是消费者中的被动者，而取决于推荐者和贬损者」。但我们不能否认，无论是推荐者、贬损者还是被动者都代表着不同群体对于产品的认知和态度。因此，在实践的过程中，从业人员往往可以在终极题目上设置逻辑跳转，从而进一步考察不同推荐度用户对于产品各维度的态度和转化的可能性。

相对慎重： 试想一下，当我们试图「安利」一个东西给朋友或同事时，是一种怎样的心态？事实上，推荐是一件很严肃慎重的事情，很多时候与推荐人的信用相关联。因此，在这样心态下的评分也是相对慎重准确的，这意味着用户并不是为了单纯「讨好」或者敷衍做出一个简单的评价。

长期有效： 在这里不得不区分另一个概念，「满意度」。实践过程中，我们经常会遇到一个尴尬的局面，用户对于产品满意度评级很高，但最终 NPS 的评分却没有想象中那么好看。这是由于「满意」是一个相对即时性的概念，用户对于一个产品是否满意，主要是产品是否能够满足当下的需求，解决相应痛点，或者锦上添花，而是否愿意因此进一步「推荐」，则是另一种心态。因此，如果企业想要有一个聚焦产品驱动力和竞争优势的长期监测指标，NPS 值作为一个既考虑了用户直接的消费意愿（满意程度），也考虑到了潜在的口碑影响的指标，无疑更适合长期使用。

NPS 不止步于数字

用研同学或者相关的负责同学如何对待每期 NPS 结果，是一个需要思考的问题。如果我们仅仅只是做一个加减乘除式的加工，那 Excel 基本就能够替代我们的工作；而仅仅止步于每期的数字，对于产品本身也就缺失了监测的意义，因此我们在实践中，不妨尝试多走几步。

自上而下的 NPS 思考：行业对标

经常接触 NPS 的同学，可能会遇到 NPS 值「莫名其妙」下降或上升，同一公司跨产业或者跨地域 NPS 值存在显著差异等状况。这可能是受到了该地区的大环境或者行业发展的影响，在这个时候你与主要竞争对手的「相对 NPS 值」要比单一产品的「绝对 NPS 值」更为重要。

进行「相对 NPS 值」研究的关键在于样本具有代表性，这批样本中不仅包含自己产品的用户，还要包含竞争对手的用户。实践中除了邀请专业测评公司进行「双盲实验」式（回答者和提问者都不知道哪家公司是这项研究的主顾）严格调研外，更为常用的办法是在核心问题前加入一道甄别题目：

eg, 近一个月内，您常用的购物平台是：

随后根据跳转结果，计算对应每个竞品的 NPS 值，你可以用自己的 NPS 值减去它们的 NPS 值，得到相对 NPS 值。

但需要注意的是，在这类自上而下的研究中，你需要确保你找到的用户是合适的，而且样本量也足够大，这样才能够在最大限度上减少用户对于测评和竞品的态度偏差。

自下而上的 NPS 研究：用户体验

上文提到的相对 NPS 主要展示的是竞品之间的相对差距，帮助公司在整体上设定企业发展的优先级，但是这并不能具体到自身产品体验上的「诊断意见」。实践中，我们往往通过进一步的内部 NPS 来研究用户体验。

用户体验的 NPS 研究通常是在用户完成特定活动后进行的。比如 Airbnb 公司，会在用户完成订单后的几天内对他们进行调研，这样进行的好处在于用户对于产品的使用记忆是新鲜且真实的，相应用户的反馈问题也是有针对性的。

这两种不同的 NPS 值研究，你可以看作一场考试，自上而下的 NPS 研究结果能够显示你的整体进步或退步，在班级中的相对水平；而自下而上的 NPS 研究则是你对于卷面的题目分析，促使企业根据类别，逐级分析可能的影响因子和影响的优先级。

寻找更真实的声音

值得说明的是，NPS 研究的目标不仅仅是为了研究用户的态度，同时也是为了通过给用户分类预测和分析他们的行为。因此，合理的区分用户，寻找更真实的声音显得尤为重要。

更真实的 NPS 值

在测评的过程中，从所有受测用户那里获得反馈显得尤为困难。面对回收率极低（注：在正式研究中，一般需要较高的回收率来确保结果的可靠性）的情境时，有些公司倾向于把不回应的用户归为贬损者，他们认为如果你的用户都不愿意在一道题上花费时间，他对于你的产品态度也由此可见。但存在一种更为可靠的方式：分析未回应的用户行为。

下图是贝恩公司做的一项研究，一家公司的内部回应率为 20%，NPS 值为 50%（60% 推荐者 - 10% 贬损者）。但在进一步对未回应用户行为（重复购买、随时间推移购买量增加）时，研究发现未回应用户中有 10% 的推荐者（反复使用），40% 的被动者（可能使用竞品）和 50% 的贬损者（完全不满意）。

因此，真正的 NPS 值应该是 -22%（20% 回应者 NPS + 80% 不回应者 NPS）。

更真实的声音

在实践中发现，推荐分数在 0-6 分之间的用户，他们对于产品的态度并非如我们想象的那样一致差评，恨不得打入「冷宫」才罢休的，有的甚至在后期的访谈或意见反馈中都表现出对于产品的支持态度。

这些微妙的态度变化，其实背后是涉及到一个概念「趋中效应」，比如在李克特五点计分、七点计分的量表中，用户往往会倾向选择「中立」、「一般」的评价。回到我们 NPS 的题目上看，不了解背后计算逻辑的 5-6 分用户很有可能将这个分数值定义为「不好不坏」，而非不断的投诉和抱怨。

在一次用户调研中，因为需要清晰地进行用户分类，研究不同类别下用户对于产品和竞品的使用研究，笔者在前期做了一个尝试：随机选取两组活跃用户，一组用户的题目在 7 分出做出了做出「中立」标注，一组用户的题目没有做任何标注，结果如下：

我们可以看到，在有明确标注的组中，用户趋中分数是 7 分，而非 5-6 分。这在一定程度上说明，如果不加判断地直接将 5-6 分用户划分为「贬损者」，很有可能会曲解用户的真实态度。

因此，如果你想更多的了解用户为什么会给出那样的分数和真实的态度，可能就需要进一步追问，下图便是一个简单的追问题目和补充指标。

每一个测评体系都未必是足够完善的，NPS 也难免有着各类批评的声音。因此在真正的实践中，不要完全依赖单一层面的指标，结合实际项目特点多走几步，可能会让你的 NPS 更加有意义。

延伸阅读

本文最初发布于「用户研究社」(Wechat: UXD-JointLab), 感谢这个有趣儿的团队.