数据产品管理,赢得未来的企业核心竞争力

本文翻译自英文原文的部分内容:An Introduction to the Data Product Management Landscape(2018 Anh Nguyen )

虽然早在人工智能初露锋芒之前,数据产品的构建就已经开始了。但是,数据产品管理岗位的设立与完善则是相对较近的事。这一职位能直接发挥数据既是关键产品又是公司竞争优势的作用。今天,数据的规模化使用有利于降低成本(如数据中心运行管理的优化),提高收入(如电子商务领域的交叉销售与追加销售),推动技术进步(如自动驾驶汽车的深度学习能力)。

在人工智能的热潮中,动物分类算法与Go-playing智能代理代表了数据产品管理的两大基石。但算法整个数据产品生态系统中的一部分。在大部分商业场景下,算法模型可能对结果的影响微乎其微。想要让数据在组织内部畅通无阻的流动,必须具备一个大型支持生态体系,并完成三大任务:

第一,原始事件与交易行为需要被收集、存储和伺服化。
第二,与相关团队共同处理、开发和分享数据。
第三,制作并部署算法模型,并在生产过程中加以监督。

这三项工作最终都要有看得见、摸得着的商业成果。那么在数以万计的业务方向里,企业应该先做什么、再做什么?

Insight企业数据平台已经帮助上万名员工成功转型到数据产业,找到了适合自己的岗位。我们发现,业界对能为数据团队决定轻重缓急、处理好协调问题的项目经理的需求有所增长。这篇文章就试图描述数据产品管理是什么样子,以及它为什么如此重要。

为什么需要数据产品管理

如果是小型项目团队,没有正式的产品经理,那么像机会评估、技术路线图制订、股东管理这些常规性的产品责任基本上是技术经理和没有团队的个人贡献者来做。放在大型团队里,这种分工就有很多不足,最主要的是以下四点:

第一,产品工作占据所有个体贡献者的所有时间

第二,不是每个个体贡献者都有能力或者有意愿大规模地从事产品工作

第三,业务部门和技术团队之间的差距越拉越大。 第四,各个技术团队之间的距离越拉越大

第四,各个技术团队之间的距离越拉越大

在这个拐点上,企业有两个应对之道。一个是把任务分解成若干子项目,并确保个体贡献者或小型技术团队有能力全程跟进,不涉及其他团队,也就不用设立某种形式的总协调员。

第二个应对方案是建立一个正式的产品管理组织,专门负责维护真实数据来源路线图,并在各团队与个体贡献者之间协调任务的执行情况。这种方案对于电子商务和按需服务这种功能高度交叉的产品来说尤为普遍。

第一种方案要想发挥出全部作用,必须使个体贡献者能够对产品进行调整,迅速取得客观的运行反馈,并在最差的情况下,以不进行大改为前提完成回滚。这种方案或许适用于免费的社交网络产品,但对于像按需服务这样,付费型而任务繁重的产品,基本上是毁灭性的。比来比去,大多数大规模的公司还是选择了第二种方案,即专门成立一个了产品管理组织。

数据产品管理现状

在数据演进的初期,像软件工程、数据工程、建模这种交叉的数据技能,都同属于数据科学的门类。现在,它们均已快速发展成独立的岗位,比如数据工程师、数据科学家、研究人员、机器学习工程师等。

类似的趋势也正出现在产品管理行业内部。与技术项目经理的分类类似,该行业也出现了若干个子岗位,例如基础设施、数据分析、应用机器学习/人工智能、探索与标准化、平台管理等。这些具体化的过程与技术项目岗曾经的演变如出一辙。不同的是,对数据项目经理岗来说,上述头衔还没有尘埃落定。其发生发展,不过是反映了数据产品工作相对独特的分工现象。

虽然每个数据用例都要求不同形式的技术理解和领域理解(下文将会涉及),但就一般情况而言,产品管理技能仍然是成功的主要原因。我要强调这一点,因为一个数据产品经理每天的主要工作,还是确定优先级、沟通、股东管理、设计以及制定规范。

建立一个通用的数据基础设施

规模条件下,每个产品团队的用例和数据需求各不相同。但为了尽快启动,这些团队往往倾向于打造独立的数据基础设施。这种倾向会造成重复劳动、数据孤岛,最终团队也都会遭遇类似的数据规模性问题。

对基础设施产品经理来说,最终交付的产品应该是一个通用的数据基础设施,它可以永久地收集、存储、处理相关数据,从而降低用例。有了这个产品,团队就能将重点放在原始数据的使用上,而不是收集和存储上。

基础设施产品管理的关键绩效指标是数据可用性、规模性与可靠性。基础设施产品经理应该精通数据工程技术,例如数据接入、批量实时处理、文件系统与发送等。

构建一个自助分析、定制仪表盘和报告工具的混合体

当代职场,决策者越来越离不开数据。从战略到产品和运营,从离线到实时,大量决策都建立在数据分析的基础上。如果说,基础设施产品经理的职责是确保数据查询能够在海量数据背景下有效运行,那么分析产品经理则专注于将这些原始数据进行可操作化,提供给经理、项目经理、运营团队等决策方。除此之外,产品分析经理还应积极投身于关键绩效指标的认定工作与数据的探索工作,为商务决策建言。

在产品构筑的语境下,一名分析产品经理的职责是创建一个自助分析、定制仪表盘和报告工具的混合体,促进观点在组织层面的形成与分享。分析产品经理涉及多元化的相关方,既有睿智的数据科学家,也有经理这种“只读型”的消费者。

分析产品经理的关键绩效指标,主要依靠查询任务的运行数量和发送的报告数量等,这证明数据用户可以轻松地从原始数据中提炼出需要的观点。

对机器学习/人工智能的应用有超强直觉

某些产品和功能本身会自然而然地从机器学习/人工智能中寻找解决方案,例如搜索、推荐、诈骗检测等。应用机器学习的产品经理专注于把数据应用在既有产品上——例如分析聊天记录,使客户服务路由实现自动操作,以及用高级人工智能设计出一种全新体验——例如照片分享软件的筛选器。说到底,他们的工作就是直接改进面向用户特征的关键指标。

致力于上述任务的产品经理虽然并不总是冠以数据产品经理的名号,但他们一般都对数据科学的工作流程及其机器学习模型有着深刻理解。他们在机器学习的利用上有很强的直觉,并且比起严守规则的职员,他们更懂得如何在极限边缘设计产品,提供优质的用户体验。

以通用平台增强数据可复用性

考虑到这个背景,大公司的单个数据团队会先着手建立专属的一次性系统,这就导致了重复劳动和拖沓的生产周期。因此,谷歌、Facebook、Uber等公司已经正式把目光转向平台——以通用的框架来减少花在加工、调用、监视等一般任务上的精力。

之所以建立这些平台,目的之一就是为了整合管理数据、调用和监视的功能,让数据团队能够把重心放在模型和实验上。还有一个目的是,因为有了这些平台,所有用户都可以获取通用数据和特征,从而增强可复用性。

平台产品经理的工作首先是证明平台如何发挥作用,然后是让早期使用者愿意付出尝试。一旦平台到达拐点,产品经理的角色就转变成了找出具有高回报率业务的共同特性,并将其嵌入平台。平台产品经理的关键绩效指标包括:平台上运行的模型、实验、投入市场所需的平均时间等。

标准化与探索

标准化与探索也是团队规模的一个问题。公司越大,单个团队和人员所创造的数据量也会出现指数级的增长。数据的迅速输出造成了一个问题:遍寻公司上下,没有一个数据中心可以查看到全部数据。

如果缺少一个记载、整合、显示海量数据的结构,那么组织对于数据源的掌握情况就会受制于数据拥有者。结果就是,数据真正意味着什么、从何而来、以及有多可信,这些问题全都变得不确定。不仅如此,如果最熟悉那方面数据的员工离职,关于这些数据源的知识也将一同消失。第三个常见的问题是,使用了相同数据的团队对于本质上一样的指标往往会给出不同定义。例如,最后7天在这个组可能叫作“整整最后7天”。到了另一个组,就可能叫做“最后168个小时”。

数据标准化与探索项目经理的职责是确保整个公司意识到数据的存在,并且以一套固定的方式使用它们。上述努力的一个常规的产品流程是数据目录和数据通道,为数据、仪表盘和指标的探索与定义提供便利条件,同时也负责识别和联系数据所有者,以便建立进一步的对话。

数据通道的一个高级版本是降低计算指标的获取难度,并将其融合到建模、分析等各个用例中。

用发展的眼光看未来

数据产品管理依然在发展之中,本文也无意穷尽业界数据产品岗位的所有内容。数据产品经理可以是上述职责的混合体。至于具体有哪些职责,取决于公司的发展阶段和组织架构。分析可以是基础设施的一部分,标准化与探索也可以是平台的一部分。而应用机器学习产品经理也可能负责整合资源,以构筑基础设施和调配环境,为模型的生产提供必要条件。

说到底,这些岗位都要创造一场有价值的、以数据为基础的用户体验,也要扫除所有障碍,确保团队能够提供这份价值。