HI, 你好!我是来自19DPG 数字营销学院的孙栎。本文是旨在帮助买家评估客户数据平台(Customer Data Platform)系统的系列文章之四。它提供了CDP系统的背景,CDP系统的一般功能描述,并对买家准备选择采用CDP系统所进行评估时所涉及到数据输出问题列示了检核清单。

客户数据平台的背景及功能描述

请参考 CDP非技术问题评估

数据输出问题的检核列表
连接

这些问题涉及将CDP数据提供给外部系统。

批处理文件。最基本的访问类型是CDP生成一个包含选定数据的文件,并将该文件传递给外部系统。批处理文件可以传输大量的数据,几乎所有的外部系统都可以导入批处理文件。批处理文件的主要缺点是需要时间来生成和加载; 因此,它们不适用于必须立即检索最新数据的情况。与批处理文件连接有关的问题包括:选择要包含在批处理文件中的记录的过程是什么;用户如何指定包含哪些数据元素;系统可以创建什么文件格式(CSV,JSON,XML,数据库表等) ;批处理文件如何传送到其他系统;可以预定文件生成;批处理文件是否可以提供自上次提取以来只有新的或已更改的记录;系统如何监视批处理文件的创建并处理出现的问题(如中断提取过程或输出错误);什么因素决定了创建批处理文件的时间(记录数量,记录大小,输出格式,选择规则等)以及典型的创建时间;而且,批处理文件的大小是否有限制?

API连接。这些是由请求操作的外部系统调用的:在CDP环境中,操作通常是返回特定的数据片段。 API连接通常比其他类型的连接更快,因此它们是实时访问单个客户数据的最常用方法。但API也可以请求有关客户群的数据。一组与API调用有关的问题可用的操作:找到特定的记录(例如,用特定的客户ID);找到符合特定标准的记录;汇集来自多个记录的数据(例如与一个客户有关的所有信息) ;返回指定的数据元素;在返回之前重新格式化或转换数据元素;创建并返回计算的值;返回由外部系统创建的值(例如,通过将数据馈送到预测建模系统来生成评分);并且存储在API请求期间创建的数据(例如,将模型评分或分段代码添加到所选记录;创建新记录,例如推广历史记录)。另一组问题涉及API的机制:支持哪些API格式(例如Web系统的REST和SOAP);是发布的API(以及它如何记录);有数据交换集线器的标准连接器,如Mulesoft,Jitterbit,SnapLogic或Zapier; API返回数据的速度有多快;而且,返回的数据量是否有限制?

软件开发工具包(SDK)。这些是构建软件的工具集合; 在CDP环境中,它们主要用于与移动应用程序集成。在应用程序运行期间,可能会使用SDK将某个调用嵌入到移动应用的特定位置,并将返回值传递至CDP,例如用户到达新的界面或执行指定操作时。与API一样,问题包括SDK中可用的操作以及SDK部署的机制。针对SDK的其他问题包括:使用它所需的技能和培训; 监控性能的工具,包括对应用性能的影响; 和SDK支持的平台(OSX,Android,Windows等)。

查询。这些是通过标准查询语言(如SQL)进行的数据请求。它们可以由用户直接提交,由应用程序发送或通过诸如ODBC或JDBC的API连接。查询可能会返回单个记录或大型数据集。与查询访问相关的问题包括:支持的查询语言(以及特定的语言,因为主要的语言有不同的版本,可能会增加特定的功能); 查询生成器如何与CDP数据存储连接; 关于数据存储的什么信息被暴露给查询生成器(字段,表,索引等); 对允许的数据结构的任何限制(例如跨表的多对多关系); 能够向不同的系统或用户呈现不同的数据视图; 支持实时交互的能力; 和任何量的限制。

安全。这涉及对系统中数据访问的控制。根据用户可以访问CDP的限制,用户可以查看哪些数据元素,哪些记录是可访问的,以及如何使用特定的数据元素。与安全有关的问题包括:在系统中可以管理什么类型的限制; 系统如何管理与特定用户或系统有关的限制; 系统如何跟踪实际的数据请求和后续使用情况; 系统如何管理地理限制(例如,限制某些地区的客户数据); 随着监管规则的变化,系统如何保持最新状态; 系统如何证明符合监管要求; 以及维护安全和合规政策所需的技能。

产品集成。这涉及到与特定外部系统的集成。许多CDP已经建立了这样的连接器,通常集中于支持诸如Web个性化,电子商务,展示广告,归因或者营销自动化之类的应用。这些集成使部署CDP数据更容易,从而自CDP投资中获得价值。与产品集成有关的问题包括:哪些系统具有现有的连接器;这些连接器支持什么功能;是限于特定的预定义数据元素的连接器,还是可以适应CDP可用的任何元素;在新的安装中需要什么技能和任务来设置连接器;如果所需的连接器还不存在,则需要创建新的连接器;供应商是否提供资金或技术服务来创建新的连接器;连接器是否支持实时访问;连接器是否可以在交互过程中实时导入数据并使其立即可用;并且,连接器可以支持的数据量或同时交互的数量是否有任何容量限制。

性能

这些问题与响应时间,数据量和查询复杂性有关。

实时响应。这涉及在实时交互期间返回数据请求。请求可能来自API,查询或SDK。关键问题包括:返回响应的时间,必须与特定应用程序的要求进行比较(在某些情况下,低至30毫秒,其他时间低至2-3秒); 影响返回数据量的响应时间; 指定返回哪些元素的能力; 对多个同时请求的响应时间的影响; 对用于指定返回哪个客户的记录的标识符的响应时间的影响(例如,具体的客户ID与需要搜索或链接的其他参数) ; 在网站访问等多步骤交互过程中缓存客户数据的能力,所以不会反复查询相同的数据; 以及用交互期间收集的信息更新客户数据(例如预测模型评分)的时间。

批量输出。这涉及到生成批处理文件输出。这通常是两步骤,首先找到所需的数据,然后将数据加载到存储设备。存储设备可能是电脑磁带,内存存储或磁盘存储。传输时间可能包括将数据复制到设备上的时间,以及通过电子方式(例如通过网络连接)或物理方式(如传送磁带)传输数据的时间。对于大文件,复制数据的时间可能很重要。与批处理输出相关的问题包括:影响组装批处理文件的时间的因素(包括文件总大小,整个数据库中的记录数,为文件选择的记录数,选择标准的复杂性,索引的使用,返回数据元素的数量,存储数据的单独表的数量,以及需要返回计算值或聚合值);预期要求的典型装配时间;如何提交请求(API,查询,SDK);如何输出格式化(平面文件,数据库表等);如何存储文件(电脑磁带,磁盘驱动器等);如何传输文件(网络,磁带等);提高传输速率的选择(压缩,备用网络);确保数据完整性的流程(检查查询是否成功完成,检查数据是否完全准确地传输);和安全程序,以避免未经授权的访问,使用或保留。

体积限制。这涉及提供给外部系统的数据量或复杂性的限制。问题包括:一段时间内对数据请求数量的限制; 每个请求返回的数据量的限制; 对请求可访问的数据量的任何限制(例如,加载到针对实时访问优化的数据库的提取); 以及请求中包含的数据类型或表的数量限制。

记录选择。这涉及到如何选择数据的限制。关键问题包括:哪些数据元素可用于选择; 可以选择报表包括复杂的条件,如价值之间的比较(例如,三个月以上的初始订单和最近的订单之间的对比),聚合(例如总生命周期购买价值),计算(例如预测模型评分),缺失值; 可以选择合并多个表中的数据; 可以根据客户ID或搜索参数进行选择; 并且可以选择针对未被索引的字段。

应用

这些问题与CDP系统提供的营销应用有关。除了向外部系统提供数据访问的核心CDP应用之外。

分割/细分。这涉及到客户数据的细分,然后用于指导市场营销计划。关键问题包括:如何定义细分市场; 当客户的数据发生变化时,客户会重新分配到新的客户群; 客户可以同时属于多个细分市场; 而且,系统是否保留了客户以前属于哪个细分市场的历史记录以及何时更换细分市场。

预测分析。这涉及建立显示客户可能采取指定行动或属于特定类别的预测模型。关键问题包括:系统可以做出什么样的预测;建立新模型需要哪些数据;需要什么样的技能和任务来建立一个新的模型;多长时间才能建立一个新的模型; 建立模型所需的供应商协助; 采用什么措施和标准来展示新模型的可靠性;提供关于模型中使用的参数和权重的信息;客户如何对现有的模型进行评分;评分过程如何处理缺失的数据;系统如何报告现有模型的准确性或确定何时模型运行不良;如果模型被不恰当地应用(例如,客户或用于构建模型的输入范围之外的数据),系统是否会警告用户;并且,随着时间的推移,系统会随着新数据的采集而自动调整模型。

个性化。这涉及到基于当前数据为个人选择适当的消息。它可能会利用分割和预测分析。关键问题包括:CDP可以实现哪些类型的执行系​​统(网站,电子邮件,移动应用程序,广告服务器,广告招标系统等);为此特定的执行系统有CDP的预建连接器; CDP如何与执行系统连接以插入个性化的消息; CDP可以从执行系统获得哪些数据来识别当前客户并提供相关性场景; CDP中的哪些数据可用于个性化;系统如何知道哪些消息(例如产品,报价,创意处理,渠道专用格式等)是可用的;用户如何设置规则来选择个性化的消息; CDP是否具有预测建模或机器学习功能来选择个性化消息,而无需用户创建规则或与用户创建的规则相结合;用户可以控制联系客户的频率或者收到相同信息的次数。系统能否在多个渠道或执行系统上协调消息;系统如何跟踪它传递的消息的性能;并且,系统能够根据过去的表现来调整它传送的消息。

营销战役。这涉及到为个人选择合适的消息序列。它可能会利用细分,预测分析和个性化。关键问题包括:用户如何设置营销战役系列;客户如何分配到活动(例如,通过触发事件,选择规则,人工分配等);营销活动可包括的消息序列;客户可以同时属于多个营销战役系列;在营销战役系列中可以采取什么行动(发送消息,更新数据,添加或删除现有广告系列等);可以根据活动期间的行为向客户发送不同的消息序列;可以在多个渠道或执行系统中包含消息;营销活动是否与客户旅程阶段相关;系统如何衡量营销活动结果或有效性;该系统是否支持一个营销活动中的a / b测试和控制组;系统能否根据结果对营销活动进行及时调整营销动作流程,如果有的话,哪些活动参数(消息内容,频率,时间等)被优化;以及有哪些报告提供给营销战役评测。

归因。这涉及到衡量营销活动对客户行为的影响,特别是对收入的影响。归因可能会将行为与单一营销互动(如第一次或最后一次联络)联系起来,可能会使用固定公式将信用的一小部分分配给多次营销努力;或者可以使用统计方法的算法来估计每个交互的影响。关键问题包括:哪些数据可用于归因分析(哪些营销互动和哪些客户行为);分析中包括哪些营销活动(一个渠道,全部数字渠道,所有渠道);系统如何处理与特定受众无关的营销活动(例如广播广告,活动赞助);什么归因技术可用(首次/最后一次触达,评分,算法);用户如何选择使用哪种归因技术;如果使用算法方法,这些算法是如何工作的;该系统对调查结果提供了哪些报告;系统可以比较不同方法的结果;系统可以模拟不同营销预算的结果;并且,系统可以根据归因发现建议最佳的营销预算。