如何克服数据湖与客户互动分析之间的瓶颈

-回复 -浏览
楼主 2018-11-07 13:24:57
举报 只看此人 收藏本贴 楼主

点击上方“蓝色字体”,选择 “置顶公众号

关键讯息,D1时间送达!



各行业的许多组织都在努力获取他们所需的客户数据,以便在所有与客户的接触中提供个性化的和情景的体验。最近,数据湖已被吹捧为管理所收集的各种客户数据的最佳方式,许多大数据和分析解决方案都侧重于使用自助式方法来利用数据湖价值。


创建客户的完整视图,并通过最佳渠道实时互动。

 

当今在商业领域的竞争就是了解你的客户。消费者期待个性化的服务和令人满意的体验,而与他们互动品牌无关的东西都可能导致客户选择其他品牌。


 

各行业的许多组织都在努力获取他们所需的客户数据,以便在所有与客户的接触中提供个性化的和情景的体验。最近,数据湖已被吹捧为管理所收集的各种客户数据的最佳方式,许多大数据和分析解决方案都侧重于使用自助式方法来利用数据湖价值。

 

将所有客户数据都转储到数据湖中是不够的;特别是当分析引擎与其收到的数据质量一样好时。根据研究公司Forrester Inc.最近的一份报告,只有25%的业务和技术决策者表示,他们实施大数据解决方案后增加了收入。这意味着大多数公司并没有有效地利用客户数据形成的见解来更好地服务和留住客户,Forrester公司说道。

 

是什么阻碍了企业在客户互动中使用大数据?数据湖和使用客户互动分析之间存在着两个瓶颈。一个是建立黄金记录,准确和完整的客户视图,另一个是克服流程中的延迟--在数据、分析和执行层面--通过正确的渠道或接触实时与客户互动。 


数据湖和黄金记录

 

让我们先看看建立黄金记录所面临的挑战吧。黄金记录的概念超出了所谓的360度客户视图或客户的单一视图范畴。它是来自整个企业的更丰富和全面的数据集合,涉及到将有关客户的所有已知信息收集到整个组织都能访问的数据控制中心点。

 

构建良好的黄金记录至关重要,因为数据驱动的客户互动质量高度依赖于数据本身的质量(准确性、完整性、相关性和及时性)。不正确的数据会导致不相关的报价、冗余方法以及顺序混乱或提供过时的报价。数据湖是一个很好的存储库,但组织选择数据湖(原始数据种类繁多,数据量大,数据捕获简便等)的很多原因都会放大他们所面临的质量问题。

 

其解决方案是应用严谨且周密的数据匹配策略,该策略利用探索性、概率性和机器学习方法来掌握数据并创建持久化的关键结构,然后插入自动化流程来管理数据并为客户互动生成恰当的“预测”。添加自动化流程可简化黄金记录的创建过程,使其随时间推移更容易维护。这就是客户数据平台(CDP)应该做的事情,尽管很少的数据平台能做到这一点。真正高质量的数据需要很多因素,诸如跨源数据提取,名称和地址标准化,调整确定性和概率匹配以及解决问题、审计和合规性所需的人工流程。它并不是出于内心的愿望,大多数客户数据平台提供商都会试图掩盖这种复杂性。但是,相信我,如果跳过这些步骤,结果分析会产生非常不准确的结果。

 

对于大数据的实施,客户数据平台必须在本地处理数据湖中常见的所有源格式,包括多个NoSQL数据库和文档格式,如MongoDB、Avro、Parquet等跨多个大数据环境的格式。客户数据平台应该能够利用大数据分布式计算资源,而这些资源往往被忽略,当作非SQL数据库的主要价值。

 

通过在大数据环境中精心设计的客户数据平台,组织可以处理数据湖中各个种类、速度和数量的信息,以生成准确的客户资料用以进行客户分析和互动。

 

面对数据湖中的延迟

 

另一个关键挑战是克服延迟,它以三种基本方式出现在数据湖/分析过程中。第一种是进程启动延迟。数据处理有意地与到达数据库中的数据进行分离。这是数据湖设计工作的一部分,但这也可能导致更新客户信息的延迟。

 

将“数据仓库思维”引入数据湖时,信息可能会被视为半静态数据的集合,并且更新将在预定时间(例如夜间)执行,以便在早上生成可用于分析的信息。对于像生成报告等与时间无关的流程来说,这样很好。但它不适合那些应与客户的节奏相匹配的流程。

 

对于这些侧重互动的实时过程,数据需要更有规律地进行更新。这需要进行更改(例如,数据触发的流程)以及对架构或模型的更改,以有效处理更新所带来的数据更改,而不是批量构建配置文件。

 

第二种延迟涉及客户数据平台。客户数据平台或其他软件的性能可能会直接对流程增加时间延迟。如果客户数据平台每小时只能处理几千次更新,那么它不会将配置文件更改的速度提高到足以匹配客户的节奏。

 

许多客户数据平台供应商为生成客户记录而引用高性能数据,但在该过程中不包括复杂的匹配或更新。由于不包括匹配,他们只基于现有客户对新记录的简单生成进行衡量。

 

对于大中型企业来说,性能通常需要达到每小时数百万条记录,并且整个过程的实际输入到输出时间在2-5秒范围内。性能需要满足这个严格的标准,因为上游供给过程和下游行动过程本身会带来额外的延迟。

 

第三种是分析/编排延迟。一旦客户配置文件准备就绪,由于分析软件或编排软件的平庸表现,或者由于人力资源有限,可能还会在架构上带来下游的延迟。

 

通常,这是将用例需求与测量的延迟相匹配的问题。对于许多分析任务,由于缺乏有能力的分析师,下游的延迟可能会变得更糟。对于这种延迟,可以结合更好的数据质量自动化;更好地确定时间/性能要求;并且精心设计、测量和调整软件和流程将确保下游流程延迟足够小,以满足项目要求。

 

数据湖被设计用于现代品牌所处的各种数据结构和节奏的环境中。部署一个数据湖是第一步,但品牌商还需要明白,添加数据湖只是迈向始终与客户互动的其中一步。他们还需要消除延迟障碍,并简化创建黄金客户记录的过程。通过实现这两个目标,品牌商才可以真正与现代消费者建立联系,并提供客户所期望的个性化体验。


(来源:企业网D1Net)


如果您在企业IT、网络、通信行业的某一领域工作,并希望分享观点,欢迎给企业网D1Net投稿投稿邮箱:editor@d1net.com


点击蓝色字体关注

您还可以搜索公众号“D1net”选择关注D1net旗下的各领域(云计算,数据中心,大数据,CIO, 企业通信 ,企业应用软件,网络数通,信息安全,服务器,存储,AI人工智能,物联网智慧城市等)的子公众号。

企业网D1net已推出企业应用商店(www.enappstore.com),面向企业级软件,SaaS等提供商,提供陈列,点评功能,不参与交易和交付。现可免费入驻,入驻后,可获得在企业网D1net 相应公众号推荐的机会。欢迎入驻。
扫描下方“二维”即可注册,注册后读者可以点评,厂商可免费入


我要推荐
转发到

友情链接