受到推崇的, 2024

编辑的选择

为什么大数据并不总是答案

不要嘲笑我們的性

不要嘲笑我們的性
Anonim

今天在企业技术世界聆听大多数广受好评的建议,并且如果您相信“大数据”能够解决您的所有问题,公司正在寻找。太糟糕了,它往往无法兑现承诺 - 至少不是传统形式。

原来,通常所说的大数据 - 所有这些数字度量的巨大“湖泊”根据IDC的数据,企业资源计划(ERP),消费者关系管理(CRM)和其他业务系统如此热切地被当今的分析工具所挖掘 - 实际上仅为公司平均数据的10%其余的是“非结构化”或“定性”数据,并且可能是混乱的。这种类型包括客户调查,响应表格,在线论坛,社交媒体,文档,视频,新闻报道,致电呼叫中心的电话以及销售团队收集的传闻证据等信息,这里仅举几例。它通常是文本而不是数字,它不容易“量化”,或变成数值。

这是一个问题。虽然大多数分析工具都是为了量化信息而建立的 - 换句话说,它们通常是非结构化数据,它提供了上下文和公司需要使信息有用的含义。

“数据通常会产生更多问题不是提供答案,而是总是存在'为什么?'的问题。落后于量化数据趋势,“Forrester Research分析师Anjali Lai表示。 “真空分析的数据有可能告诉我们一个不完整的故事,而定性数据可以提供这种背景视图。”

想象一下,你在一家公司试图理解为什么在线销售不在你希望的地方。例如,您可以大量投资市场分析工具,为您提供基于活动的数据,例如用户平均花费在哪个网页上的时间或用户购物车的放弃率。然而,这些数据很多,但仍不一定会给你“为什么?”

“您可能知道您的网站拥有1万个独立访问者 - 这就是量化数据,”YouEye的首席产品官Collin Sebastian说,该公司提供专门定性数据设计的软件和服务。 “定性数据可以告诉你,他们有四千人对一个特定的话题感到兴奋,这是他们希望学习的东西,这很多人没有达到他们的期望,而这正是他们所做的。”

定性数据可以超越识别数据点之间的相关性,例如,可能会告诉您,在您的网站上花费更长时间的人也倾向于进行购买。相反,定性数据可以开始识别因果关系,或者难以捉摸的“为什么?”。例如,人们是否购买商品,是因为他们在你的网站上花的时间更长,或者他们只是在网站上呆了很久,因为你的购买过程很麻烦?“现在,平均CMO管理着多达14个仪表板,”塞巴斯蒂安说道。 。 “这是一个分析瘫痪的案例:我有1000万个数据点以17种不同的方式查看我的问题,但我没有关于其含义的背景。”

历史上,定性数据的分析倾向于非常手动且人力密集。 Booz Allen Hamilton的首席数据科学家Kirk Borne解释说:“不能仅仅针对文档提交数据库查询并获取一些数据,以便将其提供给可视化文件。”定性数据分析的范围通常有限结果,但是这种情况正在开始改变。 Borne说,不仅有更多的工具和软件包专门为定性数据设计,而且还有“定性数据转化为定量数据的越来越聪明的方式,从而释放定性数据的定量分析的全部力量”。

YouEye使用视频和音频进行在线学习,以记录与客户网站,广告或其他材料进行互动的用户。通常,每个研究选择50到300个用户,具体取决于客户希望学习的内容。视频采用人工编码器,自然语言处理和机器学习相结合的方式进行转录和编码。在这个过程结束时,客户会得到一个精彩的卷轴来说明结果。

例如,在咖啡供应商的情况下,“我们通过与产品互动来运行参与者,并最终以每次精彩卷轴结束他们提到了竞争对手,“塞巴斯蒂安说。 “您立即可以对客户流失原因进行因果分析 - 这不是定量数据可以告诉您的事。”

QSR International是另一家专门为定性数据量身定制软件的公司,其NVivo产品用于盖洛普。盖洛普虽然以其全国性民意调查而闻名,但它也会与组织协商,帮助他们理解与客户关系的情感因素,并且涉及大量定性数据。“

”有些关键的研究问题没有得到充分的理解通过量化方法,包括为什么客户对供应商或客户在体验服务时的感受,动机和思考过程积极地无动于衷或漠不关心,“盖洛普研究员兼战略顾问Ilana Ron-Levey说。 “当我们与一个组织合作时,量化数据使我们能够评估特定意见的普遍程度,但定性数据对于我们理解特定频率和分布背后的含义至关重要,”她说,“盖洛普使用各种技术评估顾客的看法。例如,在近期的一个企业对企业项目中,它面对面地采访了100多位高级客户,并收集了围绕客户参与的主题的定性和定量数据,Ron-Levey回顾说。团队使用NVivo归纳分析了定性数据以及Microsoft Excel中的手动编码方法

结果显示,盖洛普使用定量响应来统计解释客户参与的驱动因素。它利用定性数据来描述这些驱动因素对顾客的看法和感受。 “从这里,”我们收集了如何改善客户类型的参与策略,“她说,”在软件中处理定性数据往往是一个数字形式的问题,例如通过给特定的数字排名或分数定性反应或评论。例如,在情绪分析中,研究人员通常会给定性数据中表达的情绪赋予一个正值或负值,然后为该情绪赋予一个数值,Borne指出。

文本分析包括总结以定量方式提供文本信息的内容,例如通过主题模型和热图,而自然语言和语义处理技术从语言中提取意义,无论是书面形式还是口头形式。

将定性数据转化为定量形式可能涉及一些主观决策。 Borne指出:“这是一个挑战,但也是一个丰富的机会。 “语言中有更多的细微差别和复杂性,我们可以用它来提取更深入的理解和更精细的意义。”

QSR的NVivo中正在使用各种算法,例如分析常用单词或句子的数据,例如。众多的可视化工具可帮助您更轻松地进行解释,同时还包括词云和树图。

“这使您可以清楚地了解观点和潜在原因,”公司首席执行官John Owen说。收集往往是耗时的,需要研究人员的高水平技巧来建立与受访者的关系,并减轻偏见,盖洛普的Ron-Levey指出,

Forrester的Lai表示同意:“定性研究人员需要掌握的最被低估和经常被忽视的技能之一是移情。” “今天,很多时候,定性研究人员仅仅依靠编码而没有批判性地思考数据的潜台词或背景。”

处理数据和验证研究模型也可能更复杂。 Borne指出,例如,在零对一尺度上对一组定量数据进行标准化可能就足够了,Borne指出:“标准统计检验可能检验假设A与假设B如果在定性数据中有很多意义深浅和理解程度很高的话,这种方法就不适用了,“他解释说,”在分析方面,可以将研究结果推广到所研究的样本集之外,Ron-Levey但是,定性数据是非常值得的。“

在大数据时代,人们对​​数字背后的人类意义有着持续的追求,”Ron-Levey说。 “理解感受,动机和看法往往会导致更真实地吸引顾客的创新和新策略。”Forrester的Lai说,“质量和数量的见解是顾客理解的'阴阳',因为这两者都需要讲述一个关于消费者行为的完整故事。“

Top