养成数据思维打造职场核心竞争力

发布时间:2023-3-15 16:51:27 点击数：次

文章来源：叶秋花夏

数据认知素养之父乔丹·莫罗曾说过，数据思维是数字时代人类听、说、读、写之后的第五种基本生存技能。

数据思维，是基于具体应用场景，建立数据分析框架，利用数据提出问题和解决问题的能力。无论是身处什么行业什么领域，拥有数据思维，成为一个真正懂数据的人，将成为自己在职场上的一个核心竞争力。

那么，应该如何培养数据思维呢？

本文基于近期学习的一个数据思维课程，并结合自身感悟，讲讲数据思维的养成方式，内容具体包括四大部分：感知数据、收集数据、理解数据、“操纵”数据。

01感知数据

1.三步法培养数据敏感度

培养对数据敏感度是数据思维形成的基础，这就像作家对文字有着很高的敏感度、摄影师就对光线、角度有很高的敏感度。但这个能力通常不是天生的，需要通过练习进行培养。

定性思考转向定量思考：思考或使用一个东西时，要有意识地把过去定性的方式转变为定量的方式。例如，谈论经济发展的时候，不要简单的用“快”、“慢”、“疲软”等比较模糊的词，而是用GDP增速、PPI、CPI等定量数据去阐述。

用量来定义质：一个事物的性质常常用某一个关键量来定义，如果搞清楚这个关键量具体的定义和内涵，就很容易通过关键量来抓住事物的本质。例如，我们通常用PMI这个指标来衡量宏观经济的景气状况时，PMI是涵盖了企业采购、生产、流通等各个环节的综合性经济监测指标体系，其高低值代表了该行业或经济总体较上月处于收缩或扩张状态，也就能反映经济景气度。

确定量的标准：单纯的数据并没有太大的价值，还需要基于自己对事物的理解，设定一个可比标准。以上面提到的PMI为例，其范围值在0%-%之间，这就需要定义一个扩张与收缩的临界点（即荣枯线50%），来直接判断宏观经济的发展趋势。

2.弄清数据的背景

背景不同，数据代表的意义就不同。

以美国GDP增速为例，年美国GDP增速5.9%，这个水平是高是低呢？客观上讲，5.9%是美国自年以来最高的经济增速，属于高水平；但考虑到美国年受疫情影响导致GDP基数较低，从这个角度讲，5.9%属于“虚高”。

所以，只有掌握了数据的背景，才能帮助我们准确理解数据的意义，如事物的属性（是什么）、相对情况（高低、大小、愿景）、当事人的意图（正话反说、反话正说）等。

3.发现数据的隐藏信息

数据并不是孤立的，而是一个信号、线索，通过已知数据推理出其背后隐藏的信息，是数据思维的一部分。提出可以利用以下方法来推理：

一是数学推断，即利用数学知识（如线性分布、正泰分布）做出假设，然后进行推断；二是逻辑推理，从各个领域的规则和限制条件出发，进行合理化推测，如棋牌类游戏、数独等场景；三是切换视角，在不同的视角、关系下观察数据，往往就会发现不同的隐含信息。

4.模糊的正确优于过度的精确

数据是为解决问题服务的，很多时候模糊的正确好于过度的精确，目的决定精度才是好的数据思维。

所以，要先决定怎么解决问题、设定好解决问题的目的，再匹配相应的精度的数据，做到敢于不精确，但不能太离谱。

做到精确是需要付出资源、时间和金钱的，“敢于不精确”即精确度够用就好，“不能太离谱”则是估算要有依据，提出只要估算结果在准确值的10倍范围内，就是合理的。

例如，我们小区附近有一个生意火爆的杂粮煎饼店（即使是在去年疫情肆虐的环境下也坚强地生存下来了），我想要测算其月营收，只需要大概统计下工作日和非工作日的客户数量，再分别乘上人均买饼支出加总，就能粗略地估计出营业收入了，每天去蹲守则大可不必。

5.区别对待数据

数据可分为类别数据（具有完备、排他性）、次序数据（本质上还是类别数据，但是有先后顺序）、间隔数据、比例数据四大类型。这四类数据是向下兼容的，越往后数据拥有的信息越多，每一类数据也都有其用处，只有深刻理解数据类型的意义，才会充分地利用其中蕴含的信息。

了解数据类型后，数据类型不同，数据处理的方法也就不同。例如，对于收入类数据，可以计算其均值、增速、中位数；对于次序数据，则以定性分析为主。

6.构建指标体系定性把握事物

对于抽象的概念，如何定量地去把握它们呢?这就需要通过测量来得到一个指标体系，再利用这个指标体系来描述这个概念或事物。

例如近年来都在提的数字化转型概念，如何去定量地衡量一个企业的数字化转型成熟度一直是个难题。从业界现有的探索来看，其思路均为借助维度，对数字化转型的各个属性进行拆分为多个一级、二级指标。

如前期文章《金融数字化转型成熟度的三大评估模型，速收藏！》中介绍过的商业银行数字化成熟度评估模型，该模型将银行数字化转型概括为七项数字化能力，然后进一步将七项一级能力分解最终形成29项可度量的二级能力，并围绕每一项二级能设置了评估方式。

当然，每个人的认识不一致、角度不一致、目的不一致，维度的选取也就不一致，但通常都遵循边际效应最大化原则和可靠性原则两个原则。

边际效应最大化原则，即多增加一个指标是不是更好的说明了认知对象，如果是，那就增加；如果没有，那就不需要增加。

可靠性原则，也叫“信度”。即保证每次测量都能得到稳定的结果，要充分考虑指标与测量目的关联性（高度相关且关系得到证实）、完备性（测量的内容是不是全面反映了要认知的对象。）

02收集数据

能够很好地感知数据后，就要了解收集数据的方式，如果调查对象内部差异特别大且不能全面调查，那就用用样本推断总体;如果想了解人的内部状态，那就用问卷；如果想确定因果关系或者想知道一个判断是不是靠谱，那就用实验。同时要注意运用大数据时代新出现的一些方式方法。

1.抽样：以小见大

抽样是从一大堆东西中挑选出一小部分对总体有代表性的样本，然后通过样本的情况对总体做定量描述。

当样本的各种特征大体接近总体的特征的时候，样本就具有代表性，所以需要使用概率样本，即每一个样本都要按照事先确定的概率规则选取。

样本的选择取决于自身需求，并非越多越好。因为样本量和误差水平之间不是线性关系，刚开始是随着样本量的增加误差水平减少，但超过一个范围后样本量的增加就很少导致误差的减少。

利用抽样法收集数据时要注意，不要用样本的结果直接代表总体的特征。真抽样调查的结果是一个有限制条件的范围，其结论是这样一个句式，“在什么置信度水平下，总体的特征值在什么范围内”，这和我们写论文时数据分析的结论有点像，如“在5%的置信度下，数据检验结果显著”。

2.问卷：注意三大要点

问卷是最常见、最重要的数据收集工具之一，其核心是问而不是卷。那该如何做好一次问卷调查呢？

首先是“概念的操作化”，即用一整套问题从各个角度逼近你的主观感受，如心理调查问卷，针对同一个问题从不同的角度用多个问题去问；其次是问题必须让答题者准确理解、且可以回答，例如对于一些概念要给出解释以达成共识；同时要注意问问题的方式，问题的设计、先后顺序、措施等都是重要的细节。

3.实验：定量确定因果关系

实验是一个以确立因果关系为目标的收集数据的方式，通过操纵自变量、控制无关变量、观测因变量，既找到因果性，也能知道原因的效果大小。

实验法的难点是在选择因变量上，也就是要测量什么指标来衡量自己干预或者处理的效果。如果选择的因变量与那个结果对应得特别好，做出的结论就让人信服;对应得不好，就难以让人信服。

实验时通常会设置一个对照组，来确保除了自变量的干预不同外其他的变量都相同。有了对照组，实验组和对照组的差异才能被解释成来源于自变量的作用。

实验法特别适合范围有限、界定明确的概念和假设，如果让实验控制与真实的社会生活接近，实验的结论会更可靠。

4.与时俱进

近年来，大数据快速发展，带来了新的思维方式和利用方式，不仅冲击了传统的数据收集方式，也极大地拓展了我们的能力，我们需要与时俱进。例如最近很火的ChatGPT，就是一个很不错的数据收集工具。

大数据拥有海量性、持续性和不反应性等优势，但使用时也有很多要避开的坑。

一是大数据里的数据绝大部分都不是为了分析目的收集的，如果想利用这些数据，就必须理解这些数据是怎么产生的，搞清楚这些数据的精确含义。

二是不要低估数据清洗的重要性、难度和成本。大数据在收集的时候会有各种污染，如果不清洗就处理得出的结论就不可靠。

三是使用大数据时要理解大数据的代表性问题。大数据数据量大，但本质上也是个样本，代表性不一定好。

四是大数据很擅长比较或者分析个体的行为，但是把结论推及总体通常不在行。

03理解数据

1.用数据表征事物

理解数据，最常见的问题就是如何从数据中得出判断从而给事物进行表征（定性）。

在寻找表征之前，要思考两个问题：一是是否真正理解了问题，即我想要定性什么概念？要用什么数据指标来进行反映？；二是如何尽可能地提取现有数据蕴含的所有信息，用一个最合适的方程表达出来。

在面对复杂问题时，我们需要随着信息的增加而不断调整表征方向；在没有现成指标时，我们要自己构造。利用现有数据构造新指标是有风险的事情，但是坚持尝试是很有必要的，只有坚持实践，才能磨练你的技能，提高你的数据思维。

2.有效分类

分类就是按照量的标准把一个总体分成几组，并保证组内差异小，组间差异大。例如，根据人均GDP、工业技术、科学技术和社会福利等的不同，可以将全球余个国家/地区划分为发达国家和发展中国家。

分类时，要基于实际解决的问题，在数据和现实生活中建立可靠的连接，如果数据不与现实结合，很可能就会犯错误。

3.因素分解

分解就是把影响一个复杂事物的各种纠缠的因素分开，不要一见到差异就想当然地认为都源于一个单一因素，要通过分解浓缩信息、探究本质。

例如，影响GDP规模的因素很多，但是若从GDP的计算方式入手，将其分解为私人消费、投资、政府消费支出、出口、进口几大部分，就能很好地对其各个板块进行分析，从而了解本质。

4.因果分析

确认两件事物的因果关系是我们最常用的思考方式之一，只有知道了原因才能做预测，做解释，做干预。

因果关系成立有3个必要条件，一是如果两个变量之间是因果关系，那它们之间肯定有相关；二是两个变量之间有先后，原因在前，结果在后；三是两个变量之间的关系不被第三个变量解释。

因果关系的寻找是一项重大挑战，没有保证成功的一般法则。其整体思路是先建立所研究问题整体的运行图景，说明各个变量之间的联系。然后去收集数据，让数据逼近这个理论图景。再然后，用数据验证这个理论。如果验证通过，就对理论更相信一点。如果不通过，就改进理论或者收集新的数据，再次验证。如此循环下去。

04“操纵”数据

此处的“操纵”是个中性的概念，指如何利用数据做事情以达到自己想要的效果。

1.数据指导决策

数据思维一个很重要的点是改变以往凭借感觉、经验的决策方式，改用数据指导决策。

用数据指导决策需要解决三个问题:

一是用科学方法研究了解当前遇到的挑战，理解挑战是建立决策模型的前提。

二是建立决策模型，即找到一个或者几个关键变量，建立变量的数值与行动之间的规则。这也是个难点，从理解挑战到建立决策模型中间需要一个重要的转换，那就是从解决一个问题转换成理解一个机制。例如，理论上只要能将需求规则化，AI可做到无所不能，但是很多需求目前无法做到将其规则化。

三是找到决策模型中需要的数据来量化一个事物。

2.数据驱动的可视化

对数据进行处理之后会得到很多的数据结果，但这些结果都是用方程、表格之类的东西表达的，非常抽象，这是就需要进行数据可视化，帮助受众看见并理解数据当中隐含的信息。

可视化要基于数据驱动，按照事先确定的规则挖掘出数据中的模式，选择既高效又美观的方案，把这个模式展示出来让受众看见并理解。

例如国际著名咨询公司Gartner的技术成熟度曲线，从成熟时间和市场热度两个维度来描述各项技术的发展趋势，让受众一目了然。

3.识别数据中的认知陷阱

西方有句俗语，“Donthatetheplayer,hatethegame”即“别去恨玩家，要恨恨游戏”。数据也是如此，数据不会骗人，但数据在应用过程中会“骗人”，错误的使用数据容易造成误导。

所以，当我们遇到别人用数据得出的论断时，建议先问自己五个问题：谁说的?他是如何知道的?遗漏了什么?是否有人偷换了概念?这个资料有意义吗?

通过操纵数据来误导受众大致有三个方向：操纵数据的使用、操纵数据的产生和操纵数据的解释。

操纵数据的使用：用平均数掩盖分布（如人均收入）、用百分比掩盖规模（基数大小）、用短期波动代替长期效应、遗漏变化的原因、偷换概念、定义不统一、忽略测量误差（如智商水平）、差别过小没有现实意义（智商水平）、参照对象不清（无参照对象）、比较时忽略基数、对象不同强行比较、变换基数让人产生幻觉、用数字游戏控制听众感觉。

操纵数据的产生：算法采用的规则有差异、实验条件设置错误、提问的次序影响回答者的选择。

操纵数据的解释：归因错误、因果关系不成立、理论适用错误。

如果文章对您有帮助，请点赞+收藏+转发，分享给更多的朋友哟~

转载请注明：http://www.mingyangsave.com/zcbj/27013.html

上一篇文章：写作疗愈焦虑不安时,做自己的摆渡人

下一篇文章：没有了

您现在的位置：职场心理讲解_职场心理保健 > 职场心理保健 > 养成数据思维打造职场核心竞争力

养成数据思维打造职场核心竞争力

最新文章

热点文章

推荐文章

您现在的位置： 职场心理讲解_职场心理保健 > 职场心理保健 > 养成数据思维打造职场核心竞争力

养成数据思维打造职场核心竞争力

最新文章

热点文章

推荐文章

您现在的位置：职场心理讲解_职场心理保健 > 职场心理保健 > 养成数据思维打造职场核心竞争力