职场心理
职场心理

您现在的位置: 职场心理讲解_职场心理保健 > 职场心理保健 > 养成数据思维打造职场核心竞争力

养成数据思维打造职场核心竞争力

发布时间:2023-3-15 16:51:27   点击数:

文章来源:叶秋花夏

数据认知素养之父乔丹·莫罗曾说过,数据思维是数字时代人类听、说、读、写之后的第五种基本生存技能。

数据思维,是基于具体应用场景,建立数据分析框架,利用数据提出问题和解决问题的能力。无论是身处什么行业什么领域,拥有数据思维,成为一个真正懂数据的人,将成为自己在职场上的一个核心竞争力。

那么,应该如何培养数据思维呢?

本文基于近期学习的一个数据思维课程,并结合自身感悟,讲讲数据思维的养成方式,内容具体包括四大部分:感知数据、收集数据、理解数据、“操纵”数据。

01感知数据

1.三步法培养数据敏感度

培养对数据敏感度是数据思维形成的基础,这就像作家对文字有着很高的敏感度、摄影师就对光线、角度有很高的敏感度。但这个能力通常不是天生的,需要通过练习进行培养。

定性思考转向定量思考:思考或使用一个东西时,要有意识地把过去定性的方式转变为定量的方式。例如,谈论经济发展的时候,不要简单的用“快”、“慢”、“疲软”等比较模糊的词,而是用GDP增速、PPI、CPI等定量数据去阐述。

用量来定义质:一个事物的性质常常用某一个关键量来定义,如果搞清楚这个关键量具体的定义和内涵,就很容易通过关键量来抓住事物的本质。例如,我们通常用PMI这个指标来衡量宏观经济的景气状况时,PMI是涵盖了企业采购、生产、流通等各个环节的综合性经济监测指标体系,其高低值代表了该行业或经济总体较上月处于收缩或扩张状态,也就能反映经济景气度。

确定量的标准:单纯的数据并没有太大的价值,还需要基于自己对事物的理解,设定一个可比标准。以上面提到的PMI为例,其范围值在0%-%之间,这就需要定义一个扩张与收缩的临界点(即荣枯线50%),来直接判断宏观经济的发展趋势。

2.弄清数据的背景

背景不同,数据代表的意义就不同。

以美国GDP增速为例,年美国GDP增速5.9%,这个水平是高是低呢?客观上讲,5.9%是美国自年以来最高的经济增速,属于高水平;但考虑到美国年受疫情影响导致GDP基数较低,从这个角度讲,5.9%属于“虚高”。

所以,只有掌握了数据的背景,才能帮助我们准确理解数据的意义,如事物的属性(是什么)、相对情况(高低、大小、愿景)、当事人的意图(正话反说、反话正说)等。

3.发现数据的隐藏信息

数据并不是孤立的,而是一个信号、线索,通过已知数据推理出其背后隐藏的信息,是数据思维的一部分。提出可以利用以下方法来推理:

一是数学推断,即利用数学知识(如线性分布、正泰分布)做出假设,然后进行推断;二是逻辑推理,从各个领域的规则和限制条件出发,进行合理化推测,如棋牌类游戏、数独等场景;三是切换视角,在不同的视角、关系下观察数据,往往就会发现不同的隐含信息。

4.模糊的正确优于过度的精确

数据是为解决问题服务的,很多时候模糊的正确好于过度的精确,目的决定精度才是好的数据思维。

所以,要先决定怎么解决问题、设定好解决问题的目的,再匹配相应的精度的数据,做到敢于不精确,但不能太离谱。

做到精确是需要付出资源、时间和金钱的,“敢于不精确”即精确度够用就好,“不能太离谱”则是估算要有依据,提出只要估算结果在准确值的10倍范围内,就是合理的。

例如,我们小区附近有一个生意火爆的杂粮煎饼店(即使是在去年疫情肆虐的环境下也坚强地生存下来了),我想要测算其月营收,只需要大概统计下工作日和非工作日的客户数量,再分别乘上人均买饼支出加总,就能粗略地估计出营业收入了,每天去蹲守则大可不必。

5.区别对待数据

数据可分为类别数据(具有完备、排他性)、次序数据(本质上还是类别数据,但是有先后顺序)、间隔数据、比例数据四大类型。这四类数据是向下兼容的,越往后数据拥有的信息越多,每一类数据也都有其用处,只有深刻理解数据类型的意义,才会充分地利用其中蕴含的信息。

了解数据类型后,数据类型不同,数据处理的方法也就不同。例如,对于收入类数据,可以计算其均值、增速、中位数;对于次序数据,则以定性分析为主。

6.构建指标体系定性把握事物

对于抽象的概念,如何定量地去把握它们呢?这就需要通过测量来得到一个指标体系,再利用这个指标体系来描述这个概念或事物。

例如近年来都在提的数字化转型概念,如何去定量地衡量一个企业的数字化转型成熟度一直是个难题。从业界现有的探索来看,其思路均为借助维度,对数字化转型的各个属性进行拆分为多个一级、二级指标。

如前期文章《金融数字化转型成熟度的三大评估模型,速收藏!》中介绍过的商业银行数字化成熟度评估模型,该模型将银行数字化转型概括为七项数字化能力,然后进一步将七项一级能力分解最终形成29项可度量的二级能力,并围绕每一项二级能设置了评估方式。

当然,每个人的认识不一致、角度不一致、目的不一致,维度的选取也就不一致,但通常都遵循边际效应最大化原则和可靠性原则两个原则。

边际效应最大化原则,即多增加一个指标是不是更好的说明了认知对象,如果是,那就增加;如果没有,那就不需要增加。

可靠性原则,也叫“信度”。即保证每次测量都能得到稳定的结果,要充分考虑指标与测量目的关联性(高度相关且关系得到证实)、完备性(测量的内容是不是全面反映了要认知的对象。)

02收集数据

能够很好地感知数据后,就要了解收集数据的方式,如果调查对象内部差异特别大且不能全面调查,那就用用样本推断总体;如果想了解人的内部状态,那就用问卷;如果想确定因果关系或者想知道一个判断是不是靠谱,那就用实验。同时要注意运用大数据时代新出现的一些方式方法。

1.抽样:以小见大

抽样是从一大堆东西中挑选出一小部分对总体有代表性的样本,然后通过样本的情况对总体做定量描述。

当样本的各种特征大体接近总体的特征的时候,样本就具有代表性,所以需要使用概率样本,即每一个样本都要按照事先确定的概率规则选取。

样本的选择取决于自身需求,并非越多越好。因为样本量和误差水平之间不是线性关系,刚开始是随着样本量的增加误差水平减少,但超过一个范围后样本量的增加就很少导致误差的减少。

利用抽样法收集数据时要注意,不要用样本的结果直接代表总体的特征。真抽样调查的结果是一个有限制条件的范围,其结论是这样一个句式,“在什么置信度水平下,总体的特征值在什么范围内”,这和我们写论文时数据分析的结论有点像,如“在5%的置信度下,数据检验结果显著”。

2.问卷:注意三大要点

问卷是最常见、最重要的数据收集工具之一,其核心是问而不是卷。那该如何做好一次问卷调查呢?

首先是“概念的操作化”,即用一整套问题从各个角度逼近你的主观感受,如心理调查问卷,针对同一个问题从不同的角度用多个问题去问;其次是问题必须让答题者准确理解、且可以回答,例如对于一些概念要给出解释以达成共识;同时要注意问问题的方式,问题的设计、先后顺序、措施等都是重要的细节。

3.实验:定量确定因果关系

实验是一个以确立因果关系为目标的收集数据的方式,通过操纵自变量、控制无关变量、观测因变量,既找到因果性,也能知道原因的效果大小。

实验法的难点是在选择因变量上,也就是要测量什么指标来衡量自己干预或者处理的效果。如果选择的因变量与那个结果对应得特别好,做出的结论就让人信服;对应得不好,就难以让人信服。

实验时通常会设置一个对照组,来确保除了自变量的干预不同外其他的变量都相同。有了对照组,实验组和对照组的差异才能被解释成来源于自变量的作用。

实验法特别适合范围有限、界定明确的概念和假设,如果让实验控制与真实的社会生活接近,实验的结论会更可靠。

4.与时俱进

近年来,大数据快速发展,带来了新的思维方式和利用方式,不仅冲击了传统的数据收集方式,也极大地拓展了我们的能力,我们需要与时俱进。例如最近很火的ChatGPT,就是一个很不错的数据收集工具。

大数据拥有海量性、持续性和不反应性等优势,但使用时也有很多要避开的坑。

一是大数据里的数据绝大部分都不是为了分析目的收集的,如果想利用这些数据,就必须理解这些数据是怎么产生的,搞清楚这些数据的精确含义。

二是不要低估数据清洗的重要性、难度和成本。大数据在收集的时候会有各种污染,如果不清洗就处理得出的结论就不可靠。

三是使用大数据时要理解大数据的代表性问题。大数据数据量大,但本质上也是个样本,代表性不一定好。

四是大数据很擅长比较或者分析个体的行为,但是把结论推及总体通常不在行。

03理解数据

能够很好地感知数据后,就要了解收集数据的方式,如果调查对象内部差异特别大且不能全面调查,那就用用样本推断总体;如果想了解人的内部状态,那就用问卷;如果想确定因果关系或者想知道一个判断是不是靠谱,那就用实验。同时要注意运用大数据时代新出现的一些方式方法。

1.用数据表征事物

理解数据,最常见的问题就是如何从数据中得出判断从而给事物进行表征(定性)。

在寻找表征之前,要思考两个问题:一是是否真正理解了问题,即我想要定性什么概念?要用什么数据指标来进行反映?;二是如何尽可能地提取现有数据蕴含的所有信息,用一个最合适的方程表达出来。

在面对复杂问题时,我们需要随着信息的增加而不断调整表征方向;在没有现成指标时,我们要自己构造。利用现有数据构造新指标是有风险的事情,但是坚持尝试是很有必要的,只有坚持实践,才能磨练你的技能,提高你的数据思维。

2.有效分类

分类就是按照量的标准把一个总体分成几组,并保证组内差异小,组间差异大。例如,根据人均GDP、工业技术、科学技术和社会福利等的不同,可以将全球余个国家/地区划分为发达国家和发展中国家。

分类时,要基于实际解决的问题,在数据和现实生活中建立可靠的连接,如果数据不与现实结合,很可能就会犯错误。

3.因素分解

分解就是把影响一个复杂事物的各种纠缠的因素分开,不要一见到差异就想当然地认为都源于一个单一因素,要通过分解浓缩信息、探究本质。

例如,影响GDP规模的因素很多,但是若从GDP的计算方式入手,将其分解为私人消费、投资、政府消费支出、出口、进口几大部分,就能很好地对其各个板块进行分析,从而了解本质。

4.因果分析

确认两件事物的因果关系是我们最常用的思考方式之一,只有知道了原因才能做预测,做解释,做干预。

因果关系成立有3个必要条件,一是如果两个变量之间是因果关系,那它们之间肯定有相关;二是两个变量之间有先后,原因在前,结果在后;三是两个变量之间的关系不被第三个变量解释。

因果关系的寻找是一项重大挑战,没有保证成功的一般法则。其整体思路是先建立所研究问题整体的运行图景,说明各个变量之间的联系。然后去收集数据,让数据逼近这个理论图景。再然后,用数据验证这个理论。如果验证通过,就对理论更相信一点。如果不通过,就改进理论或者收集新的数据,再次验证。如此循环下去。

04“操纵”数据

此处的“操纵”是个中性的概念,指如何利用数据做事情以达到自己想要的效果。

1.数据指导决策

数据思维一个很重要的点是改变以往凭借感觉、经验的决策方式,改用数据指导决策。

用数据指导决策需要解决三个问题:

一是用科学方法研究了解当前遇到的挑战,理解挑战是建立决策模型的前提。

二是建立决策模型,即找到一个或者几个关键变量,建立变量的数值与行动之间的规则。这也是个难点,从理解挑战到建立决策模型中间需要一个重要的转换,那就是从解决一个问题转换成理解一个机制。例如,理论上只要能将需求规则化,AI可做到无所不能,但是很多需求目前无法做到将其规则化。

三是找到决策模型中需要的数据来量化一个事物。

2.数据驱动的可视化

对数据进行处理之后会得到很多的数据结果,但这些结果都是用方程、表格之类的东西表达的,非常抽象,这是就需要进行数据可视化,帮助受众看见并理解数据当中隐含的信息。

可视化要基于数据驱动,按照事先确定的规则挖掘出数据中的模式,选择既高效又美观的方案,把这个模式展示出来让受众看见并理解。

例如国际著名咨询公司Gartner的技术成熟度曲线,从成熟时间和市场热度两个维度来描述各项技术的发展趋势,让受众一目了然。

3.识别数据中的认知陷阱

西方有句俗语,“Donthatetheplayer,hatethegame”即“别去恨玩家,要恨恨游戏”。数据也是如此,数据不会骗人,但数据在应用过程中会“骗人”,错误的使用数据容易造成误导。

所以,当我们遇到别人用数据得出的论断时,建议先问自己五个问题:谁说的?他是如何知道的?遗漏了什么?是否有人偷换了概念?这个资料有意义吗?

通过操纵数据来误导受众大致有三个方向:操纵数据的使用、操纵数据的产生和操纵数据的解释。

操纵数据的使用:用平均数掩盖分布(如人均收入)、用百分比掩盖规模(基数大小)、用短期波动代替长期效应、遗漏变化的原因、偷换概念、定义不统一、忽略测量误差(如智商水平)、差别过小没有现实意义(智商水平)、参照对象不清(无参照对象)、比较时忽略基数、对象不同强行比较、变换基数让人产生幻觉、用数字游戏控制听众感觉。

操纵数据的产生:算法采用的规则有差异、实验条件设置错误、提问的次序影响回答者的选择。

操纵数据的解释:归因错误、因果关系不成立、理论适用错误。

如果文章对您有帮助,请点赞+收藏+转发,分享给更多的朋友哟~



转载请注明:http://www.mingyangsave.com/zcbj/27013.html

网站简介 | 发布优势 | 服务条款 | 隐私保护 | 广告合作 | 合作伙伴 | 版权申明 | 网站地图

当前时间: