数据分析师需要具备怎样的专业技能?

您所在的位置:网站首页 作为数据分析师需要掌握哪些技能 数据分析师需要具备怎样的专业技能?

数据分析师需要具备怎样的专业技能?

#数据分析师需要具备怎样的专业技能?| 来源: 网络整理| 查看: 265

国庆回家,一家人围着餐桌闲聊。谈及工作,我妈问我:“你每天都在公司做些什么呀?”我竟一时语塞,不是因为不知做了什么事;而是因为我们好像做了各种各样的事(维护指标体系、做专题分析、建数据表、建设数据产品、等等不一而足),但却很难简单明了的告诉我妈“我在做什么?有什么价值?”。顿时感觉有点沮丧,因为“一件事情如果我没办法跟我妈讲清楚,说明我自己没有思考清楚。”[1]。

全文:5031字;预计阅读时间:12分钟。

‘数据岗的职能是什么(做什么工作)?(对组织[2])贡献了什么样的价值?’是一件非常重要的母题”我说时来不及思索,但思索之后,还是这样说。

因为一旦思考清楚这个母题,对个人而言,就可以回答个人成长与职业规划的问题;对组织而言,就可以回答能力发展与组织建设的问题。为什么这么说?

图1:个人与组织待解的问题

因为工作的最小单元是一个个的任务。相似的任务聚合在一起,形成了职能;相关的职能组合起来形成了岗位。相关的岗位组合在一起,形成了部门;所有的部门组合在一起,构成了组织。

图2:知识技能、职能岗位、部门组织之间的关系

而对个人而言,待完成的任务,决定了所需的知识技能;所以弄清楚数据岗的职能,以及自己想要履行的职能,就可以明白自己要掌握哪些知识与技能。即,解决了个人成长的问题。从承担单一职能,到承担多个职能(职责扩大化),到职能丰富化[3],进而到承担主要的协作职能(管理职能),就是职业规划与职业发展的一种路径图。

而对组织而言,明确哪些是需履行而目前未履行好的数据职能,就能明确能力发展的方向;对职能的重组和对岗位的重组,使得整体的工作更加顺滑、高效,就是一定程度上的组织建设。

PS:这里以职能为主要的颗粒度,是因为:不同的组织由于实际状况的不同,对于相同名称的岗位,会设计不同的岗位职能。“数据分析岗”在目前阶段就是一个非常典型的例子,在有些组织,这个岗位会归属与独立的数据部门,而有些组织内它会归属于业务部门(产品/营销/研发/等等)。在有的组织内部,对产品、运营等等岗位有不低的数据能力要求;而在有些组织内,则并非如此。这些现象的本质是不同的岗位设计,不同的职能组合。这也是为什么,有的同学说,在他们公司,数据分析师从不跑SQL;有的同学说,数据分析师要懂数据产品设计;有的同学说,数据分析师要熟悉各类算法;等等。这些同学说的都对,都是实际情况;但这不意味着数据分析师什么都要会,什么都要懂,什么都要做。一、核心职能:数据岗位的核心职能是什么?

谈到数据岗的工作有哪些,大家的脑海里肯定会浮现出特别多的词:ETL、取数、做报表、专题分析、指标体系。绩效管理,不一而足…… 但是究竟什么才是数据岗的核心职能?如何通过一句话总结性地告诉父母,我们在做什么工作呢?

图3:数据岗的工作事项

好好认为,数据岗的核心职能有两个:① 产出数据资产;② 提升信息的价值密度。[4]

数据资产:所谓数据资产,是个人/企业所控制的,预期会带来未来经济利益的数据资源。这种资源可以是以物理形式存储,例如文档资料;也可以是以电子的方式记录,例如电子文件。[5]价值密度:所谓价值密度,是指一个数据集预期可带来的经济收益,与其数据量的比值。这里的数据集,可以是51字节的一句商业判断,也可以是3M的数据分析报告,也可能是PB/EP级别的数据库。

我们不妨一起来检验一下这个定义:

图4:典型数据工作的职能归属“千举万变,其道一也。”——《荀子》

现在,我们弄清楚了数据岗的两个核心职能。那么这两个核心职能对于组织(企业)而言,有什么样的价值呢?

二、生产关系:数据职能对于组织而言贡献了什么价值?

两个核心职能,对应了组织的两个核心能力:

“产出数据资产”是一个量化业务的过程,对应着组织“业务数据化”的能力。“提升信息的价值密度”是一个驱动业务的过程,对应着组织“数据业务化”的能力。

简而言之,数据职能在组织中贡献的价值就是:量化业务与驱动业务。

图5:数据职能的价值

这么说稍微有点抽象,这里以问答社区(知乎)为例,简要说明一下“业务数据化”与“数据业务化”的含义。

大家可以稍微回忆一下:当我们在访问问答社区(刷知乎)时,都会产生哪些行为?

简单列举一下,例如:阅读、播放、点击、滑动、跳转、点赞(双击屏幕即刻体验)等等。这些用户的行为,都可以归属为知乎运营业务中的一部分。

而知乎记录这些“用户行为”的过程就是一种“业务的数据化”。但如果仅仅是用一个又一个的分区,记录这些行为日志,只是产生了数据,而没有产生价值。

当知乎加工、分析、利用这些数据进行产品设计,对用户进行信息推送时,就完成了一个“数据业务化”的过程。

图6:“业务数据化”与“数据业务化”案例示意在上述的例子中,相较于数据业务化,业务数据化好像是一个相较而言比较简单的能力,涉及的主要工作事项就是数据埋点和落库。但实际上“业务数据化”并不简单。仅仅是一个页面的PV的统计,就要考虑、是否弹窗、用户是否切换Tab、是否最小化窗口,等等实际操作场景;最终,可能要经过长时间的多次迭代,才能得到一个较好的埋点标准。

通过“业务数据化”和“数据业务化”,组织可以建立起一个正向的闭环数据流。在这个正循环的过程中,数据越用越多、越用越好。

图7:闭环数据流三、知识技能:各岗位有哪些数据类工作,需要哪些知识技能?

在明确了数据职能在组织中的价值之后,我们最后来回答关于个人职业发展的问题:数据分析如何入门?数据岗需要储备哪些知识与技能?如何成长?

我们常说,有些事是我们擅长的,有些事是我们热爱的,有些事是这个世界所需要的。而我们职业发展的目标就是找到这三者的交集。

图8:职业发展的目标

所以:

首先我们要弄清楚组织需要各个岗位做什么工作。在了解工作内容之后,我们就可以对自己是否感兴趣做一个初步的判断。当然很多时候,还需要通过尝试的方式,去探索自己的兴趣。然后,我们根据工作的内容来补充自己的知识与技能,逐步从入门到精通。1. 数据岗位的工作内容

前文提到, 公司的目标是通过“业务数据化”与“数据业务化”建立起一个正向的、闭环的数据流。

而数据岗的工作内容,抽象而言,就是支撑起整个数据流运转;具体而言可以分为:生产数据、处理数据和消费数据三大模块。

下图简单示意了,不同岗位在数据流中所处的位置:

图9:不同岗位在数据流中所处的位置PS:以上仅为示意,不同企业可根据实际状况进行调整。

因为很多同学,对数据分析师的工作非常感兴趣。这里以阿里集团为例,简单介绍一下中台数据分析师日常的工作内容。

在阿里巴巴,中台数据分析师的日常工作中,主要的交付物有6类:① 开拓新的数据源、② 产出表资产、③ 沉淀分析方法论、④ 搭建与维护指标体系、⑤ 建设与维护数据产品、⑥ 输出商业洞察

图10:数据分析师日常工作中的主要交付物开拓新的数据源:例如,信息爬取、竞对分析等。产出表资产:例如,在DWD(明细数据层[6])的基础上,建立DWM(数据中间层[7])和DWS(数据服务层[8])的数据表。沉淀分析方法论:例如,指标拆解、异常监控、因果推断等。搭建与维护指标体系:例如,指标设计、指标体系建设等。建设与维护数据产品:例如,指标管理系统、数据报表、数据看板、分析引擎等。输出商业洞察:如分析报告等。

这里再简单介绍下其他岗位的工作:

数仓工程师的主要工作包括生产与加工数据。

生产数据:比如埋点设计,将业务事实转化为数据落表等。加工数据:比如数据治理,通过ETL的流程,保证数据的质量。或是数据架构设计,使得数据的存储、加工、调用等有保障的同时,控制成本与风险等。

算法工程师的主要工作包括加工和消费数据。

加工数据:比如用户打标,通过算法对用户原始的数据信息进行加工,进而给用户打上标签,描述TA现在可能的状态,或是未来可能发生的行为。消费数据:比如算法推荐,基于用户的历史数据,给出推荐[9]。或是时序预测,对未来的业务状况进行预测,进而作为决策的依据。

用户研究岗的工作内容涉及到生产和消费数据。

生产数据:比如调研问卷、焦点访谈等。消费数据:比如消费者洞察报告、UI设计建议等。其他岗位,好好在此就不一一列举说明了,因为不同的公司,对相同岗位也会有不同的职能安排。以上介绍也仅为抛砖引玉,还望有不同看法的同学,不吝赐教。但方法是可以复用的。当你在开展工作时,可以分析一下,你所在的公司的数据流情况,以及不同的岗位,在整个数据流中承担的职责与贡献的价值。

希望以上的介绍,能让大家对数据岗的日常工作有一个简要的了解。

2. 数据岗所需的知识与技能

就工作内容而言,这中台数据分析师的工作既涉及到“业务数据化”(开拓数据源、表资产),也涉及“数据业务化”(指标体系、分析方法论、数据产品、商业洞察)。所以说,所需的知识与技能是比较广域的。

根据这6类工作内容,我们来逐一梳理一下数据分析岗所需的专业知识与技能:

通用的职业技能,如沟通方式与方法、时间管理、预期管理等,好好在此不多赘述。感兴趣的同学可以关注“知乎专栏:好好的通用职业技能包”后续的更新。

(1)开拓新的数据源

知识方面:学习搜索技能(链接为MOOC课程)、积累公开数据源的路径、掌握竞对分析的方法论。如有余力,可以学习一些用户研究相关的知识,如调研问卷设计、访谈设计等。技能方面:如有余力,掌握一些初步的爬虫技能;至少知道什么信息可以通过网页爬取的方式获得。

(2)产出表资产

知识方面:学习基础的数据库相关知识(链接为MOOC课程)。有志于更深入了解数据资产管理的同学,可以《数据中台》 与《大数据之路》为切入点。技能方面:掌握SQL。在有基础编程与数据库知识打底的情况下,可以直接通过牛客的SQL题库边练边学。搜索引擎是一位很好的老师,何况工作之后也大多数时候是面向Google编程。如果暂时还没有基础的编程知识,可以考虑通过北京理工大学,嵩天教授的《Python语言程序设计》入门。学习曲线非常适中。

(3)沉淀分析方法论

知识方面:需要有一些数学/统计学的基础知识(链接为MOOC课程),并且掌握一些通用的逻辑思维方法,如金字塔原理等。如有余力的,可以学习一些算法模型相关的知识,如回归、分类、聚类等。建议关注好好的知乎专栏:好好的分析工具箱。当然,还要对分析的问题,有深刻的认知。技能方面:掌握一些处理数据的工具,如Excel、Python等。

(4)搭建指标体系

可参考好好之前的两篇推文《指标设计方法》与《如何搭建一套指标体系?》。当然最重要的,依旧是理解业务。那么怎么理解“理解业务”这件事呢?好好也没有想到一个非常好的形式上的定义。这里好好给一个举例式的定义:如果你是一个保险从业者,最基本的要求是知道“一张保单是如何流转的”。如果你是一个电商从业者,最基本的要求是知道“消费者从登陆到交易完成的整个链路是怎么样的”。

(5)沉淀数据产品

知识方面:掌握一定的数据可视化相关的知识,在此推荐电子工业出版社出版的《数据可视化》。对于数据治理相关的知识,可以参照上文提到的《数据中台》 与《大数据之路》;如要更加深入的介入数仓建设,可参阅Kimball的《数据仓库工具箱》技能方面:掌握至少一样BI看板设计工具,如FBI、Power BI等。如有余力可以学习一些产品设计原理,如尼尔森十大可用性原则等。

(6)输出商业洞察

知识方面:可参照《如何写一份好好的数据分析报告?学会讲故事》。技能方面:掌握一些基本的PPT制作方法,即保证一定的美观性、又提升工作的效率,最重要的是保证信息传递的有效性与高效性。对于入门的同学,好好推荐“和秋叶一起学PPT”。四、小结一下~数据岗的核心职能:数据岗的核心职能有两个,第一,产出数据资产;第二, 提升信息的价值密度。数据职能的价值:通过数据量化与驱动业务,帮助组织实现“业务数据化”与“数据业务化”。进而,建立起一个正向的闭环数据流,使得数据越用越多,越用越好。数据分析岗的工作内容:① 开拓新的数据源、② 产出表资产、③ 沉淀分析方法论、④ 搭建与维护指标体系、⑤ 建设与维护数据产品、⑥ 输出商业洞察。如何积累所需的知识与技能:任务驱动、目标导向。

\color{mediumslateblue}{\texttt{如果你感觉有帮助的话,双击屏幕,赞同一下吧~ }}\\

\color{mediumslateblue}{\texttt{更多干货内容,请关注“好好的分析师”~ }}\\

参考^简称为“妈妈思考法”。^泛指公司企业、政府机构、学校等各类组织。^邢以群. 管理学 (第五版)[M]. 浙江大学出版社, 2019.^在此,好好抛砖引玉。如果无法通过这两个核心职能概况的工作,欢迎在留言区留言,大家一同探讨。^《数据资产管理白皮书 4.0》^Data Warehouse Details ^Data Warehouse Middle^Data Warehouse Service^举个例子,互联网新闻平台通过算法的方式,可以将过去传统媒体“投稿、审稿、编辑、发刊”这一系列可能耗时数周的信息分发过程,缩短到秒级完成。


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3