数据分析师需要具备怎样的专业技能? |
您所在的位置:网站首页 › 作为数据分析师需要掌握哪些技能 › 数据分析师需要具备怎样的专业技能? |
国庆回家,一家人围着餐桌闲聊。谈及工作,我妈问我:“你每天都在公司做些什么呀?” 全文:5031字;预计阅读时间:12分钟。 “‘数据岗的职能是什么(做什么工作)?(对组织[2])贡献了什么样的价值?’是一件非常重要的母题”我说时来不及思索,但思索之后,还是这样说。 因为一旦思考清楚这个母题,对个人而言,就可以回答个人成长与职业规划的问题;对组织而言,就可以回答能力发展与组织建设的问题。为什么这么说? 因为工作的最小单元是一个个的任务。相似的任务聚合在一起,形成了职能;相关的职能组合起来形成了岗位。相关的岗位组合在一起,形成了部门;所有的部门组合在一起,构成了组织。 而对个人而言,待完成的任务,决定了所需的知识技能;所以弄清楚数据岗的职能,以及自己想要履行的职能,就可以明白自己要掌握哪些知识与技能。即,解决了个人成长的问题。从承担单一职能,到承担多个职能(职责扩大化),到职能丰富化[3],进而到承担主要的协作职能(管理职能),就是职业规划与职业发展的一种路径图。 而对组织而言,明确哪些是需履行而目前未履行好的数据职能,就能明确能力发展的方向;对职能的重组和对岗位的重组,使得整体的工作更加顺滑、高效,就是一定程度上的组织建设。 PS:这里以职能为主要的颗粒度,是因为:不同的组织由于实际状况的不同,对于相同名称的岗位,会设计不同的岗位职能。“数据分析岗”在目前阶段就是一个非常典型的例子,在有些组织,这个岗位会归属与独立的数据部门,而有些组织内它会归属于业务部门(产品/营销/研发/等等)。在有的组织内部,对产品、运营等等岗位有不低的数据能力要求;而在有些组织内,则并非如此。这些现象的本质是不同的岗位设计,不同的职能组合。这也是为什么,有的同学说,在他们公司,数据分析师从不跑SQL;有的同学说,数据分析师要懂数据产品设计;有的同学说,数据分析师要熟悉各类算法;等等。这些同学说的都对,都是实际情况;但这不意味着数据分析师什么都要会,什么都要懂,什么都要做。一、核心职能:数据岗位的核心职能是什么?谈到数据岗的工作有哪些,大家的脑海里肯定会浮现出特别多的词:ETL、取数、做报表、专题分析、指标体系。绩效管理,不一而足…… 但是究竟什么才是数据岗的核心职能?如何通过一句话总结性地告诉父母,我们在做什么工作呢? 好好认为,数据岗的核心职能有两个:① 产出数据资产;② 提升信息的价值密度。[4] 数据资产:所谓数据资产,是个人/企业所控制的,预期会带来未来经济利益的数据资源。这种资源可以是以物理形式存储,例如文档资料;也可以是以电子的方式记录,例如电子文件。[5]价值密度:所谓价值密度,是指一个数据集预期可带来的经济收益,与其数据量的比值。这里的数据集,可以是51字节的一句商业判断,也可以是3M的数据分析报告,也可能是PB/EP级别的数据库。我们不妨一起来检验一下这个定义: 现在,我们弄清楚了数据岗的两个核心职能。那么这两个核心职能对于组织(企业)而言,有什么样的价值呢? 二、生产关系:数据职能对于组织而言贡献了什么价值?两个核心职能,对应了组织的两个核心能力: “产出数据资产”是一个量化业务的过程,对应着组织“业务数据化”的能力。“提升信息的价值密度”是一个驱动业务的过程,对应着组织“数据业务化”的能力。简而言之,数据职能在组织中贡献的价值就是:量化业务与驱动业务。 这么说稍微有点抽象,这里以问答社区(知乎)为例,简要说明一下“业务数据化”与“数据业务化”的含义。 大家可以稍微回忆一下:当我们在访问问答社区(刷知乎)时,都会产生哪些行为? 简单列举一下,例如:阅读、播放、点击、滑动、跳转、点赞(双击屏幕即刻体验)等等。这些用户的行为,都可以归属为知乎运营业务中的一部分。 而知乎记录这些“用户行为”的过程就是一种“业务的数据化”。但如果仅仅是用一个又一个的分区,记录这些行为日志,只是产生了数据,而没有产生价值。 当知乎加工、分析、利用这些数据进行产品设计,对用户进行信息推送时,就完成了一个“数据业务化”的过程。 通过“业务数据化”和“数据业务化”,组织可以建立起一个正向的闭环数据流。在这个正循环的过程中,数据越用越多、越用越好。 在明确了数据职能在组织中的价值之后,我们最后来回答关于个人职业发展的问题:数据分析如何入门?数据岗需要储备哪些知识与技能?如何成长? 我们常说,有些事是我们擅长的,有些事是我们热爱的,有些事是这个世界所需要的。而我们职业发展的目标就是找到这三者的交集。 所以: 首先我们要弄清楚组织需要各个岗位做什么工作。在了解工作内容之后,我们就可以对自己是否感兴趣做一个初步的判断。当然很多时候,还需要通过尝试的方式,去探索自己的兴趣。然后,我们根据工作的内容来补充自己的知识与技能,逐步从入门到精通。1. 数据岗位的工作内容前文提到, 公司的目标是通过“业务数据化”与“数据业务化”建立起一个正向的、闭环的数据流。 而数据岗的工作内容,抽象而言,就是支撑起整个数据流运转;具体而言可以分为:生产数据、处理数据和消费数据三大模块。 下图简单示意了,不同岗位在数据流中所处的位置: 因为很多同学,对数据分析师的工作非常感兴趣。这里以阿里集团为例,简单介绍一下中台数据分析师日常的工作内容。 在阿里巴巴,中台数据分析师的日常工作中,主要的交付物有6类:① 开拓新的数据源、② 产出表资产、③ 沉淀分析方法论、④ 搭建与维护指标体系、⑤ 建设与维护数据产品、⑥ 输出商业洞察。 这里再简单介绍下其他岗位的工作: ○ 数仓工程师的主要工作包括生产与加工数据。 生产数据:比如埋点设计,将业务事实转化为数据落表等。加工数据:比如数据治理,通过ETL的流程,保证数据的质量。或是数据架构设计,使得数据的存储、加工、调用等有保障的同时,控制成本与风险等。○ 算法工程师的主要工作包括加工和消费数据。 加工数据:比如用户打标,通过算法对用户原始的数据信息进行加工,进而给用户打上标签,描述TA现在可能的状态,或是未来可能发生的行为。消费数据:比如算法推荐,基于用户的历史数据,给出推荐[9]。或是时序预测,对未来的业务状况进行预测,进而作为决策的依据。○ 用户研究岗的工作内容涉及到生产和消费数据。 生产数据:比如调研问卷、焦点访谈等。消费数据:比如消费者洞察报告、UI设计建议等。其他岗位,好好在此就不一一列举说明了,因为不同的公司,对相同岗位也会有不同的职能安排。以上介绍也仅为抛砖引玉,还望有不同看法的同学,不吝赐教。但方法是可以复用的。当你在开展工作时,可以分析一下,你所在的公司的数据流情况,以及不同的岗位,在整个数据流中承担的职责与贡献的价值。希望以上的介绍,能让大家对数据岗的日常工作有一个简要的了解。 2. 数据岗所需的知识与技能就工作内容而言,这中台数据分析师的工作既涉及到“业务数据化”(开拓数据源、表资产),也涉及“数据业务化”(指标体系、分析方法论、数据产品、商业洞察)。所以说,所需的知识与技能是比较广域的。 根据这6类工作内容,我们来逐一梳理一下数据分析岗所需的专业知识与技能: 通用的职业技能,如沟通方式与方法、时间管理、预期管理等,好好在此不多赘述。感兴趣的同学可以关注“知乎专栏:好好的通用职业技能包”后续的更新。(1)开拓新的数据源 知识方面:学习搜索技能(链接为MOOC课程)、积累公开数据源的路径、掌握竞对分析的方法论。如有余力,可以学习一些用户研究相关的知识,如调研问卷设计、访谈设计等。技能方面:如有余力,掌握一些初步的爬虫技能;至少知道什么信息可以通过网页爬取的方式获得。(2)产出表资产 知识方面:学习基础的数据库相关知识(链接为MOOC课程)。有志于更深入了解数据资产管理的同学,可以《数据中台》 与《大数据之路》为切入点。技能方面:掌握SQL。在有基础编程与数据库知识打底的情况下,可以直接通过牛客的SQL题库边练边学。搜索引擎是一位很好的老师,何况工作之后也大多数时候是面向Google编程。如果暂时还没有基础的编程知识,可以考虑通过北京理工大学,嵩天教授的《Python语言程序设计》入门。学习曲线非常适中。(3)沉淀分析方法论: 知识方面:需要有一些数学/统计学的基础知识(链接为MOOC课程),并且掌握一些通用的逻辑思维方法,如金字塔原理等。如有余力的,可以学习一些算法模型相关的知识,如回归、分类、聚类等。建议关注好好的知乎专栏:好好的分析工具箱。当然,还要对分析的问题,有深刻的认知。技能方面:掌握一些处理数据的工具,如Excel、Python等。(4)搭建指标体系: 可参考好好之前的两篇推文《指标设计方法》与《如何搭建一套指标体系?》。当然最重要的,依旧是理解业务。那么怎么理解“理解业务”这件事呢?好好也没有想到一个非常好的形式上的定义。这里好好给一个举例式的定义:如果你是一个保险从业者,最基本的要求是知道“一张保单是如何流转的”。如果你是一个电商从业者,最基本的要求是知道“消费者从登陆到交易完成的整个链路是怎么样的”。(5)沉淀数据产品: 知识方面:掌握一定的数据可视化相关的知识,在此推荐电子工业出版社出版的《数据可视化》。对于数据治理相关的知识,可以参照上文提到的《数据中台》 与《大数据之路》;如要更加深入的介入数仓建设,可参阅Kimball的《数据仓库工具箱》技能方面:掌握至少一样BI看板设计工具,如FBI、Power BI等。如有余力可以学习一些产品设计原理,如尼尔森十大可用性原则等。(6)输出商业洞察: 知识方面:可参照《如何写一份好好的数据分析报告?学会讲故事》。技能方面:掌握一些基本的PPT制作方法,即保证一定的美观性、又提升工作的效率,最重要的是保证信息传递的有效性与高效性。对于入门的同学,好好推荐“和秋叶一起学PPT”。四、小结一下~数据岗的核心职能:数据岗的核心职能有两个,第一,产出数据资产;第二, 提升信息的价值密度。数据职能的价值:通过数据量化与驱动业务,帮助组织实现“业务数据化”与“数据业务化”。进而,建立起一个正向的闭环数据流,使得数据越用越多,越用越好。数据分析岗的工作内容:① 开拓新的数据源、② 产出表资产、③ 沉淀分析方法论、④ 搭建与维护指标体系、⑤ 建设与维护数据产品、⑥ 输出商业洞察。如何积累所需的知识与技能:任务驱动、目标导向。
|
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |