当excel不够用时,如何利用Access进行数据分析?

您所在的位置:网站首页 mysql如何做大数据分析表 当excel不够用时,如何利用Access进行数据分析?

当excel不够用时,如何利用Access进行数据分析?

2023-11-20 05:55| 来源: 网络整理| 查看: 265

数据量太大,Excel拖不动怎么办?还有其他能取代Excel但易上手的工具么?

这个问题真是撞到枪口上了,我有收到不少的类似提问,今天就来统一解答一下。

大数据量做报表或数据分析的方案

百兆以上,几十万行excel的数据量:数据库ACCESS+SQL

数据若不是达到亿万级别,直接用BI工具分析

再大,就不是尔等表哥表姐,数据分析师能解决的了。

鉴于大家都有一般日常都用Excel,本文将要主要讲第一类方案,出一篇完整教程,通用且实用,用到的工具是ACCESS数据库。

关于ACCESS,它Excel的同宗兄弟,同属微软Office一门,上手不难,一周搞定基本操作。

它可以解决做数据运营的小伙伴们的如下抱怨:

业务上要处理的Excel数据表格存储量越来越大,超过50MB就慢如蜗牛,这时表格里要是再多个IF、VLOOKUP函数什么的,电脑就直接罢工了;要是遇到向下面这样大小的Excel表格,服务器级别的电脑都吃不消,更别谈进行数据处理和数据分析了。

当excel不够用时,如何利用Access进行数据分析?

数据量超大的excel表格连打开都难

遇到上图这么大存储量的Excel数据表格,卡是必然的,死不死机就看人品了。那遇到这样的难题,有没有能处理大存储量文件,同时又操作简单、容易上手的数据分析软件呢?

答案是当然是:YES,而且还是Excel的同宗兄弟,同属微软Office派系的ACCESS。

以下内容将以运营中常见的一个分析项目为案例,力求让做数据分析的小伙伴们对ACCESS有一个基本的了解,从而找到分析大批量数据的思路和方法。

下图是本文使用ACCESS对原始表格进行数据分析的4大目标。

当excel不够用时,如何利用Access进行数据分析?

这里先就ACCESS的基本情况说两句,然后用一个实际案例进行数据分析的实操。

一、ACCESS数据库简介

1.ACCESS和SQL语句的基本概念

Access,全称“Microsoft Office Access”,是微软OFFICE中的一个成员, 由微软发布的关系数据库管理系统。它结合了 Microsoft Jet Database Engine 和图形用户界面两项特点,是 Microsoft Office 的系统程序之一。(来自百度百科)

提到ACCESS,就不得不提SQL,只有掌握了SQL,才能将ACCESS的功能发挥到极致。SQL的全称是“结构化查询语言”(Structured Query Language),是一种声明式语言。

首先要把这个概念记在脑中:“声明”。跟大家以往所知的编程语言相比, SQL 语言是为计算机声明了一个你想从原始数据中获得什么样的结果的一个范例,而不是告诉计算机如何能够得到结果。换言之,SQL的真正核心在于对表的引用。

SELECT first_name, last_name FROM employees WHERE age> =25

上面的例子很容易理解,我们不用关心这些雇员记录从哪里来,我们所需要的只是那些年龄大于等于25岁的雇员的数据(age> =25)。

2.ACCESS的优势

ACCESS最明显的好处在于,它可以在不用掌握很高深编程语言的条件下,处理Excel所不能承载的大存储量的数据原始文件,速度奇快,且易学易用。

当excel不够用时,如何利用Access进行数据分析?

3. ACCESS的常用语句

下表是ACCESS使用过程中常用的一些SQL语句,理解起来不算困难。

当excel不够用时,如何利用Access进行数据分析? ACCESS数据库常用的SQL语句标题

要想学好数据分析工具,最重要的是用实际案例来调动各种零碎的工具使用知识点,在历经完整的案例分析后,短时间内就可以掌握这些工具的操作方法。

简单介绍完了ACCESS和SQL语句后,接下来开始ACCESS数据分析实操吧!

二、ACCESS数据分析实操

1.数据导入

下表是本文进行ACCESS数据分析的原始文件,数据量近230MB,Excel打开需等待好几分钟,而且得看电脑心情…出于商业保密的目的,本文将使用其中的部分数据进行分析实操,且做一定处理。

标后台导出的原始数据题

先将Excel中的文件导入ACCESS中,按下图箭头路径所示:

当excel不够用时,如何利用Access进行数据分析? 导入excel原始数据文件标题

按上述步骤操作后,自动生成主键(即ID),得到如下结果:

当excel不够用时,如何利用Access进行数据分析? Excel原始数据文件导入到ACCESS中标题

2.用户下单时间段分析

进行下单时间段的分析,需要将用户下单的时间转化为小时“时点”,这里使用的SQL语句是format,功能是对所选字段进行格式设定,语法为:

format(引用字段,"数据格式")

其中,“数据格式”在时间上一般选用H(小时)、D(天)、M(月)或Y(年)。

然后,再使用count函数,将UserID进行计数,得到的结果即是订单量。

注意,使用format和count之后,需要使用“AS”将其定义为新的字段,这里二者分别定义为“时段”和“订单量”。

当excel不够用时,如何利用Access进行数据分析? 下单时间段分析操作步骤

在“创建”里新建一个“查询设计”,点开右下角的“SQL”,然后在SQL会话框输入如下语句:

SELECT format(下单时间,"h") AS 时段, count(UserID) AS 订单量

FROM 元数据

GROUP BY format(下单时间,"h");

然后,点击“设计”下的“运行”,得到如下结果:

当excel不够用时,如何利用Access进行数据分析? 各个时段的订单量分布情况

举个例子来说明上面的结果该如何解读,假如某位顾客是12:23下单,则该时间点归到“12”这个时段里了,而“12”代表的是12~13时这个时间段。可以根据“运营实操|如何利用微信后台数据优化微信运营”这篇文章里的方法利用函数将其变为时段显示。

3.付款区间订单量分布情况分析

计算付款区间需要用到一个比较牛X的函数--- Switch,它是按顺序计算一系列的表达式,如果某一表达式成立,则返回其随后的值。

语法:

SWITCH(条件1,结果1,条件2,结果2,条件3,结果3,…,条件N,结果N)

条件1、条件2、条件3:表示要计算的表达式,条件1成立的话,返回值结果1,条件2成立的话,返回值结果2,依次类推。

按照上述的方法,在“创建”里新建一个“查询设计”,点开右下角的“SQL”后,输入如下语句:

SELECT userID, 付款额, switch(付款额



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3