软件工程 3：模块化设计

您所在的位置：网站首页 › 模型设计理念怎么写简单一点 › 软件工程 3：模块化设计

软件工程 3：模块化设计

2024-05-26 12:31| 来源: 网络整理| 查看: 265

文章目录软件工程 3面向过程：模块化设计模块设计原则：高内聚、低耦合函数设计：不知道如何下手怎么办错误处理：每个函数都有错误处理模块的编译和链接面向对象：万事万物皆对象类：一组相似事物的统称对象：一个真实存在的类接口：一组相关的交互功能点定义的集合抽象类：基于类而抽象出来的，用于继承，不能被实例化为具体的对象封装：保护隐私、隔离关注点，减低复杂度继承：生物的遗传多态：指向父类的指针或引用，可以调用子类对象

软件工程 3

软件工程并不是一种科学，而且其重要性也与计算机本身并无关系。

软件工程革命是有关我们如何去思考的方式，以及我们如何去表达自己的思考的一个革命。

在第一课时，对比了【面向过程】、【面向对象】。

这一课，我们来说说他们的思想，具体的设计细节。

面向过程以【计算机】为核心，符合 CPU 顺序处理数据的流水线思路。

面向过程程序 = 算法 + 数据结构：

面向过程的程序是流水线的产品；算法是流水线；数据结构是原料；

面向对象以【人】为核心，不再注重机器，而侧重于人对现实世界的观察。

您可以往周围看看，看到的是什么？

可能是您的同事、桌子、墙、电脑、花盆；或者是电话、窗子、书本……这些都是【对象】，是吗~

除了观察目标聚焦于【对象】外，当我们观察人类世界各种事情的运作的时候，我们也不知不觉的聚焦于【对象】。

家庭：父亲、母亲、大哥、小哥等；公司：董事长、经理、主管、员工等；国家：…

人一般是按照面向对象的方式思考的，而且人类世界的运转方式通常也是按照面向对象的方式运作的。面向对象，是我们天然的视角。

面向对象程序 = 对象 + 交互：

对象：具体存在的事物；交互：事物之间的链接；

在工业系统中，面向过程的流水线工艺以【效率】著称，一环套一环非常高效，可灵活性却不好。

一条流水线从建成开始，接下来几年甚至十几年生产的都是同一产品。

但对于软件系统来说，一款软件可能因为增加新功能、需求的变更，每年都要扩展多次…如果用流水线工艺，由于每次需求的变更，流程里的每一步骤、一环套一环，哪怕只是更改了某一环，整个流水线都得重新调整一下。

一想到是这样的情况，头就大了。这就是一个无底洞呀，小型项目还好，要是大项目，每更改一次，软件出现 bug 的概率就大几分。

所以，所以，就有了【面向对象】来解决这个问题，其实就是比较灵活（术语叫“可扩展性”）。

面向对象，适合用于经常变化的地方。

对于软件开发来说，可变的通常集中于客户需要，不变的是计算机系统的基础。

操作系统、数据库、各种协议，它们相对稳定，用【面向过程】更贴切；企业应用、互联网、游戏，需求经常变更、功能不断扩展的，用【面向对象】才适合。

虽然可扩展性，只是其中之一。

但足够了，如同法师、射手主伤害，坦克主防御，辅助主增益一样，面向对象主敏捷。

了解面向对象的特点，是应用面向对象的关键。千万不要拿把锤子，看什么都是钉子。

面向过程、面向对象都有它们的局限性，也有在各自很优秀的指标。

面向过程：模块化设计

背景：鲁滨孙漂流记。

环境：无人小岛。

目标：做一碗杂酱面。

某天鲁滨孙心血来潮，想吃一碗杂酱面了。

于是，他花了2年时间做这碗杂酱面：

原来吃一碗杂酱面是这么幸福，回想我们想吃杂酱面，只需要在手机点几下就好啦。

为什么我们想吃一碗杂酱面，就这么容易呢？

因为平等，带来了合作，而整个社会的分工合作带来了群体演化速度加快。

面向过程之所以这么高效，就是因为【分而治之】的思想。

把一个项目，分成不同的模块，不同模块交给了不同的人；大家分工协作就能快速实现这碗杂酱面。

模块化编程的特点：

分工实现，适合多人协作；便于维护、管理、移植；

对于黑客来说，懂模块化编程，对以后分析系统、底层项目是很有意义的，也是大型项目开发的基石。

模块设计原则：高内聚、低耦合

有一个梦想，定居：【苏州】。

因为我是一个面痴，每天早上能吃一碗汤面，我就很开心啦。

苏州的汤面最考究的是面汤（汤也炒鸡好喝），汤要清而不油，味要鲜而食后口不干。

我最喜欢的做法：汤是汤，面是面，先煮好面，而后把面在配好的清汤里过一下，端上来的时候也不烫。

正如上图的面，汤是汤、面是面、大排是大排（配料），这也是模块的高内聚、低耦合。

高内聚：汤是汤、面是面、大排是大排（配料），相互独立；低耦合：面与汤之间关联很少，一眼就能清晰的看出面和汤来。

模块化编程的核心思想，即【分而治之】。

所以，模块之间一定要界限分明（内聚：模块各元素的关联程度），自己的功能自己实现，不麻烦其它模块。

那如何实现高内聚呢？

功能尽可能单一，一个函数只实现一个功能，函数的源代码行数一般不超过100行；一个模块实现一个功能，尽可能使用本模块的函数，不要麻烦其它模块；

耦合：模块间的数据传递、控制高系、调用高系的关联。

耦合度越高，耦合性越强，模块独立性就越菜。

耦合方式分为（实际更多）：

非直接耦合: 两个模块之间没直接联系数据耦合: 通过参数来交换数据标记耦合: 通过参数传递记录信息控制耦合: 通过标志、开关、名字等，控制另一个模块外部耦合: 所有模块访问同一个全局变量

耦合越低，维护就越方便。如果模块之间，我可以调用你，你也可以调用我…

整个程序的关系会较乱，修改、添加一个模块，牵一发动全身，所以你先得要理清这个关系，那是很头疼的。

避免高耦合，常用的设计方法：

少用全局变量，通过接口访问；禁止相互调用，只能单向调用，上下级关系；多用接口设计，接口是唯一的调用方式；如我们去餐厅，也只会和服务员（唯一接口）打交道，不会和厨房人员交流的。

高内聚导致低耦合，低耦合就意味着高内聚。

内聚:模块内各元素之间的关联交互

耦合:模块间的依赖关联、交互关系

函数设计：不知道如何下手怎么办

我们实现程序里的算法时，其实就是写一个或者若干个函数。

有时候，我也不知道该如何下手。

没关系，我可以分析一下问题：

应该传什么参数给函数（作为输入参数）函数处理完后，应该把什么数据作为结果返回（作为输出参数）

返回类型函数名(函数参数)

一步步走，对一道问题完全没想法时，多半是没有分析好，这时候反复要分析。

分析好以后，知道就知道该用什么知识对答，这时候考验的是编程能力了，分析考验的是算法能力，当写好了主函数模版，接下来就思考实现某个算法的原型是怎样的，反复练习让其成为一种习惯。

加油！

我觉得参数设计是在原型设计里最主要的，设计的好，程序简洁，递归可以避免因多层函数参数入栈而引起的爆栈。

如，二分查找的函数原型：

bool binary_search( ... );

返回是否找到，要么直接返回数的下标，要么就返回一个布尔值。

千万不要在这个子函数里面，输出：找到没找到；这样会提高模块化的耦合性，这样相当于告诉别人，我是新手中的新手。

设计参数：

#define T int bool binary_search ( T arr[], T key, int len ); // arr[]：被查找的数组 // key: 查找的值 // len: 被查找数组的长度

参数虽然正确，不过也并不好。

因为查找是不需要修改目标数据(被查找的数组)，没有保护数据，所以加上 const 关键字让数据不能被修改。

key和len，运行时，因为是传值，会创建(占空间)副本给形参，我们可以改成传引用减少不必要的空间。

但如何数据量巨大，采用引用会影响效率因为引用是间接寻址，传值是直接寻址所以速度比引用、指针快。

#define T int bool binary_search ( const T arr[], const T& key, const int& len ); // 算法不需要修改数据时，都应设计为不可修改类型，这样的设计原则其实非常敏捷 // 传引用避免形参拷贝

还可以简化接口，如把数组长度的参数去掉：

#define T int const int len = 10; bool binary_search ( const T (&arr)[len], const T& key ); // &是传引用，(&arr)[len]是传数组的引用，可以检查数组是否溢出，只接收 len 个元素的数组。 // 如果传进来的数组，这个数组的元素个数不等于len（10），编译就不过。从侧面避免数组溢出，但引用是C++支持的，C并不支持这种写法。

错误处理：每个函数都有错误处理

确定好了函数的原型之后，紧接着在完成这个函数的功能一开始的地方，就需要严格判断函数输入参数的合法性(防黑客)。

函数参数中的指针是否为NULL；

if( ptr == NULL || *ptr == '\0‘ )

函数参数中缓存的长度是否在合理范围；

if( len if( finshied ) goto err_1; // 一定是往 return 方向跳 if( finshied ) goto err_2; /* goto语句和 err的标签之间不能有定义变量的操作。如 int a = 9, 但声明可 int a */ return 1; err_1: do something; // 只能调到当前函数, err 一般在函数分界处 err_2: do something; }

还可以更美好，自制一个宏。

#define check(A, M, ...) if(!(A)) {\ log_err(M, ##__VA_ARGS__); errno=0; goto error; }

check宏的使用方式，和库函数assert()一样，都是断言（断言括号里的表达式为真，程序能正常运行）。

否则，【打印错误信息】并跳转到【错误标签】error处，清理。

#define T int bool binary_search ( const T arr[], const T& key, const int& len ) { check( len > 0, "参数len必须大于0"); // 断言，程序正常运行，那 len 就大于 0； // 如果断言失败，就打印错误信息（参数len必须大于0）； // 而后跳转到 error 标签，清理。 error: do something; return false; }

我有许多这样，用于错误处理的宏，十分方便。

我还为这些错误处理宏，加上了颜色，输出错误信息时很美观哒。

这套错误处理宏真的好玩，像苏州面一样，要是每天都能接触到，实在是太开心啦。

这套宏，也分享给远方的你。

错误处理模块：自动化错误处理、实现异常机制

#include #include /* 调用 errno */ #include /* 调用 strerror() */ #define clean_errno() (errno == 0 ? "None" : strerror(errno)) // 看懂这句代码，需要了解 errno、strerror() // errno 是一个数字，errno = 1 是操作不允许，errno = 2 是没有这样的文件或目录，在 errno.h 文件里一共定义了 124 个常见错误 [1, 124] // errno 本身只是一个数字，如果想知道这串数字的含义是什么，可以通过 strerror() 函数，比如 errno = 2，strerror(errno) 会返回【Error: No such file or directory】 #define log_err(M, ...) fprintf(stderr,\ "[ERROR] (%s:%d: errno: %s) " M "\n", __FILE__, __LINE__,\ clean_errno(), ##__VA_ARGS__) // log_err相当于一个调试器，当程序出现错误时，输出那个文件名(__FILE__)、错误的行数(__LINE__)、错误的原因(strerror(errno))，以及提示信息(这个是我们调用的时候写的) #define check(A, M, ...) if(!(A)) {\ log_err(M, ##__VA_ARGS__); errno=0; goto error; } // check(同assert)，断言check括号里的内容为真，否则打印错误信息并跳转到 error 处清理 #define check_mem(A) check((A), "内存不足。") // check_mem() 可以用于检测内存，如果 A == false，就输出【内存不足】，并进行一次跳转 int main( ) { FILE *fp = fopen("file.abc","r"); // 打开一个压根不存在的文件 if( fp == NULL ) // 因为文件不存在，所以打不开，指针为空 check(fp, "提示信息：fp == NULL呀～" ); // 使用我们的错误处理宏 check(), 语法类似 assert() int *a = (int *)malloc(19979797797984); // 申请一个编译器给不了的空间 if( a == NULL ) // 因为内存不够，所以没申请到，指针为空 check_mem(a); // 和 check() 一样，只不过不需要给提示信息了 error: // 错误处理标签, do something，如 if( fp != NULL ) free(fp), fp = NULL; if( a != NULL ) free(a), a = NULL; // 特别说明：在我们的程序里，某个函数往往申请了不止一个空间 // 如果有一个空间申请失败，我们就 return -1 的话，那前面申请的空间就还没释放 // 所以，释放空间最好使用 goto 统一处理 return -1; // 如果写 return 占位，那函数就结束了 // 特别补充：这种统一错误标签（只有一个error标签）其实不灵活。 // 因为错误处理也可以检测异常，如果某个地方有问题，那程序跳过这个地方即可，接着运行下面的代码，比如上面的代码，就因为打不开文件，所以程序越过申请空间这步，直接返回了。 // 使用多个错误处理标签就可以实现异常 /* 异常应该写成这样 * if( fp == NULL ) * goto err_1; * * err_1: * do something. * * // fp有问题，没关系，接着运行 * * if( a == NULL ) * goto err_2; * * err_2: * do something * * P.S. 如果代码出错了，可能是 goto err_i语句和 err_i 的标签之间有【定义变量】。如 int a = 9, 这是不可以的，但声明可 int a */ fclose(fp); fp = NULL; free(a); a = NULL; return 0; }

check 宏类似 assert，都是断言为真，只不过功能更加丰富，为出错处理而设计的。

goto 只能实现函数内部的跳转，不能实现跨函数跳转。

在一些错误处理中，在一个深度嵌套的函数调用中发生了错误，需要放弃当前任务，从多层函数调用中返回，并且在较高层级的函数中继续执行（或许是在 main() 函数中）。

要做到这一点，可以让每个函数都返回一个状态值，由函数的调用者检查并做相应处理，不过一层层的检查比较麻烦，setjmp 宏和 longjmp 函数可以实现【非本地局部跳转】，也就是跨函数跳转。

无论使用什么样的错误处理方式，都不要忘记发现程序中错误的最好方法其实是执行程序，对代码进行逐条跟踪，这样可以【观察数据在函数中的流动】，同时【检查出类似于上溢和下溢错误】、【数据转换错误】、【NULL 指针错误】、【错误的内存单元】、【用 = 代替 ==】、【运算优先级错误】、【逻辑运算】等错误。

模块的编译和链接 /* 当前源文件：demo.c */ #include int main(){ printf("hello, world!"); }

上面程序的作用是打印 hello, world，在编译器里我们只要点【运行】就能看到结果。

但不同文件里的模块到底是怎么链接在一起的？

我们为什么可以在当前源文件 main() 里，直接调用 printf()。

这就得从源代码生成可执行文件的内部机理聊起啦。

从源代码生成可执行文件可以分为四个步骤：

预处理（Preprocessing）：处理那些源文件和头文件中以#开头的命令，比如 #include、#define、#ifdef。

将所有的#define删除，并展开所有的宏定义。处理所有条件编译命令，比如 #if、#ifdef、#elif、#else、#endif 等。处理#include命令，将被包含文件的内容插入到该命令所在的位置，这与复制粘贴的效果一样。删除所有的注释 //、/* … */。添加行号和文件名标识，便于在调试和出错时给出具体的代码位置。保留所有的#pragma命令，因为编译器需要使用它们。

预处理的结果是生成【.i文件】。

【.i文件】也是包含C语言代码的源文件，只不过所有的宏已经被展开，所有包含的文件已经被插入到当前文件中。

当你无法判断宏定义是否正确，或者文件包含是否有效时，可以查看【.i文件】来确定问题。

在 GCC 中，可以通过下面的命令生成.i文件：

gcc -E demo.c -o demo.i // -E表示只进行预编译。

编译（Compilation）：将预处理完的文件进行词法分析、语法分析、语义分析以及优化后生成相应的【汇编代码文件】。

在 GCC 中，可以使用下面的命令生成.s文件：

gcc -S demo.i -o demo.s

汇编（Assembly）：将汇编代码转换成可以执行的机器指令。

汇编的结果是产生【目标文件】，在 GCC 下的后缀为.o。

链接（Linking）：目标文件已经是二进制文件，与可执行文件的组织形式类似，只是有些函数和全局变量的地址还未找到，程序不能执行。链接的作用就是找到这些目标地址，将所有的目标文件组织成一个可以执行的二进制文件。

面向对象：万事万物皆对象

我是从 C 语言入门的，感觉很 nice !!

而后开始接触数据结构，用面向过程的方式实现数据结构时，发现每种数据结构和它的自带算法天然是一个整体，用面向对象的方式描述是不是更适合呢？

我觉得是，所以我去学了一下 C++。

初次接触C++，我编程还没习惯从面向过程转为面向对象，感觉很别扭…

还有概念也太抽象了，只是用一些词来解释另一些词。

语言本身就有二义性，不类比、举例的话，很难理解到这一视角下的世界观。

类：一组相似事物的统称

分门别类，也是科学研究的基本方法和途径。

人类在认识客观世界的过程就是采用了分类的方法。

世界分为：

生物和非生物；生物分为动物植物微生物等等；或者是界门纲目科属种。

面向对象的类，与古语上的【物以类聚，人以群分】的类、分门别类的类是相同的。

因此，当我们在定义什么才是“类”的时候，其实完全不需要和面向对象扯上关系。

类是【一组】【相似】事物的【统称】。

一组：在于多个，因为单个事物无法此外类；相似：人类是一个类，但每个人都是不一样的、独一无二的；统称：能够概括多个事物，每个人都可以统称为“人”、“男人或者女人”，但名字不是一个统称。

对象：一个真实存在的类

在程序里，类只是一个模板（Template），编译后不占用内存空间，所以在定义类时不能对成员变量进行初始化，因为没有地方存储数据。

只有在创建对象以后才会给成员变量分配内存，这个时候就可以赋值了。

这是因为类是抽象出来的，不是真实存在的。

比如，我们说人、人类、男人、女人这些类时，它们只是一个抽象的概念，其实有没有这个人呢，是没有的。

但要说，牛顿、爱因斯坦，这些对象是真的存在的。

对象时有特点、有行为的，也就产生了数据，由此只有程序实例化对象时，编译器才会储存数据。

类是一个抽象的概念，而对象是真实存在的（类）。

接口：一组相关的交互功能点定义的集合

接口的定义比较难，名词分析：

接口：一组【相关】的【交互】功能点【定义】的【集合】；

以餐馆的列有各种菜肴的清单为例：

相关：接口中包含的功能点是相关的；

各种菜肴都是为了满足口腹之欲（相关），是吧。

交互：用于不同对象的交互；

客人点菜，其实是和大厨之间的交互；一个人是自嗨，不是交互。

定义：没有实现；

清单里的每道菜是都可以做出来的，但客人不点，大厨是不会做的。

集合：多个；

清单里可不止一个菜。

简单来说，接口就像一份列有各种菜肴的清单。

为什么要有接口呢？

有的时候呀，我们并不知道客人想吃什么，但我们又想客人照我们的要求来活动。

这就是接口的用处所在，当您不知道一个对象所属的具体“类”，只知道这些对象都具备某种功能。

接口：一组相关的交互功能点定义的集合。

抽象类：基于类而抽象出来的，用于继承，不能被实例化为具体的对象

从设计的角度来看，抽象类是更高层次的抽象。

如果说普通类是从现实对象抽象出来的，那么抽象类就是基于类而抽象出来的。

有了类，为什么还要抽象类？

为什么设计一种只能继承，不能实例化的类？

答案就在于：在某些场景下普通类不够用。

例如，“苹果”、“橘子”、“香蕉”都是一个类，它们都是“水果”，这里的“水果”就是一个【抽象类】。

您可以说喜欢吃“水果”，但您真正吃“水果”的时候，要么是“苹果”，要么是“橘子”，要么是“香蕉”……但您绝不可能真正吃到一个叫作“水果”的东西。

从实现的角度来看，抽象类与普通类不同的地方在于：

抽象类有的存在抽象方法（方法只有声明，没有定义），子类必须自己定义这些抽象方法，而不能像普通的方法一样，通过继承就可以获得父类的方法。

从这一点来看，抽象类和接口有点类似。

那抽象类和接口有什么区别？

为什么有了接口，还要有抽象类？

因为，

抽象类本质上还是类，强调一组事物的相似性，包括属性和方法的相似性；而接口只强调方法的相似性，并且仅仅体现在方法声明上的相似性，而没有方法定义上的相似性。

例如。假设我们设计一个游戏，其中使用“苹果”、“橘子”、“香蕉”来做“补血”, “苹果”、“橘子”、“香蕉”都有“颜色”和“重量”这样的属性，但每种水果的补血方式是不一样的。

在这种情况下，使用抽象类可以很好地表达，我们设计一个抽象类“水果”，将“颜色”、“重量”作为“水果”的属性，“获取颜色”、“获取重量”、“减少重量”等方法作为“水果”的方法，将“补血”作为“水果”的抽象方法。这样设计能够大大减少“苹果”、“橘子”、“香蕉”几个普通类的实现工作量，它们只需要实现“补血”方法，其他的属性和方法都只需继承“水果”类即可（代码复用）。

而如果采用接口的方式实现，则“苹果”、“橘子”、“香蕉”每个类都需要自己增加“颜色”、“重量”属性，增加“获取颜色”、“获取重量”、“减少重量”、“补血”等方法，工作量和代码量大大增加。

如上分析，抽象类是一个介于类和接口之间的概念，同时具备类和接口的部分特性。

抽象类：基于类而抽象出来的，用于继承，不能被实例化为具体的对象

封装：保护隐私、隔离关注点，减低复杂度

封装的好处举个例子就明白了。

我们的房子是类的实例（对象），室内的装饰与摆设只能被它的主人欣赏、使用，如果没有四面围墙的遮挡，室内所有人的活动就暴露无疑。

所以，房子这个对象必须加上封装（四面围墙），嘿嘿，不然晚上活动会影响别人的…

public: 不封装，公开的 protected: 对外不公开，但对家人(子类)公开 private：私有的，每个人都有自己的小秘密是不能告诉任何人的

需要保密的时候，用封装。

继承：生物的遗传

继承本身很好理解，和我们日常生活中的“继承”概念基本一样：子承父业！所以，我们可以看到在面向对象的编程语言里面，有了“父类”、“子类”的概念。

但是我个人认为“继承”这个说法并不确切，一般我们理解“继承”都是继承产业、继承财产。

但在面向对象的领域中，并不是“子类”继承了“父类”的产业，而是继承了“父类”的特点，具体来说，就是继承了“属性“和”方法“。

所以，我认为“继承”更加贴切的说法是类似生物学上的“遗传”，按照中国话的说法就是“龙生龙，凤生凤，老鼠生来会打洞”，面向对象的继承意味“子类”遗传了 “父类”的某些属性和方法。

但就像生物学上的进化论一样，有遗传就有变异，正因为有了变异，才会有新的物种产生；有了变异，面向对象才出现了子类。

学好继承记住三句话（如果子类继承于父类）：

子类拥有父类非 private 的属性、功能；子类具有自己的属性和功能，即子类可以扩展父类没有的属性和功能；子类还可以以自己的方式实现父类的功能（方法重写）；

继承的优点：

继承使得所有子类公共部分都放在了父类（代码复用），另外，继承可使得修改或者扩展继承而来的实现都较为容易。

继承的缺点：

父类变，子类不得不变；因为父类和子类有很大联系，也增加了耦合性。

对象之间有继承关系的时候，用继承。

多态：指向父类的指针或引用，可以调用子类对象如果您没有学过设计模式，我写了对于您的理解也是片面的；如果您学了设计模式，那就不用看我写的了。

所以，所以，我们跳过吧！！！

【本文地址】

软件工程 3：模块化设计

软件工程 3：模块化设计

今日新闻

推荐新闻