2021知到智慧树 大数据工具应用 章节测试答案

您所在的位置:网站首页 大数据可视化单元测试答案 2021知到智慧树 大数据工具应用 章节测试答案

2021知到智慧树 大数据工具应用 章节测试答案

#2021知到智慧树 大数据工具应用 章节测试答案| 来源: 网络整理| 查看: 265

2021知到智慧树 大数据工具应用 章节测试答案 2019-08-16网课答案知道答案41 - N + 第一章 单元测试

1、2011年麦肯锡研究院提出的大数据定义是:大数据是指其大小超出了常规数据库工具获取、储存、管理和(  )能力的数据集。A:访问

B:分析C:计算

D:应用正确答案:「分析」

2、用4V来概括大数据的特点的话,一般是指:Value、Velocity、Volume和(  )。A:ValleyB:VarietyC:VainlyD:Vagary正确答案:「Variety」

3、大数据分析四个方面的工作主要是:数据分类、(  )、关联规则挖掘和时间序列预测。A:数据统计

B:数据聚类

C:数据计算

D:数据清洗

正确答案:「数据聚类」

4、新浪和京东联合推出的大数据商品推荐,是由京东盲目推送到当前浏览新浪网站的用户的页面上的。正确答案:「错」

5、目前的大数据处理技术只能处理结构化数据。正确答案:「错」

第二章 单元测试

1、我们常用的微软Office套件中的Access数据库软件的数据库文件格式后缀名是(  )。A:dbf

B:mdf

C:mdb

D:xls

正确答案:「mdb」

2、大多数日志文件的后缀名是(  )。A:log

B:xml

C:txt

D:csv

正确答案:「log」

3、本课程重点介绍的weka软件的专有文件格式是(  )。A:ARFFB:MongoDB

C:key mapD:value正确答案:「ARFF」

4、数据清洗工作的目的主要是要解决数据的完整性、唯一性、合法性和(  )。A:排他性

B:专业性

C:共享性

D:一致性

正确答案:「一致性」

5、八爪鱼软件的“自定义采集”工作方式下,需要在软件里输入一个(  )来作为采集的目标。A:用户名

B:关键词

C:电话号码

D:网页地址

正确答案:「网页地址」

6、八爪鱼软件的采集规则可以通过文件的形式来导入或者导出,这种文件的后缀名是(  )。

A:jpg

B:otd

C:png

D:gif

正确答案:「otd」

7、Excel可以通过“数据有效性”按钮操作来规范数据输入的范围。正确答案:「对」

8、Excel不能导入txt或csv格式的文件。正确答案:「错」

9、八爪鱼软件只能对软件内建了“简易采集”规则的网站采集数据。

正确答案:「错」

10、八爪鱼软件进行自定义采集时,需要了解对网页的页面结构。正确答案:「对」

第三章 单元测试

1、使用DBSCAN算法对鸢尾花数据集(Iris.arff)进行聚类,将epsilon参数设置为0.2, minPoints参数设置为5,忽略class属性,那么将形成(  )个簇。 A: 4B: 3C: 2D: 1正确答案:「 3」

2、使用EM算法对天气数据集(weather.numeric.arff)进行聚类,将numClusters设置为4,即簇数为4,其他参数保持默认值,忽略class属性,从结果中可知,下列选项中,(  )是错误的。 A: 模型的最大似然估计值是-7.18B: 第四个簇的先验概率是0.14C: 这组数据用算法迭代15次D: 第四个簇的实例数为4

正确答案:「 第四个簇的实例数为4」

3、使用SimpleKMeans算法对天气数据集(weather.numeric.arff)进行聚类,保持默认参数,即3个簇以及欧氏距离。选择play属性为忽略属性,从结果中可知,下列选项中,(  )是错误。 A: 平方和误差为8.928B: 这组数据用算法迭代四次C: 产生了三个中心点D: 聚合为3个簇,分别有7,3,4个实例正确答案:「 这组数据用算法迭代四次」

4、使用线性回归(LinearRegression)分类器和用M5P分类器对cpu.arff分别进行分类,由其输出的误差指标可知(  )。A: LinearRegression的标准误差比M5P的标准误差小B: LinearRegression的相对误差比M5P的相对误差小C: LinearRegression的平均绝对误差比M5P的平均绝对误差小D: LinearRegression的平均方根误差比M5P的平均方根误差大

正确答案:「 LinearRegression的平均方根误差比M5P的平均方根误差大」

5、删去cpu.arff数据文件中的CACH属性后,使用M5P分类器构建方案,在结果中,到达LM2的实例数有(  )个。 A: 30B: 21C: 165D: 23正确答案:「 21」

6、根据J48分类器训练weather.nominal.arff所生产的决策树,当outlook=sunny;temperature=cool;humidity =high;windy=TRUE时,分类的结果是(  )。 A: 无法分类

B: YesC: NoD: 没有结果正确答案:「 No」

7、根据J48分类器训练iris.arff所生产的决策树,当sepallength=4.4;sepalwidth=3.0;petallength=1.3;petalwidth=0.2时,分类的结果是(  )。 A: Iris-virginicaB: Iris-setosaC: 无法分类D: Iris-versicolor正确答案:「 Iris-setosa」

8、关于Weka离散化说明正确的是(  )。 A: 等宽离散化是使实例分布均匀的B: 离散化包括无监督离散化和有监督离散化C: 离散化是将数值属性转换为字符串型属性D: 有监督离散化有两种等宽和等频方法正确答案:「 离散化包括无监督离散化和有监督离散化」

9、以下(  )不是Weka的数据类型。A: nominalB: stringC: decimalD: numeric正确答案:「 decimal」

10、关于Weka的文件类型描述错误的是(  )。 A: Weka可以打开文件格式有.arff、.csv、.xlsxB: Weka处理的数据集类似于关系数据库横行实例,竖行属性C: @relation 定义数据集名称,@data之后呈现实例,每一行就是一个实例D: arff是ASCII文件,可以用Word等文本编辑器打开查看正确答案:「 Weka可以打开文件格式有.arff、.csv、.xlsx」

11、以下属于关联分析的是(  )。A: 自动判断鸢尾花类别B: 股票趋势建模C: 购物篮分析D: CPU性能预测正确答案:「 购物篮分析」

12、大数据时代的到来,使我们无法人为地去发现数据中的奥妙,与此同时,我们更应该注重数据中的相关关系,而不是因果关系。其中,数据之间的相关关系可以通过以下(  )算法直接挖掘。 A: AprioriB: Bayes NetworkC: C4.5D: K-means正确答案:「 Apriori」

13、某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的(  )问题。 A: 分类B: 聚类C: 自然语言处理D: 关联规则发现正确答案:「 关联规则发现」

14、在进行自动选择属性时,必须设立两个对象,其中确定使用什么方法为每个属性子集分配一个评估值的对象是下面的(  )。A: 搜索方法B: 元分类器C: 规则挖掘D: 属性评估器正确答案:「 属性评估器」

15、以下属于属性空间的搜索方法的是(  )。A: SymmetricalUncertAttributeEvalB: GainRatioAttributeEvalC: PrincipalComponentsD: BestFirst正确答案:「 BestFirst」

16、在weka软件探索者界面中,利用Visualize标签页通过更改各个参数来进行数据集的可视化属性设置后,需要单击以下(  )按钮,所有更改才会生效。A: UpdateB: Select AttributeC: SubSampleD: Fast scrolling正确答案:「 Update」

17、给定关联规则AB,意味着:若A发生,B也会发生。正确答案:「错」

18、支持度是衡量关联规则重要性的一个指标。正确答案:「对」

19、Ranker方法既可以用于单个属性评估器,又可以用于属性子集评估器。正确答案:「错」

20、利用weka软件进行数据可视化时,用户可以选择类别属性对数据点着色,如果类别属性是标称型,则显示为彩色条。正确答案:「错」

第四章 单元测试

1、贝叶斯网络中的节点代表(  )。A:变量B:随机变量C:随机过程D:随机函数正确答案:「随机变量」

2、贝叶斯网络中,节点需给出概率分布描述,对于离散型随机变量而言,可以用(  )的形式表示。A: 均匀分布B:正态分布C:条件概率密度函数D:条件概率表正确答案:「条件概率表」

3、贝叶斯网络中节点之间的边代表(  )。A:概率因果B:随机关系C:组合关系D:随机结果正确答案:「随机关系」

4、贝叶斯网络保存的文件格式是(   )。A:XLSB:XML BIFC:DOCXD: TXT正确答案:「XML BIF」

5、下面(  )不是反向传播神经网络的结构。A:计算层B:隐含层C:输入层D:输出层正确答案:「计算层」

6、神经网络中的节点代表(  )。A:激励函数B:随机函数C:随机变量D:激励变量正确答案:「激励函数」

7、下列(  )不是常见的激励函数。A:Sigmoid函数B:线性函数C:阈值函数D:正弦函数正确答案:「正弦函数」

8、在贝叶斯网络编辑界面时,如果节点的名称没法完全显示,需要从(  )菜单项进行调整。A:Tools|LayoutB:View|Zoom OutC:View|Zoom InD:Tools|SetData正确答案:「Tools|Layout」

9、WEKA中选择神经网络分类器操作时,应该选择(  )。A:默认的分类器B:functions条目下的MultilayerPerceptron分类器C:rules条目下的PARTD:functions条目下的SGD分类器正确答案:「functions条目下的MultilayerPerceptron分类器」

10、下面关于Package Manager安装后的目录说明不正确的是(  )。A:sample-data子目录存放数据集文件B:lib子目录存放包所需要的说明文件C:src子目录存放源代码文件D:doc子目录存放API文档正确答案:「lib子目录存放包所需要的说明文件」

第五章 单元测试

1、Tableau是一款定位于数据可视化敏捷开发和实现()展现工具。Tableau 连续第 6 年在 Gartner 分析和商业智能魔力象限中蝉联领导者殊荣。A:商业行为B:商业统计C:商务计算D:商务智能正确答案:「商务智能」

2、以下()不是Tableau的数据类型?A:BooleanB:DateC:DecimalD:String正确答案:「Decimal」

3、Tableau可以用来实现交互的、()的分析和仪表板应用,从而帮助我们快速地认识和理解数据。A:离散性B:智能化C:可视化D:连续性正确答案:「可视化」

4、下列说法错误的是()。A:用户仅需要通过轻点鼠标和简单拖放就可以迅速创建出智能、精美、直观和具有强交互性的报表和仪表盘B:Tableau允许从多个数据源访问数据,包括带分隔符的文本文件、Excel文件、SQL数据库、Oracle数据库和多维数据库等C:Tableau通过内存数据引擎,可以直接查询外部数据库同时动态的从数据仓库抽取实时数据,极大的提高了数据访问和查询效率D:Tableau不提供应用编程接口正确答案:「Tableau不提供应用编程接口」

5、度量往往是()字段,度量是我们的指标。度量常常是连续的,连续的字段在图表中形成轴.将其拖放到功能区时,Tableau默认会进行()。A:数值,混合运算B:数值,聚合运算C:分类,聚合运算D:分类,混合运算正确答案:「数值,聚合运算」

6、关于数据分层描述错误的是()。A:数据分层的层级结构由数据维度的上下顺序决定B:数据分层可以实现向上钻取C:数据分层可以实现向下钻取D:数据分层的层次结构可以手工调整正确答案:「数据分层可以实现向上钻取」

7、以下不属于集的创建方式的是()。A:[顶部]创建B:[条件]创建C:[常规]创建D:[分组]创建正确答案:「[分组]创建」

8、Tableau右边数据目录栏中,不能单击右键创建参数的纬度是()。A:集B:参数C:度量D:纬度正确答案:「集」

9、以下不是创建计算字段时的运算逻辑的是()。A:表结构B:数字C:日期D:用户正确答案:「表结构」

10、仪表板版面大小设计选项,()不属于大小设计选项。A:固定大小B:自定义C:范围D:自动正确答案:「自定义」

第六章 单元测试

1、Logistic函数的定义域是()。A:(-INF, 1)B:(-INF, +INF)C:[0, 1]D:(0, +INF)正确答案:「(-INF, +INF)」

2、下列叙述错误的是()。A:逻辑回归主要用于回归分析B:逻辑回归预测事件发生的概率并分析导致事件发生的因素C:逻辑回归是一种监督机器学习算法D:逻辑回归采用Sigmoid函数对样本数据进行拟合,以构建回归模型正确答案:「逻辑回归主要用于回归分析」

3、使用IBk分类器和SMO分类器对vote.arff分别进行分类,由其输出的结果可知()。A:IBk对republican的分类正确率比SMO大B:IBk正确分类百分比比SMO大C:SMO对democrat和republican的分类正确率都比IBk大D:SMO对democrat的分类正确率比IBk小正确答案:「SMO对democrat和republican的分类正确率都比IBk大」

4、A:1或-1B:0或-1C:true或falseD:0或1正确答案:「1或-1」

5、以下描述错误的是()。A:SVM寻找具有最小边缘的超平面,因此经常被称为最小边缘分类器B:SVM对噪声不具备鲁棒性C:聚类分析可以看作是一种非监督的分类D:k-最近邻算法(K-NN)是一种消极学习器正确答案:「SVM寻找具有最小边缘的超平面,因此经常被称为最小边缘分类器」

6、线性支持向量机的最大化间隔正确的描述是()。A:

B:

C:

D:

正确答案:「

7、以下计算距离的公式中,计算欧氏距离的是()。A:

B:

C:

D:

正确答案:「

第七章 单元测试

1、以下数据和信息的说法,不正确的是()。A:凡是可以电子化记录下来的都是数据B:数据的形式是多样化的C:信息是客观世界各种事物特征的反映D:数据对用户来说是有价值的正确答案:「数据对用户来说是有价值的」

2、以下关于数据分析的方法,正确的是()。A:分析是一个过程,分析的对象是信息B:数据分析是信息到数据的转换过程C:所有的分析都是要从“过程”出发,没有结论的数字罗列并不是分析D:数据分析的目的就是解决我们现实中的某个问题正确答案:「数据分析的目的就是解决我们现实中的某个问题」

3、以下不属于数据分析的作用的是()。A:数据分析有助于增加营销开支B:数据分析有助于企业绩效分析与管理C:数据分析有助于优化运营前线D:数据分析有助于企业分析目标客户正确答案:「数据分析有助于增加营销开支」

4、以下不属于问题的有效性检验的是()。A:必要性检验B:复杂性检验C:可行性检验D:有用性检验正确答案:「必要性检验」

5、图a到图b的转变,属于数据分析思维中的哪一种思维()。图a图b照B:拆分C:降维D:增维正确答案:「对照」

6、当我们当前的维度不能很好地解释我们的问题时,我们就需要对数据做一个运算,增加多一个指标。这属于以下哪种思维方式()。照B:降维C:增维D:拆分正确答案:「增维」

7、对()的理解是数据分析的前提。A:结果B:数据C:信息D:业务正确答案:「业务」

8、以下不属于初级数据分析方法的是()。比分析法B:交叉分析法C:回归分析法D:平均分析法正确答案:「回归分析法」

9、对多种影响因素按其重要程度进行一定组合,先按第一组合选择出较大范围目标对象,再按第二组合对第一组合筛选出来的对象进一步缩小范围,以此类推,得出最终目标对象。该描述是以下哪种数据分析方法的思想()。比分析法B:回归分析法C:平均分析法D:层层筛选法正确答案:「层层筛选法」

10、一个好的统计图需满足的标准,不包括以下()。A:简洁B:清楚C:有效D:准确正确答案:「清楚」

本文来源:知道网课答案

本文地址:http://www.zhihuishuzhidao.com/zdda/3015.html

免责声明:本站内容均搜集整理自网络,如有侵权请联系我们删除!



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3