什么是数据?什么是信息?

您所在的位置:网站首页 数据堂是什么 什么是数据?什么是信息?

什么是数据?什么是信息?

2024-07-06 08:50| 来源: 网络整理| 查看: 265

②定性的,如表示事物属性的数据(居民地、河流、道路等);

③定量的,反映事物数量特征的数据,如长度、面积、体积等几何量或重量、速度等物理量;

④定时的,反映事物时间特性的数据,如年、月、日、时、分、秒等。

按表现形式分为

①,如各种统计或量测数据。数字数据在某个区间内是离散的值;

②,由连续函数组成,是指在某个区间连续变化的物理量,又可以分为图形数据(如点、线、面)、符号数据、文字数据和图像数据等,如声音的大小和温度的变化等。

按记录方式分为

地图、表格、影像、磁带、纸带。按数字化方式分为矢量数据、格网数据等。在地理信息系统中,数据的选择、类型、数量、采集方法、详细程度、可信度等,取决于系统应用目标、功能、结构和、管理与分析的要求。

数据库

数据库的定义

数据库是依照某种组织起来并存放二级中的数据集合。这种数据集合具有如下特点:尽可能不重复,以最优方式为某个特定组织的多种应用服务,其独立于使用它的,对数据的增、删、改和检索由统一进行管理和控制。从发展的历史看,数据库是的高级阶段,它是由发展起来的。

数据库的层次

数据库的基本结构分三个层次,反映了观察数据库的三种不同。

(1)物理数据层。它是数据库的最内层,是物理存贮设备上实际存储的数据的集合。这些数据是原始数据,是用户加工的对象,由内部描述的指令操作处理的位串、字符和字组成。

(2)概念数据层。它是数据库的中间一层,是数据库的整体逻辑表示。指出了每个数据的逻辑定义及数据间的逻辑联系,是存贮记录的集合。它所涉及的是数据库所有对象的逻辑关系,而不是它们的物理情况,是概念下的数据库。

(3)逻辑数据层。它是用户所看到和使用的,表示了一个或一些特定用户使用的数据集合,即逻辑记录的集合。

数据库的特点

数据库不同层次之间的联系是通过映射进行转换的。数据库具有以下主要特点:

(1)实现。数据共享包含所有用户可同时存取数据库中的数据,也包括用户可以用各种方式通过接口使用数据库,并提供数据共享。

(2)减少数据的。同文件系统相比,由于数据库实现了数据共享,从而避免了用户各自建立应用文件。减少了大量重复数据,减少了,维护了数据的一致性。

(3)数据的独立性。数据的独立性包括数据库中数据库的和应用程序相互独立,也包括数据的变化不影响数据的逻辑结构。

(4)数据实现集中控制。中,数据处于一种分散的状态,不同的用户或同一用户在不同处理中其文件之间毫无关系。利用数据库可对数据进行集中控制和管理,并通过数据模型表示各种数据的组织以及数据间的联系。

(5)数据一致性和可维护性,以确保数据的和。主要包括:①安全性控制:以防止数据丢失、错误更新和越权使用;②完整性控制:保证数据的正确性、有效性和相容性;③并发控制:使在同一时间内,允许对数据实现多路存取,又能防止用户之间的不正常交互作用;④的发现和恢复:由提供一套方法,可及时发现故障和修复故障,从而防止数据被破坏。

数据仓库

数据仓库的定义

著名的数据仓库专家W.H.Inmon在其著作《building the data warehouse》一书中给予如下描述:数据仓库(data warehouse)是一个面向主题的(subject oriented)、集成的(integrate)、相对稳定的(non-volatile)、反映历史变化(time variant)的数据集合,用于支持。对于数据仓库的概念我们可以从两个层次予以理解,首先,数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型;其次,数据仓库是对多个异构的有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。

数据仓库的特点

根据数据仓库概念的含义,数据仓库拥有以下四个特点:

1、面向主题。操作型数据库的面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织。主题是一个抽象的概念,是指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作型信息系统相关。

2、集成的。面向事务处理的操作型数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。

3、相对稳定的。操作型数据库中的数据通常实时更新,数据根据需要及时发生变化。数据仓库的数据主要供企业决策分析之用,所涉及的主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。

4、反映历史变化。操作型数据库主要关心当前某一个时间段内的数据,而数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出和预测。

数据仓库的建设

企业数据仓库的建设,是以现有企业业务系统和大量业务数据的积累为基础。数据仓库不是静态的概念,只有把信息及时交给需要这些信息的使用者,供他们做出改善其业务经营的决策,信息才能发挥作用,信息才有意义。而把信息加以整理归纳和重组,并及时提供给相应的管理决策人员,是数据仓库的根本任务。因此,从产业界的角度看,数据仓库建设是一个工程,是一个过程。

Data

【From Wikipedia, the free encyclopedia】

For data in computer science, see . For other uses, see .

Data(, , or )is a of of or ; restated, pieces of data are individual pieces of . Data is , , and , whereupon it can be using graphs or images. Data as a general refers to the fact that some existing or is or in some form suitable for better usage or .

, i.e. unprocessed data, is a collection of , ; data processing commonly occurs by stages, and the "processed data" from one stage may be considered the "raw data" of the next. is raw data that is collected in an uncontrolled environment. is data that is generated within the context of a scientific investigation by observation and recording.

is the plural of "datum", and still may be used as a plural noun in this sense. Nowadays, though, "data" is most commonly used in the singular, as a (like "information", "sand" or "rain").

信息

“”一词在英文、法文、德文、中均是“information”,中为“情报”,我国台湾称之为“”,我国古代用的是“消息”。作为科学术语最早出现在哈特莱(R.V.Hartley)于1928年撰写的《》一文中。20世纪40年代,信息的奠基人香农(C.E.Shannon)给出了信息的明确,此后许多研究者从各自的研究出发,给出了不同的定义。具有代表意义的表述如下:

信息奠基人香农(Shannon)认为“信息是用来随机的东西”,这一定义被人们看作是经典性定义并加以引用。

控制论创始人(Norbert Wiener)认为“信息是人们在适应外部世界,并使这种适应反作用于外部世界的过程中,同外部世界进行互相交换的内容和名称”,它也被作为性定义加以引用。

学家认为“信息是提供决策的有效”。

科学术语

美国著名物理化学家(Josiah Willard Gibbs)创立了向量分析并将其引入数学物理中,使事件的不确定性和偶然性研究找到了一个全新的角度,从而使人类在科学把握信息的意义上迈出了第一步。他认为“熵”是一个关于物理系统信息不足的量度。

电子学家、科学家认为“信息是电子线路中传输的”。

我国著名的信息学专家教授认为“信息是存在方式或运动状态,以这种方式或状态直接或间接的表述”。

信息管理专家(F.W.Horton)给信息下的定义是:“信息是为了满足用户决策的需要而经过加工处理的数据。”简单地说,信息是经过加工的数据,或者说,信息是数据处理的。

根据对信息的研究成果。的信息概念可以如下:

信息是对客观世界中各种事物的运动状态和变化的反映,是客观事物之间相互联系和相互作用的表征,表现的是客观事物运动状态和的实质。

传递

远古

口耳相传或借助器物

信息传递速度慢、不精确古代

靠驿差

信息传递速度慢、信息形式单一。

口耳相传或借助器物

信息传递速度慢、不精确古代

靠驿差

信息传递速度慢、信息形式单一。

近代

依靠交通工具的邮政系统

信息传递速度相对快一些、距离远相对就慢、且费用高。

依靠交通工具的邮政系统

信息传递速度相对快一些、距离远相对就慢、且费用高。

现代

电报、电话

速度快、信息单一文字。

电报、电话

速度快、信息单一文字。

当代

计算机网络

传递的信息量大、信息多样化,传递速度极快、不受地域阻碍。

计算机网络

传递的信息量大、信息多样化,传递速度极快、不受地域阻碍。

功能

反应事物内部属性、状态、结构、相互联系以及与外部环境的互动关系,减少事物的不确定性。

信息特点

别担心,信息虽然是不确定的,但还是有办法将它们进行量化的。人们根据信息的概念,可以归纳出信息是有以下的几个特点的:

1. 消息x发生的概率P(x)越大,信息量越小;反之,发生的概率越小,信息量就越大。可见,信息量(我们用I来表示)和消息发生的概率是相反的关系。

2. 当概率为1时,百分百发生的事,地球人都知道,所以信息量为0。

3. 当一个消息是由多个独立的小消息组成时,那么这个消息所含信息量应等于各小消息所含信息量的和。

根据这几个特点,如果用数学上对数函数来表示,就正好可以表示信息量和消息发生的概率之间的关系式:I=-loga(P(x))。这样,信息不就可以被量化了吗?既然信息可以被量化,那么总得给它一个单位吧?人的体重是以公斤来计量的,人的身高是以米来计量的,那么信息量该以什么单位来计量呢?通常是以比特(bit)为单位来计量信息量的,这样比较方便,因为一个二进制波形的信息量恰好等于1bit。

信息与比特

有同学又有问题了:这么说我家2Mbit/s的上网速度,就是说每秒可传2Mbit的信息量啦?

这里的比特严格来说不是指信息量,而是指信号。本来是不可以说是几比特的信号的,但由于一个二进制波形(码元)的信息量正好等于1比特,所以在工程应用中,往往就把一个二进制码元称作1比特,信息量单位变成信号单位了。这虽然不严谨,但也不矛盾。我们注意在概念上区分就行了。

有同学还有疑问:假设有一个消息“狼来了”,通过信源编码转成了一个100bit的数据包,那么信息量就有100bit。然后把这100bit通过通信网络发送给了很多人,很多人都收到了100bit的信息量。可是有些人觉得“狼来了”这个消息很重要,信息量很大;但有些人又觉得无所谓,信息量很少。可是我们知道,这条消息的信息量都是100bit的呀,怎么又不一样了呢?

首先,我们刚刚说过,比特是信息量的单位,但工程上也习惯把它作为信号的单位。这里所说的100bit就是指信号的啦。其次,通信中的基本问题,就是在一点再生另一点的信息,指的是点对点的情况。但即使在点对多点的情况下,由于在实际的通信系统中,消息往往是指发送的某些符号。这些符号到底能携带多少信息量,与这些符号发生的概率有关,而对于任何接收端来说,这些符号发生的概率是一定的,不会说对这个接收机是这个概率,对那个接收机是那个概率。比如有一串符号221234,这串符号由1,2,3,4四个符号组成,假设四个符号出现的概率都是1/4,那么在这串符号中,2出现了3次,所以2所携带的信息量是-3×log2(1/4)=6bit。我们需要明白,通信系统中传送的符号,就相当于我们现在谈论的消息?

词语概念

基本解释

[Information]∶有目的地标记在通讯系统或计算机的输入上面的…(如号码的一个数字)

[Message]∶音信消息 有关句子:听说智化求见,必是丈夫有了信息,连忙请进。——《三侠五义》[2]

引证解释

1. 消息。

南唐《暮春怀故人》诗:“梦断美人沉信息,目穿长路倚楼台。” 宋《梅花》诗:“欲传春信息,不怕雪埋藏。”《》第四四回:“ 宋江大喜,说道:“只有去得快,旬日便知信息。”《家》三一:“二表哥的事情怎样了?为什么连信息也不给我一个?”

2. 现代科学指发出的、指令、、符号等所包含的内容。人通过获得、识别自然界和社会的不同信息来不同的事物,得以认识和改造。在一切通讯和中,信息是一种普遍联系的形式。

《社会语言学》4.1:“按的观念,信息只不过是被一定方式起来的序列。在社会交际活动中,这个定义还不够:信息还必须有一定的意义,或者说信息必须是‘意义的。”《画报》1983年第1期:“整个地铁的运行靠一台中心电子控制,它赖以控制的,来自装在车站以及之间线路上的高度仪器。”

Information

【From Wikipedia, the free encyclopedia】

Information(shortened as info) is that which informs. In other words, it is the answer to a of some kind. It is also that from which and can be derived, as data represents values attributed to parameters, and knowledge signifies understanding of real things or abstract concepts.As it regards data, the information's existence is not necessarily coupled to an observer (it exists beyond an event horizon, for example), while in the case of knowledge, the information requires a cognitive observer.

At its most fundamental, information is any propagation of cause and effect within a system. Information is either as the content of a or through direct or indirect of some . That which is can be construed as a message in its own right, and in that sense, information is always conveyed as the content of a .

Information can be into various forms for and (for example, information may be encoded into a of , or transmitted via a of ). It can also be for safe storage and communication.

Information resolves . The uncertainty of an event is measured by its probability of occurrence and is inversely proportional to that. The more uncertain an event, the more information is required to resolve uncertainty of that event. The is a typical , but other units such as the may be used. Example: information in one "fair" coin flip: log2(2/1) = 1 bit, and in two fair coin flips is log2(4/1) = 2 bits.

The concept that information is the messagehas different meanings in different contexts.Thus the concept of information becomes closely related to notions of , , , , , , , ,, , , , , and .返回搜狐,查看更多



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3