Apache Hive 中文手册

您所在的位置:网站首页 hive官网账号 Apache Hive 中文手册

Apache Hive 中文手册

2023-09-18 03:51| 来源: 网络整理| 查看: 265

Apache Hive™ 数据仓库软件有助于读取,写入和 Management 驻留在分布式存储中并使用 SQL 语法查询的大型数据集。

Hive 构建在 Apache Hadoop™ 之上,提供以下功能:

通过 SQL 轻松访问数据的工具,从而实现数据仓库任务,例如提取/转换/加载(ETL),报告和数据分析。

一种将结构强加于各种数据格式的机制

直接访问存储在 Apache HDFS ™ **** 或其他数据存储系统(例如 Apache HBase ™ **** )中的文件

通过Apache Tez ™ ,Apache Spark ™ 或MapReduce执行查询

HPL-SQL 的过程语言

通过Hive LLAP,Apache YARN和Apache Slider进行亚秒级查询检索。

Hive 提供标准的 SQL 功能,包括后来的SQL:2003,SQL:2011和SQL:2016的许多分析功能。Hive 的 SQL 也可以通过用户定义的函数(UDF),用户定义的集合(UDAF)和用户定义的表函数(UDTF)扩展为用户代码。

没有一种必须在其中存储数据的“配置单元格式”。 Hive 带有用于逗号和制表符分隔值(CSV/TSV)文本文件,Apache Parquet **** ™ **** ,Apache ORC **** ™ **** 和其他格式的内置连接器。用户可以使用其他格式的连接器扩展 Hive。有关详细信息,请参见Developer Guide中的File Formats和Hive SerDe。

Hive 不适用于联机事务处理(OLTP)工作负载。最好用于传统的数据仓库任务。

Hive 旨在最大化可扩展性(通过向 Hadoop 集群动态添加更多计算机来横向扩展),性能,可扩展性,容错以及与 Importing 格式的松散耦合。

Hive 的组件包括 HCatalog 和 WebHCat。

HCatalog 是 Hadoop 的表和存储 Management 层,它使使用不同数据处理工具(包括 Pig 和 MapReduce)的用户能够更轻松地在网格上读写数据。

WebHCat 提供一项服务,可用于运行 Hadoop MapReduce(或 YARN),Pig,Hive 作业。您还可以使用 HTTP(REST 风格)接口执行 Hive 元数据操作。

Hive Documentation

下面的链接提供对 Apache Hive Wiki 文档的访问。该列表不完整,但是您可以浏览这些 Wiki 页面以查找其他文档。有关更多信息,请参见官方Hive website。

有关 Hive 的一般信息

Getting Started

关于 Hive 的书

有关 Hive 的演示文稿和论文

由 Hive 支持的站点和应用程序

Related Projects

FAQ

Hive 用户邮件列表

Hive IRCChannels:irc.freenode.net 上的#hive

关于本维基

User Documentation

Hive Tutorial

Hive SQL 语言手册:Commands,CLIs,Data Types,DDL(create/drop/alter/truncate/show/describe),Statistics (analyze),Indexes,Archiving,DML(load/insert/update/delete/merge,import/export,explain plan),Queries (select),运算符和 UDF,Locks,Authorization

文件格式和压缩: RCFile, Avro, ORC, Parquet; Compression, LZO

程序语言:Hive HPL/SQL

配置单元配置属性

Hive Clients

Hive Client (JDBC, ODBC, Thrift)

HiveServer2:Overview,HiveServer2Client 端和直线,Hive Metrics

Hive Web 界面

Hive SerDes: Avro SerDe, Parquet SerDe, CSV SerDe, JSON SerDe

Hive Accumulo 集成

Hive HBase 集成

Druid Integration

Kudu Integration

Hive Transactions,流式数据提取和流变异 API

Hive Counters

Administrator Documentation

Installing Hive

Configuring Hive

设置元存储

蜂房架构工具

设置 Hive Web 界面

设置 Hive 服务器 (JDBC, ODBC, Thrift, HiveServer2)

Hive Replication

Hive on Amazon Web 服务

在 Amazon Elastic MapReduce 上配置

Hive on Spark:入门

HCatalog 和 WebHCat 文档

HCatalog

WebHCat (Templeton)

贡献者资源

如何贡献

Hive 贡献者会议

Hive 开发人员文档

Hive 开发人员指南 (code organization, 编译并运行 Hive, unit tests, debug, pluggable interfaces)

Hive 开发人员常见问题解答 (move files, build Hive, test Hive, MiniDriver 和 Beeline 测试)

插件开发套件

Writing UDTFs

Hive API 概述

Hive 测试文档

FAQ: Testing

开发人员指南:单元测试

单元测试 Hive SQL

单元测试并行执行

添加新测试的提示

Hive PTest2 基础架构

Hive PreCommit 补丁测试

MiniDriver Tests

Running Yetus

MetaStore API 测试

Hive Performance

Hive 架构概述

Hive 设计文档: Completed; In Progress; Proposed; 不完整,遗弃,其他

Route 图/致电以添加更多功能

全文搜索所有 Hive 资源

如何编辑网站

成为一个提交者

提交方式

如何释放

Project Bylaws

配置单元版本和分支

Hive 网站的Downloads页上提供了 Hive 的最新版本。对于每个版本,页面都提供发布日期和更改日志的链接。如果要使用早期版本(或开发分支)的更改日志,请使用配置发行说明页面。

Apache Hive JIRA跟踪对 Hive 代码,文档,基础结构等的更改。每个已解决的 JIRA 问题的版本号或分支显示在问题页面顶部“详细信息”部分的“修复版本”字段中。例如,HIVE-5107的修复版本为 0.13.0.

有时,版本号在发行前会更改。发生这种情况时,原始编号可能仍会在 JIRA,Wiki 和mailing list讨论中找到。例如:

Release NumberOriginal Number 1.0.00.14.1 1.1.00.15.0 2.3.02.2.0

有关 Hive 分支的更多信息,请参见如何贡献:了解配置单元分支。

Apache Hive,Apache Hadoop,Apache HBase,Apache HDFS,Apache,Apache Feather 徽标和 Apache Hive 项目徽标是 The Apache Software Foundation 的商标。


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3