|
|
@ -35,38 +35,44 @@ |
|
|
|
|
|
|
|
举个简单例子,淘宝前端(网页端、app端)每天的交易事务,都是用关系型数据库支持的。而每天的交易数据,会定时导入到后端的数据仓库(俗称ETL,Extract, Transform, Load),并根据特定业务逻辑重新整理,从而方便后端各个团队分析数据和做出业务决策。 |
|
|
|
|
|
|
|
<kbd> |
|
|
|
<img src="img/assignment5/ass5-etl.jpg"> |
|
|
|
</kbd> |
|
|
|
|
|
|
|
|
|
|
|
`UDW云数据仓库:` 是UCloud的DW产品,基于开源软件Greenplum(底层为PostgreSQL数据库)开发的大规模并发、完全托管的PB级数据仓库服务。支持MADlib、PostGIS等扩展工具,可以方便地支持机器学习、空间地理位置应用等数据分析任务。 |
|
|
|
|
|
|
|
好了,闲话少说,我们开始创建一个UDW玩玩。:ghost: :ghost: :ghost: |
|
|
|
闲话少说,我们开始创建一个UDW玩玩。:ghost: :ghost: :ghost: |
|
|
|
|
|
|
|
## 实验步骤 |
|
|
|
|
|
|
|
### 一)创建MySQL云数据库实例并登录 |
|
|
|
### 一)创建Greenplum数据仓库实例并登录 |
|
|
|
|
|
|
|
#### 1)在产品中选择云数据库UDB |
|
|
|
#### 1)在产品中选择云数据仓库UDW,然后点击新建数据仓库 |
|
|
|
<kbd> |
|
|
|
<img src="img/assignment4/udb.jpeg"> |
|
|
|
<img src="img/assignment5/ass5-udw.jpg"> |
|
|
|
</kbd> |
|
|
|
|
|
|
|
#### 2)让我们看看在UCloud上可以创建哪些数据库 :blush: |
|
|
|
#### 2)使用默认配置,2个节点。将子网改成"DefaultNetwork",记住DB名称,端口,管理员用户名,设置管理员密码。选择按时付费,立即购买。 |
|
|
|
<kbd> |
|
|
|
<img src="img/assignment4/udbs.jpeg"> |
|
|
|
<img src="img/assignment5/ass5-dft.jpg"> |
|
|
|
</kbd> |
|
|
|
|
|
|
|
> `MySQL:` 原本是一个开源关系型数据库管理系统,原开发者为瑞典的MySQL AB公司,该公司于2008年被Sun收购,后Sun公司于2009年被Oracle收购,MySQL成为Oracle旗下产品。与此同时,MySQL原作者Michael Widenius fork了开源MySQL项目,创建了MariaDB,继续保持在GNU GPL下开源。 |
|
|
|
|
|
|
|
> `MongoDB:` 面向文档的非关系型(NoSQL)数据库管理系统,使用类JSON的文档存储数据。 MongoDB由MongoDB Inc.开发。 |
|
|
|
|
|
|
|
> `PostgreSQL:` 或称Postgres,开源数据库管理系统,强调extensibility,可以同时用作关系型数据库,时序数据数据库和数据仓库的解决方案。 |
|
|
|
|
|
|
|
> `SQL Server:` 微软开发的关系型数据库管理系统,最早由微软和Sybase合作开发,从SQL Server 6.0版开始,由微软独立开发。 |
|
|
|
<kbd> |
|
|
|
<img src="img/assignment5/ass5-cfg.jpg"> |
|
|
|
</kbd> |
|
|
|
|
|
|
|
<kbd> |
|
|
|
<img src="img/assignment5/ass5-pay.jpg"> |
|
|
|
</kbd> |
|
|
|
|
|
|
|
#### 3)以上知识看看就好,没啥用处 :stuck_out_tongue_winking_eye: 还是让我们创建一个MySQL数据库玩玩吧 :smirk: |
|
|
|
#### 3)支付之后,数仓创建时间从几分钟到十几分钟不等,等状态显示“运行中”,则创建完毕。记住数仓的IP地址。 |
|
|
|
<kbd> |
|
|
|
<img src="img/assignment4/mysql.jpeg"> |
|
|
|
<img src="img/assignment5/ass5-created.jpg"> |
|
|
|
</kbd> |
|
|
|
|
|
|
|
#### 4)登录数据仓库。Greenplum数据仓库的登录有很多方式,比如用PostgreSQL客户端登录,用Greenplum客户端登录,用JDBC(在Java中使用)或者ODBC(在C/C++中使用)访问,用psycopg2(在Python中使用)访问。本实验我们完成PostgreSQL客户端和psycopg2两种方式。其余方式同学们以后可以自行尝试。 |
|
|
|
|
|
|
|
<kbd> |
|
|
|
<img src="img/assignment4/mysqlconf.png"> |
|
|
|
</kbd> |
|
|
@ -75,7 +81,7 @@ |
|
|
|
<img src="img/assignment4/mysqlins.jpeg"> |
|
|
|
</kbd> |
|
|
|
|
|
|
|
#### 4)登录数据库 |
|
|
|
|
|
|
|
|
|
|
|
##### 方法一:通过phpMyAdmin网页登录 |
|
|
|
<kbd> |
|
|
|