AnalyticDB for PostgreSQL

Dịch vụ kho dữ liệu MPP trực tuyến dựa trên chương trình nguồn mở Greenplum Database.

Khuyến mại trong thời gian có hạn dành cho người dùng mới: Dùng thử 30 ngày với 1 USD, ưu tiên những người đăng ký trước.

ApsaraDB AnalyticDB for PostgreSQL là dịch vụ kho dữ liệu MPP (Xử lý song song hàng loạt) trực tuyến dựa trên Greenplum Database nguồn mở.
ApsaraDB AnalyticDB for PostgreSQL cung cấp dịch vụ mở rộng và giám sát hiệu suất trực tuyến giúp giải phóng đội ngũ nhân viên của bạn khỏi các hoạt động vận hành và quản lý (O&M) cụm MPP phức tạp. Điều này giúp các quản trị viên cơ sở dữ liệu, nhà phát triển và nhà phân tích dữ liệu có thể tập trung vào việc nâng cao năng suất của doanh nghiệp thông qua việc phát triển SQL.

Lợi ích

Hiệu suất vượt trội
ApsaraDB AnalyticDB for PostgreSQL cho phép dùng kết hợp các kho lưu trữ theo hàng và cột. Phân tích OLAP giữa các kho lưu trữ theo cột nhanh gấp 100 lần so với giữa các kho lưu trữ theo hàng.
Hỗ trợ nhập dữ liệu song song vào OSS với hiệu suất cao, loại bỏ tình trạng nghẽn cổ chai của việc nhập dữ liệu qua một kênh duy nhất.
Dễ sử dụng
Hỗ trợ nhiều loại cú pháp và hàm SQL OLAP, cùng với nhiều hàm trong Oracle. Có thể trực tiếp triển khai phần mềm BI phổ biến trong ngành cho AnalyticDB for PostgreSQL.
Liên kết ApsaraDB AnalyticDB for PostgreSQL với ApsaraDB for RDS để tạo ra các giải pháp phân tích giao dịch lai OLTP + OLAP (HTAP)
Ổn định và đáng tin cậy
Hỗ trợ các giao dịch ACID trong cơ sở dữ liệu phân tán, trong đó tất cả dữ liệu được đồng bộ hóa thành hai bản sao trên hai nút. Dịch vụ này còn hỗ trợ triển khai phân tán với khả năng bảo vệ ba cấp (phân đoạn, máy chủ và tủ mạng) giúp đảm bảo an toàn cho cơ sở hạ tầng dữ liệu.
Dịch vụ này hỗ trợ triển khai phân tán với khả năng bảo vệ ba cấp (phân đoạn, máy chủ và tủ mạng) giúp đảm bảo an toàn cho cơ sở hạ tầng dữ liệu.
Khả năng thay đổi quy mô linh hoạt
Thay đổi quy mô đơn vị xử lý (CPU, bộ nhớ và không gian lưu trữ) và nâng cao hiệu suất OLAP để xử lý hàng trăm terabyte.
Hỗ trợ các hoạt động dữ liệu trong môi trường OSS minh bạch. Có thể lưu trữ dữ liệu phân tích ngoại tuyến ít truy xuất vào OSS và có thể thay đổi quy mô dung lượng lưu trữ khi cần. Nhờ việc tích hợp tính năng nén dữ liệu dựa trên các Bảng bên ngoài, giải pháp này giúp giảm đáng kể chi phí sản xuất.

Tính năng

  • Phân tán

    Cơ sở dữ liệu phân tán dựa trên các thuộc tính ACID.


    Dựa trên cấu trúc MPP (Xử lý song song hàng loạt) phân tán.


    Công suất lưu trữ và tính toán có thể mở rộng tuyến tính với sự tăng lên của các phân đoạn.


    Phát huy tối đa tiềm năng hiệu quả tính toán OLAP.


    Thống kê OLAP SQL phân tán và các hàm cửa sổ.


    Các thủ tục được lưu trữ bằng PL/pgSQL và PL/JAVA.

  • Máy học và phân tích

    Máy học MADlib sử dụng ngôn ngữ SQL.


    Phù hợp với các tiêu chuẩn OpenGIS quốc tế trong phân tích dữ liệu địa lý hỗn hợp.


    Phân tích loại dữ liệu JSON.


    Phân tích bằng thuật toán HyperLogLog.

  • Tích hợp dữ liệu

    Có được sự hỗ trợ từ các công cụ ETL phổ biến chạy trên trình điều khiển JDBC cho PostgreSQL/Greenplum.


    Người dùng MySQL có thể đồng bộ hóa dữ liệu tăng dần với 'rds_dbsync'.


    Các truy vấn dữ liệu bằng cú pháp SQL tiêu chuẩn dựa trên Bảng bên ngoài OSS.


    Bảng bên ngoài OSS hỗ trợ nén dữ liệu để giảm chi phí sản xuất.

  • Bảo mật

    Cho phép lưu tối đa 1.000 địa chỉ IP máy chủ trong cấu hình danh sách trắng IP.


    Giám sát theo thời gian thực đối với việc truy cập mạng nhằm thực hiện các cuộc tấn công DDoS.

  • Phân tích hỗn hợp

    Hỗ trợ phân tích dữ liệu GIS theo thời gian thực với cú pháp SQL để hỗ trợ thống kê LBS cho các thiết bị IoT và các hoạt động thống kê khác trên Internet.


    Hỗ trợ phân tích dữ liệu JSON, XML và dữ liệu chuỗi khớp gần nhất theo thời gian thực bằng cú pháp SQL để giúp các tổ chức tài chính, chính phủ và doanh nghiệp xử lý dữ liệu thông báo và khớp văn bản gần nhất.

Hướng dẫn điều chỉnh AnalyticDB for PostgreSQL SQL

Là một dịch vụ lưu trữ dữ liệu cấp độ PB trên nền tảng đám mây, Phân tích dữ liệu cho PostgreSQL là một sáng tạo thiên tài cho kịch bản MPP với khả năng mở rộng vượt trội.

Tài liệu này nêu bật các tính năng chính của Giải tích phân tích cho PostgreSQL và đi sâu vào các điểm chính của điều chỉnh hiệu năng SQL, bao gồm thiết kế cấu trúc bảng ở giai đoạn đầu, phân tích các câu lệnh SQL chậm được sử dụng và các cách thực hành để giữ cơ sở dữ liệu trong điều kiện tối ưu hàng ngày Vận hành và bảo trì.

Cách thức hoạt động

  • Phát triển một lần
  • Phân tích IoT (JSON+GIS)
  • Phân tích thống kê ước tính trên Internet (HyperLogLog)
  • OLTP và OLAP
Phát triển một lần

Phát triển một lần

Các ISV (Nhà cung cấp phần mềm độc lập) có thể chuyển đổi giữa các ứng dụng hệ thống MPP tại chỗ và trên đám mây. Các doanh nghiệp với cơ sở hạ tầng tại chỗ có thể tận dụng trực tiếp Greenplum Database, còn các doanh nghiệp dùng nền tảng đám mây có thể ứng dụng trực tiếp AnalyticDB.

Các nhà phát triển chỉ cần lập trình ứng dụng một lần và ứng dụng có thể chạy trên cả nền tảng truyền thống và đám mây. Đồng thời, các lược đồ tại chỗ và trên đám mây có thể kết nối với nhau thông qua các trình điều khiển chung PostgreSQL, cho phép doanh nghiệp trao đổi dữ liệu với nhiều nền tảng thuộc cùng kiến trúc. Bạn có thể dễ dàng xây dựng một nền tảng phát triển kho dữ liệu "đám mây lai" tích hợp mà không phải lo lắng về những khác biệt giữa nền tảng tại chỗ và đám mây.

Phân tích IoT (JSON+GIS)

Phân tích IoT (JSON+GIS)

Cả ApsaraDB AnalyticDB và PostgreSQL đều được lồng ghép với công cụ cơ sở dữ liệu không gian PostGIS tuân thủ chuẩn OpenGIS để định vị và lập tuyến hành trình theo thời gian thực. ArcGIS, Intergraph và QGIS có hỗ trợ PostGIS. Bạn có thể dùng các câu lệnh SQL đơn giản trong ứng dụng kết hợp với các hàm GIS để xử lý các mẫu dữ liệu địa lý không gian phức tạp (hỗ trợ xử lý 2D và 3D).

Với năng lực OLAP (xử lý phân tích trực tuyến) dữ liệu toàn diện của AnalyticDB for PostgreSQL, bạn có thể thực hiện phân tích dữ liệu hàng loạt dựa trên thông tin địa lý để hỗ trợ việc ra quyết định cho các ứng dụng IoT, Internet di động, giao vận, thành phố thông minh, LBS (dịch vụ dựa trên vị trí), hệ thống kinh doanh O2O (từ trực tuyến đến ngoại tuyến) và nhiều ứng dụng khác.

Phân tích thống kê ước tính trên Internet (HyperLogLog)

Phân tích thống kê ước tính trên Internet (HyperLogLog)

Ước tính số lượng là ứng dụng phổ biến nhất trong các trường hợp sử dụng liên quan đến Dữ liệu lớn. Yêu cầu về bộ nhớ, dữ liệu xử lý và dữ liệu sau khi hợp nhất là các vấn đề lớn phát sinh trong quá trình ước tính số lượng. Việc tính toán PV và VU của trang đều thuộc loại yêu cầu này.

Trong SQL, chúng ta thường thực hiện việc tính toán bằng hàm COUNT DISTINCT, nhưng hiệu suất không cao. HyperLogLog giúp cải thiện hiệu suất truy vấn của ước tính số lượng lên gấp 20 đến 100 lần, với tỷ lệ lỗi xấp xỉ 2%. HyperLogLog có thể được ứng dụng vào các tình huống kinh doanh không yêu cầu tính toán với độ chính xác cao. Điều này giúp giảm đáng kể khối lượng tính toán cho máy chủ cũng như chi phí.

OLTP và OLAP

OLTP và OLAP

Có nhiều lựa chọn để nhập các kho dữ liệu dựa trên Greenplum của bạn vào ApsaraDB AnalyticDB. Bạn cũng không cần phải lo lắng về hoạt động vận hành và quản lý cụm MPP phức tạp. Đồng thời, Alibaba Cloud mang đến cho bạn một bộ giải pháp toàn diện về mức độ sẵn sàng và khả năng thay đổi quy mô, cho phép quản trị viên cơ sở dữ liệu, nhà phát triển và chuyên viên phân tích dữ liệu tập trung vào việc nâng cao năng suất của doanh nghiệp thông qua SQL và tạo ra giá trị cốt lõi.

Với ApsaraDB for RDS của Alibaba Cloud, bạn có thể thấy rõ hiệu suất cao của các ứng dụng OLTP. RDS hỗ trợ MySQL, SQL Server và PostgreSQL. Kết hợp với ApsaraDB AnalyticDB, bạn có thể tích hợp cơ sở dữ liệu OLTP và OLAP lên đám mây để tạo ra một nền tảng kiến trúc cơ sở dữ liệu, trong đó việc phân tích ra quyết định và các giao dịch sản xuất diễn ra với khả năng xử lý đồng thời cao.

Những câu hỏi thường gặp

1. RDS, AnalyticDB for PostgreSQL và E-MapReduce có các lựa chọn như thế nào?

AnalyticDB for PostgreSQL RDS E-MapReduce
Dựa trên Greenplum Database Kho dữ liệu OLAP (Xử lý phân tích trực tuyến) Mở rộng dung lượng lưu trữ theo nhu cầu. Các phân tích kiến trúc phân tán MPP và hiệu suất lưu trữ tuân theo đường cong tăng trưởng tuyến tính. Các truy vấn SQL phức tạp có thể được giải quyết trong vài giây hoặc thậm chí vài mili giây, với khả năng xử lý đồng thời được kiểm soát trong khoảng 500.
MySQL / PostgreSQL / SQL Server Cơ sở dữ liệu OLTP (Xử lý giao dịch trực tuyến) Hỗ trợ nhiều công cụ cơ sở dữ liệu khác nhau và hướng đến xử lý mô hình kinh doanh dựa trên giao dịch theo thời gian thực – CRUD (tạo, truy xuất, cập nhật và xóa). Hỗ trợ dữ liệu trực tuyến có dung lượng dưới 2TB.
Hadoop, Apache Spark, HBase, Presto và Storm Giải pháp xử lý Dữ liệu lớn giúp xử lý lượng dữ liệu khổng lồ một cách nhanh chóng Cho phép bạn khởi động nhanh các cụm Hadoop trong vài phút để xử lý dữ liệu hàng loạt. Điều này giúp đơn giản hóa việc xử lý dữ liệu lớn phức tạp bằng cách thực hiện các nhiệm vụ xử lý lượng lớn dữ liệu cho các ứng dụng liên quan.

2. Công cụ ETL nào hỗ trợ ApsaraDB AnalyticDB for PostgreSQL?

AnalyticDB for PostgreSQL dựa trên chương trình Greenplum Database nguồn mở và ứng dụng các giao diện JDBC và ODBC phổ biến. Do đó, hầu hết các công cụ ETL hỗ trợ Greenplum và PostgreSQL cũng hỗ trợ AnalyticDB for PostgreSQL.

3. Đâu là điểm khác biệt giữa AnalyticDB for PostgreSQL và Greenplum Database mà AnalyticDB dựa trên đó?

• Các phần mở rộng của AnalyticDB for PostgreSQL hỗ trợ JSON, HyperLogLog và các bảng bên ngoài oss_ext, còn Greenplum Database nguồn mở thì không hỗ trợ.

• AnalyticDB for PostgreSQL là dịch vụ điện toán đám mây có cấu hình dễ sử dụng với một cú nhấp chuột trên Bảng điều khiển Alibaba Cloud. Người dùng không phải lo lắng về việc quản lý công tác triển khai và mở rộng kho dữ liệu, trong số những cấu hình phức tạp khác.

AnalyticDB for PostgreSQL được xây dựng trên nền tảng quản lý thống nhất của Alibaba Cloud ApsaraDB và đặt ra các giới hạn về quyền của người dùng cấp cao.

4. Dung lượng lưu trữ của phiên bản mà tôi mua cho AnalyticDB for PostgreSQL có sử dụng được toàn bộ không?

Dung lượng lưu trữ của phiên bản là dung lượng lưu trữ sử dụng được thực sự. AnalyticDB for PostgreSQL dành riêng một không gian bổ sung để lưu trữ tệp tạm thời và không gian lưu trữ này không chiếm tài nguyên mà bạn đã mua.

5. Loại nút AnalyticDB for PostgreSQL và phân đoạn Greenplum Database có quan hệ thế nào?

• Một nút gồm có một hoặc nhiều phân đoạn. Các nhân xử lý, bộ nhớ và dung lượng ổ đĩa trên loại nút thể hiện dung lượng lưu trữ sử dụng được thực sự. Ví dụ: loại nút gồm 4 Nhân/Bộ nhớ 32GB/Ổ cứng HDD 2TB sẽ gồm: 4 phân đoạn trong đó mỗi phân đoạn có 1 Nhân/Bộ nhớ 8GB/Ổ cứng HDD 0,5TB.

• Ví dụ: với loại nút 4 Nhân/Bộ nhớ 32GB/Ổ cứng HDD 2TB, thì Greenplum Database nguyên gốc tương ứng sẽ gồm một phân đoạn chính có 4 Nhân/Bộ nhớ 32GB/Ổ cứng HDD 2TB, và một phân đoạn phản chiếu có 4 Nhân/Bộ nhớ 32GB/Ổ cứng HDD 2TB. Nói cách khác, nếu muốn xây dựng một cụm Greenplum Database có cùng cấu hình, bạn có thể chuẩn bị tài nguyên tại chỗ gồm 8 Nhân/Bộ nhớ 64GB/Ổ cứng HDD 4TB hoặc cao hơn (và cả không gian lưu trữ tệp tạm thời bổ sung cho cụm đó).

• Tất cả các phân đoạn trong một nút đều được phân bố trên cùng một máy chủ. Một nút có cấu hình cao giúp giảm thiểu việc chuyển đổi mạng và cải thiện hiệu suất. Bạn nên chọn nút có cấu hình cao nếu cần nhiều tài nguyên tính toán. Để mua nút có cấu hình cao, hãy liên hệ với người quản lý khách hàng của bạn hoặc đăng ký bằng cách gửi một "phiếu yêu cầu hỗ trợ".

6. Dung lượng lưu trữ của AnalyticDB for PostgreSQL có thể mở rộng đến mức nào?

Chúng tôi cung cấp các tài nguyên lưu trữ và tính toán với cấu hình 2048 Nhân/Bộ nhớ 16TB/Ổ cứng HDD 1024TB hoặc cao hơn tuỳ theo yêu cầu của bạn. Để mua một nút có cấu hình siêu cao, hãy liên hệ với người quản lý khách hàng của bạn hoặc đăng ký bằng cách gửi một "Phiếu yêu cầu hỗ trợ" trên Bảng điều khiển.

Hỗ trợ nâng cao dành cho bạn

Tư vấn trực tiếp trước bán hàng, hỗ trợ kỹ thuật 24/7, phản hồi nhanh hơn và nhiều vé hơn.

Tư vấn trực tiếp trước bán hàng

Được các chuyên gia giàu kinh nghiệm về đám mây tư vấn.Tìm hiểu thêm

Hỗ trợ kỹ thuật 24/7

Tăng thêm thời gian hỗ trợ từ 10 giờ x 5 ngày một tuần sang hỗ trợ 24/7. Tìm hiểu thêm

6 vé miễn phí mỗi quý.

Tăng gấp đôi số vé miễn phí từ 3 lên 6 vé mỗi quý. Tìm hiểu thêm

Phản hồi nhanh hơn

Rút ngắn thời gian phản hồi sau bán hàng từ 36 giờ xuống 18 giờ. Tìm hiểu thêm