Trang chủ > Công nghệ thông tin, Thủ thuật > Oracle Data Pump: Công cụ load dữ liệu cực nhanh

Oracle Data Pump: Công cụ load dữ liệu cực nhanh

Nếu bạn đã biết đến về Oracle thì công cụ Import/Export không có gì xa lạ. Nó giúp mình move một database này sang một database khác mà cấu trúc và dữ liệu vẫn ý nguyên. Hoặc backup những database oracle cỡ nhỏ rất nhanh và tiện dụng.

Nhưng đến phiên bản 10g Oracle giới thiệu một công cụ mới mở rộng công cụ import/export này được gọi là Oracle Data Pump. Khả năng của công cụ này load dữ liệu một cách khủng khiếp! Nhanh hơn công cụ trước hàng chục lần! Phục vụ trong dự án kho dữ liệu (data warehouse) một cách cực kì hiệu quá. Tuy vậy cũng có mặt hạn chế, chúng ta cũng nghiên cứu tiếp sau đây.
Data Pump Import / Export
– Lệnh sử dụng trong command: impdp/expdp (khác với công cụ cũ là imp/exp)
So sách với công cụ import/export cũ:
– Thực thi export trên server, cũ là ở client, cũng có thể export trên client sử dụng database link
– Export file gần giống với định dạng của datafile nên việc import/export rất nhanh.
– Có khả năng stop, pause, remove, restart tiến trình khi chạy
– Hỗ trợ remap tablespace, datafile, schema
– Hỗ trợ sử dụng command line, hoặc sử dụng package.
– Quan trọng nhất là tốc độ import/export cực kì nhanh. Khoảng 500.000 bản ghi / giây!

Các sử dụng:
1. Vì đây là công cụ export trên server, nên ta phải tạo cho nó một DIRECTORY bằng câu lệnh sau, ví dụ bên dưới là đang đăng nhập với user là sys:

SQL> create directory dump_dir as ‘c:\export\’ ;
Directory created.
SQL> grant read, write on directory exportpump to hoaipn ;
Grant succeeded.
SQL>

2. Dùng lệnh Pump Export: ví dụ sau tôi đang muốn export toàn bộ cấu trúc và dữ liệu của user hoaipn.

Microsoft Windows XP [Version 5.1.2600]
(C) Copyright 1985-2001 Microsoft Corp.
C:\expdp hoaipn/hoaipn directory=dump_dir dumfile=my_dumfile.dmp

3. Dùng lệnh Pump Import:
Microsoft Windows XP [Version 5.1.2600]
(C) Copyright 1985-2001 Microsoft Corp.
C:\impdp hoaipn/hoaipn directory=dump_dir dumfile=my_dumfile.dmp

4. Còn rất nhiều lệnh hỗ trợ bạn đọc thêm tại đây, hoặc sử dụng
C:\impdp help=y

Hạn chế
Oracle Data Pump sử dụng việc export trên server để thực thi nhằm tăng tốc cho quá trình export và import, và đây cũng chính là điểm hạn chế của công cụ này. Thử tưởng tượng bạn làm trong một dự án cần lấy dữ liệu của một hệ thống khác mà không phải do mình quản lý? tất nhiên sẽ là họp hành, nghiên cứu để tạo user, cấp quyền, cấp thư mục, dung lượng, … mệt lắm, có thể bạn cũng sẽ không được quyền gì cả,…

Chỉnh vì điều này, Oracle đã nghĩ ra việc export qua database link. Nhưng dùng qua database link thì không sử dụng được partition. những bảng dữ liệu lớn thì toàn phải dùng partition, mình không làm được, thì sẽ lại đi vào bế tắc.

Tóm lại

Không còn nghi ngờ gì nữa, đây là công cụ load dữ liệu có tốc độ cao nhất của Oracle, thích hợp cho hệ thống data warehouse rất hay cần load dữ liệu, hoặc trong trường hợp bạn muốn move database, hoặc move bất kì một nhóm bảng nào.

Nguồn (http://vn.360plus.yahoo.com/mtv_boyvn/article?mid=11)

 

  1. Không có bình luận
  1. No trackbacks yet.

Bình luận về bài viết này