MỘT SỐ VẤN ĐỀ VỀ ĐỒNG BỘ DỮ LIỆU KHÔNG GIAN

Similar documents
HẬU QUẢ CỦA VIỆC HỦY BỎ HỢP ĐỒNG THEO BỘ LUẬT DÂN SỰ NĂM TS. Võ Sỹ Mạnh Khoa Luật, Đại học Ngoại thương Hà Nội

BỘ CHỈNH LƯU KÉP 3 PHA THREE - PHASE DUAL CONTROLLED RECTIFIER

Nguyễn Phùng Quang và cs Tạp chí KHOA HỌC & CÔNG NGHỆ 63(1): 50-55

GIẢI THUẬT DI TRUYỀN VÀ ỨNG DỤNG TRONG HỖ TRỢ LẬP LỊCH ĐIỀU HÀNH CÔNG TÁC BỆNH VIỆN

User manual Citrus Juicer

NGHIÊN CỨU SỬ DỤNG GREENSTONE TRONG VIỆC XÂY DỰNG THƯ VIỆN SỐ

PEGASOS. Bộ điều khiển số cho đầu máy xe lửa với hệ thống truyền động bằng Diesel - Điện và Diesel - Thủy lực

[EN] Use and installation manual. [VIE] Hướng dẫn sử dụng và bảo dưỡng 8. induction cooktop. Bếp cảm ứng từ Model: GH 027IS.

HƯỚNG DẪN SỬ DỤNG USER MANUAL. Model : MDR 302

INSTRUCTION MANUAL HƯỚNG DẪN SỬ DỤNG

INSTRUCTION MANUAL HƯỚNG DẪN SỬ DỤNG

Operating and Installation Instructions. Induction hobs MH-02IS MH-03IS

ELECTRIC OVEN Model. TO-24E

Bếp cảm ứng từ Model: TOM 02I-G5

bếp hỗn hợp điện từ MODEL: GH 027IH mixed induction / hi-light cooktop [EN] Use and installation manual [VIE] Hướng dẫn sử dụng và bảo dưỡng 8

USER MANUAL HƯỚNG DẪN SỬ DỤNG

User manual Chopper. Models: CHB Always keep manual for your safety

THIẾT BỊ & GIẢI PHÁP PRODUCTS & SOLUTIONS

HƯỚNG TỚI TƯƠNG LAI THE FUTURE IS UP

Assembly instructions Hướng dẫn lắp đặt

ĐỘNG TÍNH TỪ ID: PARTICIPLES (ĐỘNG TÍNH TỪ/ PHÂN ĐỘNG TỪ)

EFFECT OF 2D AND 3D COIL ON THE DYNAMIC MOLD TEMPERATURE CONTROL BY INDUCTION HEATING

AH-A18LEW AU-A18LEW AH-A24LEW AU-A24LEW HƯỚNG DẪN SỬ DỤNG MÁY ĐIỀU HÒA KHÔNG KHÍ LOẠI HAI KHỐI RỜI SPLIT TYPE ROOM AIR CONDITIONER OPERATION MANUAL

EMS3288X. Instruction Manual. EN Microwave Oven TH VI Lò vi sóng. Hướng dẫn sử dụng

KỸ THUẬT SỐ (Digital Electronics)

HONEYWELL VIỆT NAM HONEYWELL VIETNAM

MÁY SẤY QUẦN ÁO TUMBLE DRYER. HƯỚNG DẪN SỬ DỤNG INSTRUCTION MANUAL Model : MTD-B0603E

LINH DAM NEW TOWN - SOLUTION FOR THE HIGH-DENSITY DEVELOPMENT OF NEW SETTLEMENTS IN THE SOUTH-WEST OF HANOI

EHC7240BA. Ceramic glass hob. Hướng dẫn sử dụng. Bếp điện

RCNT340E50VZX RCNT340E50VZX RCNT340I50VZX RCNT375E50VZDX RCNT375E50VZX RCNT375I50VZX RCNT415E50VZDX RCNT415E50VZGW EN TV

RTNT290E50VZX RTNT340E50VZGW RTNT340E50VZX

Operating Instructions Induction Heating Cooktop For domestic use Model No. KY-C227D KY-A227D

DVD Player and Spa Installation Guide

GIS-BASED MANAGEMENT OF URBAN TREE AND GREEN SPACES IN VIETNAM CITIES

TRAINING FOR HOMESTAY OPERATION. Module 8: Housekeeping service. esrt programme

WASHING MACHINE MÁY GIẶT

Le Van Banh - Hoang Bac Quoc

SUMMER CAMP V IT C " X ANH V I!T P HÁP C OLVERT TRẠI HÈ ĐẾN VỚI RESORT SPA XANH ĐẸP CÁCH HÀ NỘI 40 KM L A F ERME QUA LỚP KỸ NĂNG TIẾNG ANH

DANH MỤC MỘT SỐ CÔNG TRÌNH DO CÔNG TY VIETSAFE CUNG CẤP VÀ LẮP ĐẶT THIẾT BỊ

Urbanisation and urban architectural heritage preservation in Hanoi: The community s participation?

MF12S(31sets)Operation Instruction

Best Light for Life. Van My Khanh Co.

TAM KY S MASTERPLAN TOWARDS GREEN GROWTH

LIST OF INVESTORS IN HIEP PHUOC INDUSTRIAL PARK

Kinh giri: Thu tnrong cac don vi trong Truong

OWNER S MANUAL HƯỚNG DẪN SỬ DỤNG

PCUA DAIKIN Applied Products

Opportunities in the woodworking sector in Vietnam

SELECTION OF SALT TOLERANCE GENOTYPES FROM DOUBLED HAPLOIDS IN RICE. Dang Minh Tam, Nguyen Thi Lang

Table 4.22 Demand Outlook of Bac Cau Long Bien Station Area (V5)

EFFECT OF TEMPERATURE ON PHYSIOLOGICAL ACTIVITIES OF TOMATO Cv. SAVIOR DURING POSTHARVEST RIPENING

Do not use the appliance without reading the handling instruction.

PHÂN LOẠI GIỚI ĐỘNG VẬT 2/7/2017 8:36:01 AM 2

THANK YOU LETTER. Dear leaders, your partners, individuals, teams have co-operated and developed with Global Vision until today.

Main goals ( ( program) y Raising the awareness of Climate change in term of urban planning (urban planning consultation, urban mana

Citation Vietnamese Academy of Science and T P.101-P

Urbanisation and urban architectural heritage preservation in Hanoi : the community s participation?

5.15 Ngoc Hoi (V16) Station Area

Company profile.

NFPA Public Education Division. Your Source for Safety Information Annual Report

The École Française D'extrême-Orient (EFEO) with Conservation of Historic and Cultural Monuments in Hanoi (During )

IN VITRO PROPAGATION OF COMMON BEAN (Phaseolus vulgaris L.)

3Rs PROMOTION IN HO CHI MINH CITY

A Space Where Cultivating Relationships SERIES LUXURY

Application of GIS and Remote Sensing for Identifying Flood Risk in Ho Chi Minh City, Vietnam

3.7 TOD Concept Plans in South Urban Cluster

A SKETCH OF 20-YEAR EVOLUTION # Phan Hieu Hien # #

Impressum. Photograph taken from District 1 overlooking the planned site of the new CBD in District 2

Company Profile. Main Activity

COMPANY PROFILE. - EIGHT MARCH TEXTILE COMPANY LIMITED Name of enterprise. City. Director: Vu Quyet Chien

Instruction manual Hướng dẫn sử dụng

TRANSPORT AND URBAN DEVELOPMENT

3.6 TOD Concept Plans on Hanoi City Centre

SMOKE DETECTION IN VIDEO BASED ON MOTION AND CONTRAST

BO5040 BO5041. ID Mesin Ampelas Acak Petunjuk penggunaan. VI Máy chà nhám quỹ đạo tròn tùy tiện Tài liệu hướng dẫn

Post Show Report. The No.1 professional flagship trade show in Vietnam

DEVELOPING AN EFFICIENT REGENERATION PROTOCOL FOR SWEETPOTATO, Ipomoea batatas (L.) Lam., USING NODAL EXPLANTS

ASSESSMENT OF URBAN PLANNING AND URBAN DEVELOPMENT IN AN VAN DUONG, HUE CITY

HoChiMinh City University of Natural Resources and Environment (H C M UNR E)

Role of Land Use and Planning in Suistainable Transport Development

Enterprise GIS Architecture Deployment Options

VIET NAM ASSOCIATION FOR SUPPORTING INDUSTRIES YEARBOOK

The No. 1 professional flagship trade show in Vietnam

DRAFT MEMORANDUM. (1) Current PSU Initiatives in Hoi An and Quang Nam Province and Next Steps

University of Canberra. This thesis is available in print format from the University of Canberra Library.

A STUDY ON THE EMBANKMENT CACULATION METHOD REINFORCED BY GEOTEXTILE IN THE CONSTRUCTION OF HIGHWAY IN VIETNAM

CONTENTS. Company Overview Page 3... Key Progress Page 4. Core Values Page 5. Introduction Page 6. Business Philosophy Page 7

DUS tester: Nguyen Thai Ha

INDOOR UNIT/OUTDOOR UNIT

CONTENTS PAGE. INTRODUCTION A. GEOSYNTHETIC SOLUTIONS PVD, PHD + Vacuum Consolidation Geotextile Geogrid Geotube Geobag

A CONSERVATION PERSPECTIVE ON THE BA DINH ARCHAEOLOGICAL SITE

THÔNG BÁO KỸ THUẬT TÀU BIỂN TECHNICAL INFORMATION ON SEA-GOING SHIPS

LIST OF PROJECTS PROVIDING EQUIPMENT BY VIETSAFE

GENERAL INFORMATION. Time September 21 st 24 th, 2016

Stay at La Ferme du Colvert Resort Spa, an unique place for your personal or professional events in North Vietnam!

6.8 Individual proposal by Maria Hagelberg. Local business and commerce. Outlines of local business and commerce proposal

Research on Cassava Drying, Application and Promotion of the Reversible Airflow Flatbed Dryers for Sliced Cassava

MINISTRY OF CONSTRUCTION URBAN DEVELOPMENT AGENCY MANAGEMENT OF URBAN DEVELOPMENT PROJECTS TERMS OF REFERENCE

INSTRUMENTATION AND ELECTRICAL SYSTEM DESIGN - PROCUREMENT INSTALLATION & COMMISSIONING - MAINTENANCE CALIBRATION - VERIFICATION - TRAINING

Updated regulations and current management status of E-waste, Used lead acid battery and Mercury wastes in Vietnam

Transcription:

KỶ YẾU HỘI NGHỊ KHOA HỌC VÀ CÔNG NGHỆ LẦN THỨ 12 HCMUT 2628/10/2011 MỘT SỐ VẤN ĐỀ VỀ ĐỒNG BỘ DỮ LIỆU KHÔNG GIAN KHƯU MINH CẢNH a, TRẦN QUANG TRƯỜNG HINH a, TS.TRẦN TRỌNG ĐỨC b, HỒ NGUYỄN CÚC PHƯƠNG c a Trung tâm Ứng dụng Hệ thống Thông tin Địa lý, Sở KH&CN, TPHCM kmcanh@yahoo.com, tranquangtruonghinh@yahoo.com b Khoa Kỹ thuật Xây dựng, Trường Đại học Bách Khoa, Thành phố Hồ Chí Minh ttduc@hcmut.edu.vn c Trường Cao Đẳng Kinh tế Kỹ thuật Phú Lâm, Thành phố Hồ Chí Minh phuongtom@gmail.com 1. GIỚI THIỆU Đồng bộ dữ liệu là công việc cần đến trong các hệ thống công nghệ thông tin hiện nay tại Việt Nam, trong đó, chủ yếu là các hệ thống cần thu thập dữ liệu (thiết bị di động) và các hệ thống cập nhật cũng như tác nghiệp trong môi trường kết nối không thường xuyên (mô hình thành phố quận phường). Đối với các hệ thống GIS, dữ liệu thường chiếm tỉ lệ rất lớn về chi phí, số người tham gia trong việc hình thành và duy trì hệ thống. Do đó, đồng bộ dữ liệu không gian là một vấn đề cần thiết cho các ứng dụng GIS. Những hệ thống có xây dựng cơ chế đồng bộ tốt sẽ góp phần tiết kiệm chi phí cho hệ thống. Và hơn nữa, đó cũng là một trong yếu tố góp phần đưa hệ thống gần gũi hơn với người sử dụng và hệ thống được bền vững hơn. Bài viết cũng hướng người đọc đến việc xây dựng một hệ thống nhỏ để sao lặp dữ liệu trên hệ quản trị cơ sở dữ liệu không gian mở Postgres/PostGIS. 2.1. Đồng bộ dữ liệu 2.1.1. Khái niệm sơ lược về đồng bộ 2. NỀN TẢNG VÀ CÁC NGHIÊN CỨU LIÊN QUAN Phát biểu theo đại số: dữ liệu đồng bộ không có thứ tự là kết quả của phép toán hợp từ hai hiệu như sau: S A B ( S S ) ( S S ) S = Υ (công thức 1) A Phép cộng trên có tính giao hoán vì vai trò của S A và S B là giống nhau. B Trong đó: S A và S B là hai tập dữ liệu cần đồng bộ với nhau. Theo mô hình đại số trên, chúng ta có 03 loại đồng bộ như sau: B Đồng bộ toàn bộ (whole transfer): toàn bộ dữ liệu được truyền đến một nơi lưu trữ để tiến hành so sánh cục bộ. Đồng bộ theo thời gian (timestamp): chỉ một phần dữ liệu thỏa điều kiện theo thời gian mới được đồng bộ. Những dữ liệu không thỏa điều kiện về thời gian sẽ không được đồng bộ, khi đó, ta có tập biến đổi lần lượt là S A T0 và S B T0, với T 0 là thời điểm xác định. A

Đồng bộ theo toán học (mathematical): các phép toán biến đổi dữ liệu được đồng bộ. Khi đó hai tập S A và S B sẽ biến đổi thành các tập mới theo cùng tập biến toán học. Từ công thức 1, chúng ta có công thức 2: S A S = S S ) Ι ( S S ) (công thức 2) B ( A B B A Công thức 2 xác định tập các dữ liệu cùng bị thay đổi trên 2 tập S A và S, B khi đó, kết quả nhận được là tập hợp dữ liệu cùng lúc bị thay đổi trên hai hệ thống, và chúng được gọi là tập dữ liệu bị mâu thuẫn (conflict data). 2.1.2. Các yêu cầu trong việc chọn lựa hệ thống đồng bộ Việc chọn lựa các hệ thống đồng bộ thường liên quan đến các tiêu chí như sau: Về tốc độ đồng bộ (độ trễ latency): nhanh hay chậm, có thể đồng bộ tức thì hay không. Về sự tự trị của các máy đồng bộ (site autonomy): đòi hỏi hoặc không đòi hỏi việc kết nối liên tục đến các máy chủ khác. Trong một số qui trình, việc đồng bộ có thể không cần mọi lúc. Do đó, sự tự trị sẽ là một thông số trong việc chọn lựa hệ thống. Giải quyết mâu thuẫn (update conflicts): hỗ trợ giải quyết các mâu thuẫn trong các hệ thống CSDL. Hệ thống được trang bị các module hỗ trợ giải quyết các mâu thuẫn và không đồng nhất về mặt dữ liệu. Xử lý nhanh chóng và thông minh của hệ thống là các yếu tố cần thiết trong các hệ thống. Tính kiên định trong giao tác (Transactional Consistency): thông số này được được đề cập trong các hệ thống đồng bộ theo phương pháp cùng thực hiện một giao tác nhưng môi trường thực thi không tốt (như môi trường mạng hoặc máy chủ quá bận) dẫn đến một vài máy chủ không đạt được kết quả thực thi các giao tác như các máy chủ khác. Do đó, kết quả dẫn đến là dữ liệu sẽ bị sai lệch. Các mô hình và hệ thống sao lặp phải nhận biết và giải quyết vấn đề này. Ngoài ra, các yêu cầu khác của hệ thống đồng bộ bao gồm: Cần điều kiện tương đồng về phần cứng: phần cứng yêu cầu giống nhau hoàn toàn. Những yêu cầu các phần mềm hệ thống và phần mềm hệ điều hành như nhau. Sự hỗ trợ đồng bộ trên toàn CSDL hay chỉ trên một số bảng của CSDL. Khả năng đồng bộ nhiều cấp, nghĩa là một máy sau khi đồng bộ có thể đồng bộ với nhiều máy khác. Mức độ dễ dàng bổ sung một node đồng bộ mới. Số chiều đồng bộ (hai chiều hay chỉ một chiều). Công nghệ đồng bộ: theo trigger, theo các tập lệnh (batch), Mức độ có sẵn và thời gian cần thiết để đào tạo nhân sự cho việc đồng bộ. Hình 1. Một số mô hình đồng bộ dữ liệu được giới thiệu theo công nghệ ArcGIS của ESRI

Những tiêu chí trên là một phần trong việc chọn lựa hệ thống. Đối với hệ thống GIS, các tiêu chí trên sẽ tác động đến các thành phần như: Phần cứng: trả lời câu hỏi: hệ thống có bắt buộc có cấu hình như nhau. Điều này sẽ ảnh hưởng đến vấn đề nâng cấp, bảo trì phần cứng như: tăng bộ nhớ, thay đổi dung lượng đĩa. Việc thay đổi và mở rộng hệ thống sẽ phải được đánh giá chi tiết. Phần mềm: nếu phần mềm hệ thống như hệ điều hành, phần mềm quản trị CSDL cần phải cố định thì vấn đề nâng cấp, bảo mật CSDL, cài đặt các gói hỗ trợ hệ điều hành phải được sự đồng ý của người quản trị hệ thống. Việc sử dụng phần mềm có liên quan đến vấn đề bản quyền sẽ là một yếu tố bắt buộc các nhà thiết kế phải quan tâm đến. Dữ liệu: trong các phần mềm bắt buộc đồng bộ cả CSDL, thì chúng ta không thể tạo những bảng dữ liệu sử dụng riêng cho từng nơi. Vì khi đó, tất cả dữ liệu sẽ được đồng bộ và thông tin sẽ không bảo mật. Tuy nhiên, đối với việc đồng bộ một số bảng trong CSDL thì vấn đề cấu hình từng bảng cơ sở dữ liệu để sao lặp cần có những chuyên gia am hiểu nhiều về hệ thống. Qui trình: là thành phần GIS bị tác động nhiều nhất. Ví dụ như: thời gian để dữ liệu được đồng bộ sẽ ảnh hưởng đến các giao tác như: giao tác về kinh tế, về ngân hàng, về các ứng dụng phòng chống thiên tai, Con người và các yếu tố liên quan đến: thực sự việc chọn lựa hệ thống sao lặp sẽ ảnh hưởng đến thời gian tập huấn và số người cần thiết để vận hành hệ thống. Nếu hệ thống được vận hành đơn giản thì việc tập huấn sẽ ít. Và một hệ thống phức tạp sẽ cần những chuyên gia chuyên ngành. Khi đó, nhân sự hệ thống cần đào tạo trong thời gian dài với nhiều kiến thức chuyên môn để vận hành hệ thống. Những chuyên gia trong sao lặp phải nắm bắt được các cấu hình khác nhau nhằm nâng cao tính bảo mật dữ liệu, không đồng bộ nhầm. 2.2. Đồng bộ dữ liệu trong một số hệ quản trị CSDL thường sử dụng 2.2.1.Đồng bộ dữ liệu trong hệ thống quản trị cơ sở dữ liệu Với các hệ thống quản trị CSDL như Microsoft SQL Server, chức năng đồng bộ dữ liệu thuộc tính được xây dựng từ các phiên bản. Trong đó, các mô hình truyền thống thường được biết đến là: Snapshot replication: mang ý nghĩa tương tự như full backup, nghĩa là sao chép toàn bộ dữ liệu (có thay đổi và kể cả không thay đổi) từ máy nguồn sang các máy đích và thay thế toàn bộ dữ liệu tồn tại trên các máy đích. Thông thường, dạng đồng bộ này được sử dụng khi có nhu cầu hoặc công việc cập nhật định kỳ, ví dụ theo tuần, tháng, quý hoặc năm. Transactional replication: ở một nơi nào đó, chỉ những dữ liệu có thay đổi được gởi đi. Các giao tác (transaction) được truyền đi theo thứ tự tuần tự, và chỉ chuyển đi các câu lệnh transaction (thay vì dữ liệu). Dữ liệu ở các site không mâu thuẫn nhau vì ta chỉ lấy dữ liệu có sự thay đổi ở một nới chép cho các nơi khác. Merge replication: dữ liệu ở nhiều nơi thay đổi khác nhau. Định kỳ, những thay đổi sẽ được merge (trộn) lẫn nhau và giải quyết các xung đột/mâu thuẫn (conflicts). Phương pháp này không đảm bảo tính nhất quán dữ liệu.

Mỗi loại đồng bộ được sử dụng tùy thuộc vào ứng dụng. Do đó, SQL Server cung cấp 03 đối tượng: nơi phát hành dữ liệu (publisher), nơi phân phối dữ liệu (distributor) và nơi nhận dữ liệu (subscriber). Và, SQL Server cũng hỗ trợ những mô hình vật lý như sau: Central Publisher/Distributor: một máy trung tâm làm cả hai nhiệm vụ phát hành và phân phối; các máy còn lại nhận dữ liệu. Trong mô hình này, dữ liệu được đẩy đi từ một trung tâm, nên người quản trị mạng (Administrator) phải đảm bảo dữ liệu truyền đến các nơi khác chỉ được phép chọn để xem (SELECT), ngoài ra không được phép sửa chữa. Central Subcriber/ Multiple Publishers: một máy trung tâm nhận dữ liệu, các máy còn lại làm nhiệm vụ phát hành và phân phối dữ liệu về trung tâm. Trong mô hình này, điều quan trọng là chúng ta phải đảm bảo tất cả dữ liệu trên từng server là duy nhất (nếu không các Publisher khác sẽ ghi đè (overwrite) dữ liệu lên nhau. Do đó, chúng ta cần có sự lọc (filter) dữ liệu theo chiều ngang trong trường hợp này. Cụ thể hơn, chúng ta có thể phân dữ liệu theo thuộc tính như các đơn vị phường/xã trong quận hoặc quận/huyện theo thành phố. Multiple Publishers/Multiple Subcribers: các máy ngang hàng với nhau, vừa nhận dữ liệu (Subcriber), vừa phân phối dữ liệu (Publisher/Distributor). Chúng ta cần phải lưu ý và phân tích tính nhất quán của dữ liệu khi sử dụng mô hình. Mặt khác, dữ liệu phải được lọc (filter) hoặc việc phân chia dữ liệu (partitioning) hợp lý. Ví dụ: máy chủ Phòng Kinh tế tại quận/huyện chỉ được cập nhật dữ liệu thông tin trường dữ liệu hộ có đăng ký kinh doanh trên lớp thửa còn các máy chủ tại phường/xã chỉ được cập nhật thông tin trường dữ liệu đăng kí thu gom rác cho mỗi hộ; và Phòng Tài nguyên môi trường quận/huyện chỉ được cập nhật các thông tin thuộc trường dữ liệu hộ bị xử phạt môi trường. 2.2.2. Đồng bộ dữ liệu trong các hệ thống mã nguồn mở Postgres Trên hệ thống Postgres, đến nay, t ừ phiên bản PostgreSQL 9.0 được trang bị chức năng đồng bộ (sao lặp) dữ liệu trên gói Streaming. Hệ thống đồng bộ/sao lặp streaming hoạt động dựa trên cơ chế WAL. Và hệ thống Streaming là hệ thống sao lặp bất đồng bộ. Bên cạnh đó, chúng ta có hệ thống đồng bộ và sao lặp Slony (phát âm tiếng Nga có nghĩa là con voi). Hệ thống Slony cũng là một hệ thống sao lặp bất đồng bộ. Dưới đây là một số so sánh giữa hệ thống Streaming và hệ thống Slony. TT Tiêu chí so sánh Hệ thống Streaming Hệ thống Slony 1 Nền tảng cơ chế Theo WAL Theo trigger 2 Có thể sao lặp đến các máy con khác 3 Đồng bộ toàn bộ dữ liệu (đầy đủ các đối tượng) có Có 4 Chỉ đồng bộ một lần không không 5 Cấu hình hệ thống: máy chủ và máy khách phải giống như nhau Có có Có Không

Ngoài ra, khi sử dụng hệ quản trị CSDL Postgres, chúng ta có một số các phần mềm (đóng) sao lặp/đồng bộ như: Mammoth Replicator. 2.3. Đồng bộ dữ liệu trong một số hệ quản trị CSDL thường sử dụng 2.3.1. Mô hình đồng bộ dữ liệu theo quản lý phiên bản (versioning checkout/checkin) Trong các phiên bản ArcGIS 8.3 đến ArcGIS 9.1, mô hình quản lý theo phiên bản (versioning) được giới thiệu. Khi đó, một phiên bản cha sẽ tạo ra các phiên bản con. Và người sử dụng được phân quyền truy cập đến từng phiên bản. Khi hoàn thành các thao tác cập nhật, người sử dụng sẽ sử dụng các thao tác checkin để đưa dữ liệu đồng bộ với phiên bản cha. Và người sử dụng có thể check out dữ liệu thành personal geodatabase nhằm phục vụ việc cập nhật không kết nối với máy chủ (disconnected editing). Tuy nhiên, giới hạn về công nghệ của phương pháp này là chúng ta chỉ được check in 1 lần duy nhất. Do đó, nếu dữ liệu được hiệu chỉnh nhiều lần, chúng ta phải tạo nhiều bộ dữ liệu đồng bộ checkout. Hình 2: Mô hình chỉ đồng bộ được 1 lần duy nhất. 2.3.2. Mô hình đồng bộ dữ liệu hai chiều (twoway) Hình 3: Dữ liệu có thể đồng bộ nhiều lần theo hai chiều Trong mô hình này, chúng ta có thể đồng bộ nhiều lần mà không cần tạo dữ liệu đồng bộ checkout nhiều lần. Những thay đổi sẽ được chuyển từ máy cha sang máy con và ngược lại. Cơ chế này phù hợp với mô hình hai tổ chức hoặc hai phòng ban (ví dụ: một ở Hà Nội và một ở TP.Hồ Chí Minh) cần chia sẻ chung dữ liệu.

Hình 4: Mô hình đồng bộ hai chiều 2.3.3. Mô hình đồng bộ dữ liệu một chiều (oneway) Mô hình đồng bộ một chiều tương tự mô hình đồng bộ hai chiều là chúng ta có thể gửi dữ liệu nhiều lần sau khi đồng bộ. Tuy nhiên, dữ liệu chỉ gửi được một chiều (chiều từ máy chủ chứa dữ liệu cha đến máy chủ chứa dữ liệu con ). Mô hình phù hợp với các nơi cung cấp dữ liệu chuẩn cho các đơn vị khác. Hình 5: Mô hình chỉ đồng bộ theo một chiều 2.3.4.Một số trong hệ thống Geodatabase khi đồng bộ Khi sử dụng công nghệ ArcGIS, các cơ chế đồng bộ dữ liệu có thể thực thi trên môi trường mạng cục bộ, webservices, phát hành an toàn trên mạng Internet và cũng có thể thông qua việc sử dụng tập tin XML khi hai CSDL không được kết nối trực tiếp. Cụ thể hơn, các mô hình đồng bộ một chiều và hai chiều phải được thực thi trên hệ thống CSDL ArcSDE (bao gồm các phiên bản geodatabase enterprise, new workgroup và cả personal ArcSDE cài đặt trên hệ thống SQL Server Express). Và do cơ chế đồng bộ được ArcSDE quản lý, nên việc đồng bộ không quan tâm đến các nền phần mềm hệ quản trị CSDL khác nhau khi tham gia đồng bộ. Đối với đồng bộ checkout/checkin, CSDL đồng bộ cha phải là một CSDL geodatabase ArcSDE và CSDL con hoặc sẽ là ArcSDE geodatabase hoặc sẽ là personal geodatabase. Điều kiện sử dụng đồng bộ dữ liệu là: Người sử dụng phải có quyền ghi dữ liệu. Dữ liệu phải được đăng kí phiên bản (không được chọn tham số: move edits to base). Đối với đồng bộ một chiều và hai chiều: mỗi dữ liệu phải có trường GlobalID và tất cả dữ liệu phải lưu trữ cùng một hệ tọa độ. Về bản quyền: sử dụng bản quyền ArcInfo desktop cho các máy khách và ArcSDE, ArcGIS Server Advanced để cung cấp chức năng Web ADF trên máy chủ. Và các phần mềm để hỗ trợ về hạ tầng mạng, như quản trị về bức tường lửa 2.4 So sánh về đồng bộ dữ liệu giữa hệ thống ArcSDE và các hệ quản trị CSDL ArcSDE sử dụng các cơ chế đồng bộ dữ liệu không phải của các hệ quản trị CSDL. Theo đó, nếu sử dụng cơ chế đồng bộ của hệ quản trị hai cơ sở dữ liệu trên hệ thống CSDL geodatabase của ESRI thì chúng ta sẽ gặp những khó khăn sau: Khó khăn về yêu cầu cần hiểu rõ từng bảng trong hệ thống dữ liệu geodatabase. Khó khăn về cơ chế chỉ lọc dữ liệu cần đồng bộ và cấu trúc dữ liệu trong CSDL. Không thể đồng bộ dữ liệu lịch sử. Không thể sử dụng đồng bộ giữa hai hệ quản trị CSDL khác nhau.

ArcGIS hoàn toàn không hỗ trợ việc đồng bộ này. Tuy nhiên, việc đồng bộ CSDL trên các hệ quản trị sẽ có những ưu điểm và cũng là những hạn chế khi đồng bộ theo cơ chế ArcSDE không thực hiện, đó là: Có thể đồng bộ các bảng dữ liệu không được versioned. Có thể đồng bộ toàn bộ CSDL. Có thể cấu hình để đồng bộ hoàn toàn. Ngoài ra, hiện tại, việc đồng bộ dữ liệu trên ArcSDE vẫn còn bị hạn chế khi thay đổi về topology, network và feature dataset, cũng như việc thêm các lớp mô tả quan hệ (relationship class). Mặt khác, đối với các dự án nhỏ, việc sử dụng đồng bộ dữ liệu theo cơ chế geodatabase ArcSDE sẽ cần một khoản đầu tư ban đầu rất lớn về chi phí bản quyền. 2..5. Đề xuất ứng dụng xử lý đồng bộ hóa dữ liệu không gian trong hệ thống mã nguồn mở Từ những phân tích trên, chúng ta sẽ xem xét đến một mô hình áp dụng cho các ứng dụng GIS phù hợp về phạm vi triển khai, công nghệ và kinh phí đầu tư. 2.5.1. Sơ lược về ngôn ngữ truy vấn không gian Ngôn ngữ truy vấn không gian (Spatial SQL) được sử dụng nhiều trong các hệ quản trị CSDL có hỗ trợ không gian như Postgres/PostGIS, Oracle, SQL Server 2008. Hơn thế nữa, spatial SQL hiện nay đã trở thành chuẩn và được nhiều gói phần mềm GIS hỗ trợ, như MapXtreme, Spatialite. Với tập lệnh trang bị để xử lý đối tượng hình học và đối tượng địa lý, chúng ta hoàn toàn có thể thêm, sửa các đối tượng. Hơn thế nữa, chúng ta được trang bị các câu lệnh để thực hiện việc việc phân tích không gian, chồng lớp, buffer, 2.5.2.Lập trình tương tác với hệ quản trị CSDL không gian Postgres/PostGIS Với hệ thống Postgres/PostGIS hoàn toàn mở, chúng ta được trang bị thêm các thư viện lập trình tương tác. Đó là các thư viện mã nguồn mở Npgsql. Bằng cách sử dụng các thư viện Npgsql, chúng ta có thể kết nối đến hệ quản trị CSDL Postgres/PostGIS. Dưới đây là một số minh họa như sau trên môi trường phát triển ứng dụng VB.NET 2005: * Lệnh khai báo thư viện: Imports Npgsql * Các lệnh khai báo đối tượng kết nối: Public NpgConn As Npgsql.NpgsqlConnection Public NpgCmd As Npgsql.NpgsqlCommand * Lệnh tạo đối tượng kết nối đến máy chủ: connectstr = "data source=" & oserver & ";initial catalog=csdlquanhuyen;persist security info=false;user id=sa; password = ;packet size=4096" dbcon = New NpgsqlConnection(conNectStr) dbcon.open() Dim cmd_sqlcommand As New NpgsqlCommand(strSql, dbcon)

2.5.3.Lập trình tương tác với hệ quản trị CSDL không gian SQLite/Spatialite Hệ quản trị CSDL theo mô hình tập tin SQLite được phát triển và sử dụng trên các hệ thống di động. Trong đó, hiện nay, hầu hết các thiết bị di động tiên tiến đều sử dụng như: iphone, ipad và các hê thống sử dụng hệ điều hành Android. Spatilite là một phần mở rộng của hệ SQLite có khả năng lưu trữ các đối tượng không gian và thực hiện các câu lệnh truy vấn không gian (spatial SQL). Một cách đơn giản, vai trò của Spatialite được xem như tương tự với vai trò của thành phần mở rộng PostGIS trong hệ quản trị Postgres. Tương tự như việc tương tác với hệ quản trị CSDL không gian Postgres/PostGIS, chúng ta cũng có thể tương tác với hệ quản trị CSDL không gian theo mô hình tập tin SQLite/Spatialite. Bằng việc sử dụng các gói thư viện động Hình 6: Các gói thư viện động cần thiết cho việc tương tác với Spatialite Chúng ta cũng có các lệnh khai báo để việc truy xuất hệ SQLite/Spatialite như sau: * Lệnh khai báo thư viện: Imports System.Data.SQLite * Các lệnh khai báo đối tượng kết nối: Public sqlitecmd As SQLiteCommand Public sqliteconn As SQLiteConnection * Lệnh tạo đối tượng kết nối đến máy chủ: sqliteconn = New SQLiteConnection("data source="qhuyen.db";version=3;") sqliteconn.open() sqlitecmd = New SQLiteCommand("SELECT load_extension('libspatialite1.dll');", sqliteconn) * Và thực hiện một câu truy vấn đơn giản như sau: sqlitestr = "Select ten_phuong from RanhPhuong" sqlitecmd = New SQLiteCommand(sqlStr, sqliteconn) 2.5.4. Đề xuất mô hình ứng dụng đồng bộ CSDL giữa các hệ Postgres/PostGIS thông qua trung gian SQLite/Spatialite Mô hình ứng dụng đồng bộ CSDL giữa các hệ Postgres/PostGIS thông qua trung gian SQLite/Spatialite được thực hiện trên các nguyên tắc sau: Dữ liệu thêm mới và cập nhật trên mỗi máy chủ Postgres/PostGIS được đánh dấu bằng một trường cờ. Dữ liệu bị xóa sẽ được lưu vết trong một bảng dữ liệu xác định. Dữ liệu đã đồng bộ sẽ xóa trường cờ đánh dấu và xóa những dữ liệu được lưu vết xóa.

Dữ liệu trung gian SQLite/Spatialite sẽ đóng vai trò so sánh các tập dữ liệu giữa các server. Một server Postgres/PostGIS sẽ chuyển dữ liệu trung gian sang tập tin SQLite/Spatilite. Và chúng ta sẽ tạo các công cụ để thực hiện các so sánh như công thức 1. Những dữ liệu mâu thuẫn sẽ được xác định bằng công thức 2. 2.5.5. Tiềm năng ứng dụng trên các hệ thống di động Với phương pháp trên, chúng ta hoàn toàn có thể xây dựng các ứng dụng hỗ trợ cập nhật thông tin trên thiết bị di động, đặc biệt các thiết bị có nền tảng Android. Thật vậy, sử dụng các gói trợ giúp hiển thị như gói gvsig mini (cho hệ điều hành Android), chúng ta dễ dàng lập trình tạo ra các kết nối đến hệ thống CSDL. Khi đó, chúng ta có thể thêm tính năng cập nhật thông tin các điểm và lưu vào tập tin CSDL SQLite. Sau đó, tập tin SQLite sẽ được đồng bộ với máy chủ. Hình 7: Lập trình tương tác mini gvsig trên máy ảo Android Lưu ý: hiện tại, các máy Android cài đặt hệ thống gvsig mini có thể truy cập các cơ sở dữ liệu thông qua các cổng thông tin địa lý (ví dụ như geoserver).

Hình 8 và 9: Minh họa dữ liệu trên cổng thông tin và dữ liệu được tải về từ cổng thông tin trên một máy chạy Android 3. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN Đồng bộ dữ liệu là một công việc quan trọng. Trong bài viết này, các tác giả chứng minh khả năng hình thành một hệ thống đồng bộ dữ liệu không gian đơn giản. Qua đó, chúng ta có thể ứng dụng trong các hệ thống GIS cấp tỉnh thành và quận huyện. Hệ thống đồng bộ dữ liệu còn nên phát triển thêm và thích ứng với nhiều môi trường như: hệ thống thiết kế đạt chuẩn dữ liệu cao, môi trường dữ liệu truy xuất nhiều, môi trường dữ liệu phân tán... TÀI LIỆU THAM KHẢO 1. Bài giảng về cơ sở dữ liệu không gian của TS. Trần Trọng Đức. 2. Bài giảng lập trình GIS của TS. Trần Trọng Đức. 3. http://www.esri.com 4. Trang tin Wikipedia về đồng bộ dữ liệu. 5. http://scanningpages.wordpress.com/2010/10/09/90streamingreplicationvsslony/ 6. Trang tin http://www.gvsig.org/web/ 7. Trang tin cổng thông tin Thành phố Hồ Chí Minh: http://hcmgisportal.vn SUMMARY DISCUSSING ON SPATIAL DATA REPLICATION

This paper presents some data and GIS data replication respects. Replication is the need for system having updating by mobile components or having seperated process but we want data to be unified. Districtstoward management is the one system of them. Especialy in GIS, data are often large proportion of the whole cost as well as manpower involved in the maintenance process. Therefore, data synchronization is a inneed problem of GIS applications. This paper direction is to show the reader the initial step to get a low cost GIS data replication for Postgres/PostGIS database.