Tuesday, January 29, 2019

Nguyên nhân và Cách kiểm tra sai số liệu đầu kỳ trong FRMS


Hiện tại là thời điểm báo cáo số liệu tài nguyên rừng của các đơn vị lên Cục Kiểm lâm và Tổng cục Lâm nghiệm. Về cơ bản tôi thấy ở một số đơn vị ở các tỉnh mà tôi phụ trách trước đây thì số liệu nhập là khá tốt, vẫn còn một số sai sót nhưng với công cụ hỗ trợ Checker Tool thì hầu hết lỗi người dùng đã được tìm thấy và sửa lại để số liệu trong năm chính xác. Tuy nhiên khá nhiều đơn vị vẫn bị lổi sai số liệu đầu khi khi in báo cáo, lổi như sau:

- Cuối năm 2017 anh chị chốt số liệu báo cáo là : X
- Qua năm 2018 anh chị nhập diễn biến, thay đổi hiện trạng rừng (không thêm và xóa dữ liệu diễn biến 2017), tuy nhiên khi in lại báo cáo năm 2017 thì lại thấy số liệu hiện tại có một số thay đổi so với năm ngoái (có thể rừng tự nhiên giảm, đất tăng ...)

Nguyên nhân có thể như sau:

Trường hợp 1: Năm 2017, do lúc đó mới đưa vào sử dụng phần mềm nên trong quá trình làm anh chị thay đổi thuộc tính của rất nhiều lô rừng (không có diễn biến) nhưng lại không phát hiện được (chưa có checker tool) và lấy số liệu đó báo cáo. Qua năm 2018 khi nhập diễn biến 2018 xong, anh chị lấy Checker Tool để kiểm tra số liệu thì thấy có khác nhiều lô sai, sau đó anh chị tiến hành sửa tất cả các lô sai đó về trạng thái đúng. Những lô sai này bao gồm cả năm 2018 lẫn 2017 nên khi anh chị sửa lại trạng thái của lô đã được báo cáo 2017 thì việc in báo cáo ra khác với cuối năm 2017 là hoàn toàn hợp lý.

Trường hợp 2: Năm 2017 báo cáo và số liệu chính xác, không có lổi người dùng. Tuy nhiên qua năm 2018 trong quá trình cập nhật anh chị làm thay đổi hiện trạng rừng của một số lô (không có diễn biến phát sinh) dẫn đến việc khi in lại báo cáo, số liệu tính cho lô đó cũng bị thay đổi theo (khác với trước đó)

Trường hợp 3: Năm 2018, các anh chị cập nhật diễn biến nhầm vào năm 2017 hoặc các anh chị xóa lô hoặc xóa diễn biến của 1 lô nào đó trong năm 2017 làm số liệu diễn biến năm 2017 tại thời điểm này khác với số liệu diễn biến tại thời điểm cuối năm 2017 khi anh chị làm cáo báo.

Cơ bản là 3 nguyên nhân đó, giờ phương án để tìm ra như sau:

- Đầu tiên xuất biểu 8a của 2 bản phần mềm ra đối chiếu xem nó giống nhau không (giống về tổng số diễn biến, tổng diện tích diễn biến, thậm chí là nếu sai ở giá trị rừng trồng thì phải phân tích đầu kỳ, cuối kỳ của rừng trồng trong bảng 8a xem có khác nhau không). Nếu 2 bảng của 2 thời điểm giống nhau là OK, anh chị không bị dính vào trường hợp 3 nêu trên. Chổ này ai cũng làm được.

- Tiếp đến, còn 2 trường hợp 1 và 2 chúng ta phải đi phân tích, đối chiếu số liệu của phiên bản và dùng bản đồ để xác định lô nào là lô sai khác giữa 2 thời điểm. Chổ này khá nhiều kỹ thuật và anh chị phải thành thạo về QGIS và Cơ sở dữ liệu cũng như tư duy về số liệu mới có thể thực hiện được.

Ở bước này mỗi lần làm, chúng ta chỉ có thể kiểm tra được 1 thông số trên báo cáo. Ví dụ trường hợp ta phát hiện rừng tự nhiên bị giảm ở cột rừng sản xuất ở xã Vĩnh Sơn - có mã 21787

Bước 1: Xuất lớp rừng tự nhiên ở phiên bản báo cáo năm 2017 (số liệu đúng). Lúc này ta phải biết về cấu trúc CSDL để xuất được lớp rừng này cho chính xác:

  • Rừng tự nhiên có mã loại đất loại rừng từ 1-59, đối với các tỉnh ở Tây Nguyên có thêm mã 94-98.
  • Rừng sản xuất: có mã mục đích sử dụng từ 9-12
  • Xã có mã: 21787
Với 3 dữ kiện trên ta vào chức năng "Chọn theo biểu thức" để lọc ra các lô rừng mà ta cần.


Thêm lệnh lọc vào


Lệnh lọc như sau: commune_code=21787  and forest_type_code>=1 and forest_type_code<=59 and forest_func_sub_code in (9,10,11,12)


Sau đó lưu thành lớp 2017 để làm cơ sở đối chiếu



ta có lớp rừng tự nhiên, sản xuất của xã Vĩnh Sơn 2017



Bước 2: Sau khi ta có được lớp rừng tự nhiên số liệu chuẩn, ta thoát khỏi phần mềm cũ đi, mở bản mới đang sử dụng để lấy số liệu hiện tại. Mục đích là để đối chiếu với số liệu cũ xem thiếu thừa thế nào.

Tuy nhiên dữ liệu ở phần mềm đang sử dụng lại có dữ liệu năm 2018, nếu ta dùng câu lệnh trên để lọc ra thì nó sẽ cho kết quả là lớp rừng tự nhiên đã thay đổi do có diễn biến trong năm 2018 + thay đổi không có phát sinh diễn biến nên ta không thể biết được vùng nào là thay đổi đúng, vùng nào là thay đổi sai. Vậy ở dữ liệu hiện tại ta phải xuất ra 3 lớp:

  • Lớp thứ nhất là rừng tự nhiên đến thời điểm hiện tại (gồm rừng TN 2017 + Phát sinh do diễn biến + thay đổi không có diễn biến)
  • Lớp thứ 2 là lớp rừng TN bị mất đi do diễn biến
  • Lớp thứ 3 là lớp rừng TN sinh ra do diễn biến (chỉnh sử dữ liệu) thường lớp này ko có.
Sau đó ta chồng 3 lớp này lên, đối chiếu thay đổi với lớp 2017 đã xuất ra trước đó và lô rừng nào không trùng khớp dữ liệu ở các lớp trên thì chính là lô mà ta tìm kiếm.

Hết phần 1.

Không biết có ai hiểu không!

Tag: kiem tra so lieu dau ky
Nếu thấy hữu ích hảy chia sẻ bài viết này trên:  

6 comments:

  1. Thế còn lỗi không có dữ liệu diễn biến gốc dẫn đến dữ liệu đầu vào không hợp lý thì sao anh? Ví dụ: Năm 2018, cập nhật chăm sóc lô 1 thành rừng, đến năm 2019 có khai thác nhưng không hết lô một nên cập nhật theo thực tế, lô 1 chia ra lô 1 và 1a trong đó lô 1 chứa dữ liệu diễn biến năm 2018 thì không có vấn đề gì, còn lô 1a khi cập nhật khai thác thì chạy checkertool sẽ báo lô có dữ liệu đầu vào không đúng. Lỗi này xử lý thế nào ạ?

    ReplyDelete
    Replies
    1. Trường hợp này không phải là lổi nhé, chỉ là Checker Tool nó nghi ngờ nên show ra để người dùng kiểm tra thôi. Báo cáo và số liệu là chính xác.

      Delete
  2. Rất bổ ích, cảm ơn Chuyên gia Đài!
    Đề nghị cung cấp thêm câu lệnh lọc các lô có DB phát sinh và các lô có DB mất đi RTN để so sánh.

    ReplyDelete
    Replies
    1. Bài này hướng dẫn lọc các lô rừng có diễn biến theo năm nhé:

      http://www.nguyenxuandai.xyz/2018/12/huong-dan-xuat-lop-ban-do-cua-1-loai-dien-bien-theo-nam.html

      Delete