CÔNG NGHỆ, KỸ THUẬT MỚI, ĐƯỢC ỨNG DỤNG TRONG CÔNG TÁC DỰ BÁO, CẢNH BÁO VÀ QUY HOẠCH TÀI NGUYÊN NƯỚC

 

CÔNG NGHỆ, KỸ THUẬT MỚI, ĐƯỢC ỨNG DỤNG TRONG CÔNG TÁC DỰ BÁO, CẢNH BÁO VÀ QUY HOẠCH TÀI NGUYÊN NƯỚC

Cao Hoàng Hải, Trần Anh Phương, Trần Nhật Anh, Thái Quỳnh Như, Lê Hữu Hoàng 

Viện Khoa học tài nguyên nước Bộ Tài nguyên và Môi trường

 

1. Mở đầu

Việc dự báo được chính xác lưu lượng của dòng chảy trong các lưu vực sông, suối đóng vai trò then chốt trong rất nhiều ứng dụng của lĩnh vực thủy văn và tài nguyên nước ví dụ như quản lý, quy hoạch tài nguyên nước, cảnh báo và phòng ngừa nguy cơ lũ lụt hay tối ưu hóa các nhà máy xử lý nước thải v.v. Cho đến nay đã có rất nhiều các mô hình mô phỏng và dự báo lưu lượng dòng chảy đã được phát triển, trong đó các mô hình dựa trên đặc tính vật lý và quá trình của dòng chảy được sử dụng tương đối rộng rãi do khả năng mô phỏng chính xác các quá trình vật lý và có tiềm năng cao trong việc thực hiện các phân tích tính nhạy cảm một cách toàn diện (Elsafi, 2014), hơn nữa các mô hình này rất hữu ích cho các nhà khoa học trong việc giải thích được toàn bộ quá trình ẩn đẳng sau (VanderKwaak and Loague, 2001). Tuy nhiên, việc sử dụng các mô hình này thường yêu cầu một lượng dữ liệu lớn về các đặc tính của lưu vực, bên cạnh nó việc hiệu chỉnh và kiểm định mô hình cũng rất phức tạp và đòi hỏi nhiều thời gian và kinh nghiệm của người chạy mô hình. Vì vậy, khả năng áp dụng loại mô hình này ở nhiều lưu vực vẫn còn nhiều hạn chế, đặc biệt là ở các vùng gặp khó khăn về quan trắc và thu thập số liệu.

ANN là một chương trình máy tính được thiết kế để mô phỏng bộ não con người để có khả năng ‘học’ các tác vụ/nhiệm vụ được giao. Khác với các chương trình máy tính thông thường, ANN được ‘huấn luyện’ để nhận ra/tìm ra, khái quát hóa mối quan hệ giữa dữ liệu đầu vào và đầu ra, hoặc đưa ra một câu trả lời cho một vấn đề cụ thể.

 

2. Giới thiệu đôi nét về lưu vực nghiên cứu

Lưu vực sông Ba là một trong 9 lưu vực sông lớn ở Việt Nam, thuộc địa phận của 4 tỉnh: Gia Lai, Đăk Lăk, Phú Yên và một phần nhỏ thuộc Kon Tum. Phạm vi lưu vực nằm trong khoảng 12035’ - 14038’ vĩ độ Bắc, 180000’ - 190055’ kinh độ Đông với diện tích lưu vực là 13.900 km2. Phía Bắc giáp thượng nguồn sông Trà Khúc, Bắc và Tây Bắc giáp sông Sê San, Tây và Tây Nam giáp sông Srepok. Phía Nam giáp sông Bàn Thạch. Phía Đông là dải Trường Sơn Đông ngăn cách với các lưu vực sông Kone, sông Kỳ Lộ. Sông Ba đổ ra biển Đông ở Đồng Bằng Tuy Hoà tỉnh Phú Yên. Hệ thống sông Ba có mật độ lưới sông là 0,22 km/km2; sông chính sông Ba có chiều dài là 372 km. Sông Ba thuộc loại sông kém phát triển so với các sông khác vùng lân cận. Trong đó, ba sông nhánh lớn nhất là Iayun, Krong Hnang và sông Hinh đều nằm bên phía hữu ngạn.

Lưu vực sông Ba đại bộ phận nằm ở phía Tây dải Trường Sơn, chỉ có phần nhỏ ở hạ lưu nằm phía sườn Đông Trường Sơn. Do tác dụng của dãy Trường Sơn mà lưu vực sông Ba chịu ảnh hưởng mạnh mẽ của hai kiểu khí hậu gió mùa Đông Trường Sơn và Tây Trường Sơn mang lại khá rõ rệt.

 

Hình 1: Mạng lưới trạm khí tượng thủy văn trên lưu vực sông Ba

 

3. Giới thiệu mô hình ANN

Mạng thần kinh nhân tạo (Artificial Neural Network - ANN) là một trong các phương pháp phổ biến trong học máy (Machine Learning - ML), được xây dựng dựa trên ý tưởng mô phỏng chức năng của não bộ con người trong việc “học” để thực hiện các nhiệm vụ mà không cần phải lập trình theo các quy tắc cụ thể. Do vậy, ANN là một phương pháp hiệu quả để xử lý mối quan hệ phi tuyến phức tạp giữa dữ liệu đầu vào và đầu ra của một hệ thống với hiệu quả khá cao (Aydın et al., 2014). ANN có thể được áp dụng hiệu quả trong các vấn đề liên quan đến nhận dạng, phân loại, ước tính và tối ưu hóa.

Cấu trúc cơ bản của một ANN thường bao gồm các node gọi là neuron. Các neuron này được nhóm vào trong các lớp dữ liệu đầu vào (input), dữ liệu đầu ra (output) và một hoặc nhiều các lớp ẩn (hidden layer). Cấu trúc của một ANN 3 lớp được trình bày ở Hình 2.

 

 

Hình 2: Sơ đồ mô hình mạng thần kinh nhân tạo 3 lớp

Có sáu loại hình mạng thần kinh nhân tạo, tuy nhiên hai loại phổ biến nhất là Mạng Neuron Hồi Quy (Recurrent Neural Network - sau đây gọi là RNN ) và Mạng Neuron Nhân Tạo Truyền Thẳng (Feedforward Neural Network - sau đây gọi là FNN). Trong đó:

  • RNN sử dụng các liên kết giữa các node để tạo ra một sơ đồ được định hướng như là một chuỗi, qua đó cho phép dữ liệu chuyển tới và lui. Mạng này thực hiện cùng một tác vụ cho tất cả các phần tử của một chuỗi với đầu ra phụ thuộc vào cả các phép tính trước đó. Nói cách khác, RNN có khả năng nhớ các thông tin được tính toán trước đó. Do đó, loại mạng này được áp dụng khá phổ biến trong các ứng dụng liên quan đến nhận dạng giọng nói và chữ viết. (Hình 3)
  • FNN là một trong những dạng mạng neuron nhân tạo cơ bản nhất và thường được sử dụng cho các bài toán hồi quy và phân loại. Khác với RNN¸ trong FNN dữ liệu chỉ được xử lý trên một chiều duy nhất nghĩa là dữ liệu từ lớp đầu vào sẽ chỉ được chuyển qua các lớp ẩn để tính toán và kết quả tính toán sẽ được chuyển tiếp qua lớp đầu ra để tạo ra dữ liệu đầu ra.

Hình 3: Cấu trúc mạng neuron hồi quy

 

4. Xây dựng mô hình mạng thần kinh nhân tạo phục vụ cho kiểm kê và dự báo TNN cho lưu vực sông Ba

    1. Số liệu sử dụng

Hệ thống các trạm quan trắc khí tượng thủy văn trong trong lưu vực sông Ba và các vùng lân cận được biểu diễn trong Hình 1. Tuy nhiên, việc quan trắc lượng mưa ở các trạm này lại khác nhau, chủ yếu là bắt đầu từ năm 1977. Đối với việc quan trắc thủy văn trên lưu vực, những đo đạc đầu tiên được tiến hành bằng việc quan trắc mực nước tại đập Đồng Cam trước những năm 1940, nhưng việc quan trắc mực nước giai đoạn này có nhiều gián đoạn và không có hệ thống. Từ năm 1967 trở về sau này, tại trạm thủy văn An Khê việc quan trắc các yếu tố mực nước, lưu lượng mới tiến hành có hệ thống. Tuy việc đo đạc thủy văn tại đây có bị gián đoạn nhưng nhìn chung chuỗi tài liệu đo đạc tại trạm thủy văn An Khê từ năm 1967 đến nay là đáng tin cậy. Ngoài ra, trạm thủy văn Củng Sơn bắt đầu đo đạc lưu lượng, mực nước, bùn cát từ năm 1977. Với mục tiêu thử nghiệm ANN, nhóm nghiên cứu chỉ giới hạn sử dụng số liệu mưa và lưu lượng ở cho việc mô phỏng và dự báo dòng chảy tại hai trạm An Khê và Củng Sơn.

Do điều kiện khí tượng thủy văn phức tạp, phân tích tương quan giữa số liệu mưa ở các trạm khí tượng và dòng chảy ở hai trạm An Khê và Củng Sơn đã được thực hiện để loại bỏ các trạm không thể hiện hoặc có độ tương quan thấp. Do đó, nghiên cứu này chỉ sử dụng dữ liệu ở 7 trạm mưa, 2 trạm đo bốc hơi, và 1 trạm đo lưu lượng có độ tương quan tốt với trạm Củng Sơn ( R ≥ 0.4) để tính toán. Danh sách các trạm đo được sử dụng trong nghiên cứu này được trình bày ở Bảng 1.

Tuy nhiên, để đảm bảo sự đồng nhất trong dữ liệu đầu vào và đầu ra tránh các trường hợp các trạm có số liệu không đầy đủ trong thời gian dài và ảnh hưởng của việc điều tiết hồ chứa, các trạm không đảm bảo chất lượng sẽ bị loại bỏ và số liệu sử dụng để tính toán là từ năm 1982 - 2004 (trước khi hồ An Khê đi vào hoạt động). Các trường hợp tính toán khác nhau được trình bày trong Bảng 2 để thử nghiệm mạng ANN trong các điều kiện số liệu đầu vào khác nhau.

Bảng 1: Số liệu khí tượng thủy văn trong lưu vực sông Ba

 

Tên trạm

Tọa độ

Thời đoạn và các yếu tố quan trắc

 

Kinh độ

 

Vĩ độ

 

Mưa

Dòng chảy

Bốc hơi

Mực nước

An Khê

108 0 38’

13 0 57’

1977 - nay

1978-2016

1980-2016

-

Sơn Hòa

108 0 59’

12 0 03’

1978 - nay

-

-

-

Tuy Hòa

109 0 17’

13 0 05’

1976 - nay

-

1980-2016

-

 

Sơn Thành

109o01’

12o05’

1978 -

nay

 

-

 

-

 

-

Củng Sơn

108 0 59’

13 0 02’

1977 - nay

1977 - nay

-

-

KrongPa

107o04’

13 0 15’

1979 - nay

-

 

-

Bồng Sơn

 

 

1976 - nay

-

-

-

 

 

Tên trạm

Tọa độ

Thời đoạn và các yếu tố quan trắc

 

Kinh độ

 

Vĩ độ

 

Mưa

Dòng chảy

Bốc hơi

Mực nước

Ayunpa

 

 

-

-

-

1977-2016

Bảng 2: Các trường hợp tính toán

    1. Kết quả ứng dụng

Việc xử lý số liệu và huấn luyện mạng ANN được thực hiện bằng thư viện caret của ngôn ngữ lập trình R. Kết quả tính toán cho thấy cấu trúc mạng tối ưu và các chỉ số kiểm định cho các trường hợp tính toán như sau:

Bảng 3: Cấu trúc mạng ANN tối ưu và các chỉ số kiểm định

Trường hợp

Cấu trúc mạng*

RMSE

R2

TH1

7 - 20 - 1

411.09

0.42

TH2

8 - 20 - 1

371.43

0.54

TH3

9 - 20 - 1

301.71

0.68

TH4

10 - 25 - 1

313.17

0.67

TH5

12 - 26 - 1

308.02

0.68

TH6

8 - 33 - 1

156.01

0.78

TH7

10 - 23 - 1

98.97

0.92

TH8

11 - 35 -1

103.23

0.91

TH9

3 - 33 - 1

50.63

0.63

TH10

3 - 35 - 1

7.19

0.98

 

*Số neuron ở 3 lớp (đầu vào - ẩn - đầu ra)

Diễn biến dòng chảy tại các trạm Củng Sơn và An Khê qua các trường hợp tính toán được thể hiện từ Hình 4 đến Hình 13.

 

Hình 4: Diễn biến lưu lượng tính toán TH1

               Hình 5: Diễn biến lưu lượng tính toán TH2

                       

                Hình 6: Diễn biến lưu lượng tính toán TH3

                       

                 Hình 7: Diễn biến lưu lượng tính toán TH4

                   

                 Hình 8: Diễn biến lưu lượng tính toán TH5

                          

                 Hình 9: Diễn biến lưu lượng tính toán TH6

                   

                   Hình 10: Diễn biến lưu lượng tính toán TH7

                             

                 Hình 11: Diễn biến lưu lượng tính toán TH

                       

                   Hình 12: Diễn biến lưu lượng tính toán TH9

                     

                     Hình 13: Diễn biến lưu lượng tính toán TH10

 

5. Nhận xét

Từ các chỉ số kiểm định và diễn biến lưu lượng tính toán, ta có thể thấy rằng mạng ANN có khả năng mô phỏng và dự báo (sử dụng số liệu của bước thời gian trước để dự báo bước thời gian sau) tốt đối với các trường hợp sử dụng số liệu theo tháng (các TH 6,7,8, 10), trong khi đó đối với chuỗi số liệu theo ngày, mô hình ANN chưa đưa ra được kết quả tối ưu. Cụ thể, số liệu mô phỏng của ANN chỉ bắt được xu thế của diễn biến dòng chảy, các cực trị như dòng chảy lớn nhất hay nhỏ nhất chưa được mô phỏng chính xác.

Ngoài ra, khi thử nghiệm ANN với các trường hợp khác nhau về số liệu tính toán cho thấy ANN cho kết quả không tốt khi chỉ sử dụng một loại số liệu đầu vào (mưa ngày tại 7 trạm). Khi số chiều dữ liệu đầu vào tăng lên, thì kết quả mô phỏng cũng tốt hơn rõ rệt. Hơn nữa, khi dữ liệu đầu vào có sự dao động ít (dữ liệu theo tháng), ANN cũng cho kết quả tốt hơn. Điều này trái với nhận định của một số nghiên cứu là ANN có khả năng mô phỏng và dự báo tốt ở những nơi có điều kiện số liệu không hoàn chỉnh, không tốt. Qua đó, có thể thấy rằng để một mô hình ANN có kết quả dự báo chính xác hơn, số liệu đầu vào cần phải được xử lý loại bỏ các yếu tố nhiễu, các chiều dữ liệu cần có độ tương quan cao đề có thể mô tả được hết các mối quan hệ giữa biến đầu vào và đầu ra.

Các trường hợp TH9 và TH10 được thực hiện để kiểm tra trong điều kiện số liệu ít và có độ tương quan cao (mưa và dòng chảy tại trạm An Khê). Tuy nhiên, kết quả cũng cho thấy đối với số liệu nhiều biến động (theo ngày) thì mô hình chưa đưa ra được kết quả tốt, và đối với số liệu ít biến động (theo tháng), thì mô hình cho độ tin cậy rất cao.

Một điểm quan trọng trong quá trình xây dựng và huấn luyện mạng ANN đó là thời gian huấn luyện. Ở trong nghiên cứu này, thời gian huấn luyện trung bình của một mạng ANN cho chuỗi số liệu hơn 25 năm (theo ngày) là khoảng 1 phút đối với máy tính

có cấu hình thông thường (Core i3, Ram 8Gb). Tuy nhiên, đây là thời gian huấn luyện sau khi đã tìm được cấu trúc mạng tối ưu. Nếu phải sử dụng các vòng lặp để tìm ra cấu trúc mạng tối ưu (cho dữ liệu theo ngày) thì thời gian huấn luyện là khoảng 3 đến 10 phút tùy vào số lượng vòng lặp.

 

6. Kết luận

Ứng dụng mạng thần kinh nhân tạo ANN trong mô phỏng và dự báo tài nguyên nước là một hướng tiếp cận không quá mới mẻ, tuy nhiên với sự phát triển của các thuật toán học máy, học sâu… đã giúp cho ANN có nhưng ưu thế hơn so với các mô hình mưa dòng chảy truyền thống. Các ưu điểm chính bao gồm: khả năng thiết lập nhanh chỉ dựa vào dữ liệu, khả năng mô phỏng nhanh, độ chính xác ở nhiều trường hợp là tốt hơn so với mô hình truyền thống.

Với những ưu điểm đó, nhóm nghiên cứu đã thử nghiệm một trong những mạng ANN cơ bản được áp dụng rộng rãi trong nhiều nghiên cứu trên thế giới đó là mạng neuron lan truyền tiến - FNN với thuật toán tối ưu lan truyền ngược - backpropagation cho trạm An Khê và Củng Sơn ở lưu vực sông Ba.

Kết quả tính toán ở các trường hợp dữ liệu khác nhau cho thấy ANN có khả năng mô phỏng dòng chảy với số liệu đầu vào theo tháng là rất tốt và có thể sử dụng cho các bài toán dự báo tài nguyên nước. Tuy nhiên, với bộ số liệu có độ dao động cao (theo ngày) và ít thuộc tính, ANN chưa có kết quả tốt. Ngoài ra, thời gian huấn luyện, theo nhóm nghiên cứu là chưa nhanh hơn so với một số mô hình truyền thống. Để có kết quả chính xác hơn, cần phải chuẩn bị dữ liệu để loại bỏ dữ liệu nhiễu và thêm các chiều dữ liệu có độ tương quan cao.

Nghiên cứu mới chỉ ở bước ban đầu là thử nghiệm mô hình ANN với các thuật toán phổ biến nên kết quả có thể chưa được tối ưu do kinh nghiệm của người xây dựng mô hình. Một số phương pháp khác trong học máy như Support Vector Machine, Random Forest, hay Adaptive Neuro Fuzzy cũng được nhiều nghiên cứu cho thấy kết quả khả quan. Trong thời gian tới, ngoài việc tối ưu hóa mạng ANN, thử nghiệm các phương pháp khác nhau để tìm ra mô hình tối ưu phục vụ cho dự báo tài nguyên nước ở lưu vực Sông Ba là cần thiết.

 

TÀI LIỆU THAM KHẢO

  1. Aichouri, I., Hani, A., Bougherira, N., Djabri, L., Chaffai, H., Lallahem, S., 2015. River Flow Model Using Artificial Neural Networks. Energy Procedia 74, 1007–1014.
  2. Anusree, K., Varghese, K.O., 2016. Streamflow Prediction of Karuvannur River Basin Using ANFIS, ANN and MNLR Models. Procedia Technol. 24, 101–108.
  3. Aydın, M.M., Yıldırım, M.S., Karpuz, O., Ghasemlou, K., 2014. Modeling of Driver Lane Choice Behavior with Artificial Neural Networks (ANN) and Linear Regression (LR) Analysis on Deformed Roads. Comput. Sci. Eng. An Int. J. 4, 47–57.
  4. Bazartseren, B., Hildebrandt, G., Holz, K., 2003. Short-term water level prediction using neural networks and neuro-fuzzy approach. Neurocomputing 55, 439–450.
  5. Chang, L.-C., Chang, F.-J., 2001. Intelligent control for modelling of real-time reservoir operation. Hydrol. Process. 15, 1621–1634.
  6. Dixon, B., B., 2005. Applicability of neuro-fuzzy techniques in predicting ground-water vulnerability: a GIS-based sensitivity analysis. J. Hydrol. 309, 17– 38.
  7. Elsafi, S.H., 2014. Artificial Neural Networks (ANNs) for flood forecasting at Dongola Station in the River Nile, Sudan. Alexandria Eng. J. 53, 655–662.
  8. Gaume, E., Gosset, R., 2003. Over-parameterisation, a major obstacle to the use of artificial neural networks in hydrology? Hydrol. Earth Syst. Sci. 7, 693–706.
  9. Ghumman, A.R., Ghazaw, Y.M., Sohail, A.R., Watanabe, K., 2011. Runoff forecasting by artificial neural network and conventional model. Alexandria Eng. J. 50, 345–350.
  10. Jang, J.-S.R., 1993. ANFIS: adaptive-network-based fuzzy inference system. IEEE Trans. Syst. Man. Cybern. 23, 665–685.
  11. Joorabchi, A., Zhang, H., Blumenstein, M., 2007. Application of artificial neural networks in flow discharge prediction for the Fitzroy River , Australia 2007, 287–291.
  12. Maier, H.R., Dandy, G.C., 2000. Neural Network for the prediction and forecasting of water resources variables: a review of modeling issues and application. Environ. Model. Softw. 15, 101–124.
  13. Mehrkesh, A., Ahmadi, M., 2014. Forecasting the Colorado River Discharge Using an Artificial Neural Network ( ANN ) Approach. Arxiv Sanity Preserv. 11.
  14. Panda, R.K., Pramanik, N., Bala, B., 2010. Simulation of river stage using artificial neural network and MIKE 11 hydrodynamic model. Comput. Geosci. 36, 735–745.
  15. Rahsepar, M., Mahmoodi, H., 2014. Predicting Weekly Discharge Using ANN Optimized by Artificial Bee Colony Algorithm. Civ. Eng. Urban Plan. An Int. J. 1, 1–11.
  16. VanderKwaak, J.E., Loague, K., 2001. Hydrologic-Response simulations for the R-5 catchment with a comprehensive physics-based model. Water Resour. Res. 37, 999–1013.
  17. Veintimilla-Reyes, J., Cisneros, F., Vanegas, P., 2016. Artificial Neural

 

Networks Applied to Flow Prediction: A Use Case for the Tomebamba River. Procedia Eng. 162, 153–161.

  1. Wang, W., Gelder, P.H.A.J.M. Van, Vrijling, J.K., Ma, J., 2006. Forecasting daily streamflow using hybrid ANN models. J. Hydrol. 324, 383–399.
  2. Xu, Z.X., Li, J.Y., 2002. Short-term inflow forecasting using an artificial neural network model. Hydrol. Process. 16, 2423–2439.
  3.  

 

 

 VienKHTNN.Core - VienKHTNN_SuKien

BÀI VIẾT LIÊN QUAN

CUỘC THI TÌM HIỂU VỀ CÁC DÒNG SÔNG BẮC GIANG

Thông cáo báo chí về việc tổ chức Cuộc thi “Tìm hiểu lịch sử và giá trị sử dụng của

 VienKHTNN.Core - VienKHTNN_LienKet

 VienKHTNN.Core - VienKHTNN_AnPham_Phai

ẤN PHẨM NỔI BẬT

 Content Editor