研究成果
熱帯島嶼河川の栄養塩濃度を機械学習で予測
―沿岸生態系の保全対策への活用に期待―
令和5年6月5日
国際農研
熱帯島嶼河川の栄養塩濃度を機械学習で予測
―沿岸生態系の保全対策への活用に期待―
ポイント
|
概要
国際農研は、機械学習を用いて、沖縄県石垣島の河川水に含まれる栄養塩(窒素、リン、ケイ素)濃度を高い精度で予測する新たなモデルを作成しました。
本研究で作成したモデルは、石垣島の上流域2)の土地利用や表層地層などの流域特性から栄養塩濃度を機械学習手法「ランダムフォレスト」3)により予測するものであり、それぞれの栄養塩に対してどのような流域特性が大きな影響を及ぼしているかについても評価することができます。また、従来のシミュレーションモデル4)の多くは、窒素とリンを対象に栄養塩濃度を推定していましたが、本モデルはこれらに加えてケイ素についても濃度の予測が可能であり、窒素、リンの過剰負荷に起因するサンゴ礁の衰退やケイ素の減少に起因する渦鞭毛藻(うずべんもうそう)など有害藻類発生のリスク評価などへの活用も可能になります。
さらに、陸域から流出する栄養塩の量を推定・予測するためには、河川流量と水質の観測やシミュレーションモデルなどの高度な専門知識・技術の習得ならびに労力が必要でしたが、本モデルでは、流域の土地利用や表層地質、人口密度のデータがあれば比較的簡便な操作で栄養塩濃度を予測することが可能になります。
熱帯島嶼では、気候変動に伴う海洋環境の変化に加えて、陸域からの過剰な栄養塩の流入による、サンゴ礁などの沿岸生態系への悪影響が懸念されています。本研究の成果によって、陸域から流入する栄養塩の量を適正に管理し、健全な沿岸生態系を保全するための施策立案への活用が期待されます。
本研究成果は、「Environmental Pollution」電子版(日本時間2022年11月5日)に掲載されました。
関連情報
発表論文
- 論文著者
- T Kikuchi, T Anzai, T Ouchi, K Okamoto and Y Terajima
- 論文タイトル
- Assessing the impact of watershed characteristics and management on nutrient concentrations in tropical rivers using a machine learning method
- 雑誌
- Environmental Pollution
DOI : https://doi.org/10.1016/j.envpol.2022.120599
問い合わせ先など
国際農研(茨城県つくば市)理事長 小山 修
- 研究推進責任者:
- 国際農研 プログラムディレクター 林 慶一
- 研究担当者:
- 国際農研 生産環境・畜産領域 菊地 哲郎
国際農研 熱帯・島嶼研究拠点 安西 俊彦 - 広報担当者:
- 国際農研 情報広報室長 大森 圭祐
プレス用 e-mail:koho-jircas@ml.affrc.go.jp
開発の社会的背景
栄養塩の主な発生源として、下水処理場や工場など、特定の場所から流れ込む「点源」と、森林や農地などから地表面、地下水を経由して流れ込む「面源」の2つのタイプがあります。「点源」は排水処理対策などにより改善されやすい一方で、「面源」からの栄養塩の輸送経路は複雑であることから、シミュレーションモデルによる推定が一般的ですが、高度な専門知識・技術の習得が課題でした。
研究の経緯
栄養塩の流出量推定を行うシミュレーションモデルの多くは、窒素とリンを対象にしており、ケイ素は扱われていませんでした。主な植物プランクトンである珪藻の生育にはケイ素も必要ですが、ケイ素に対して窒素やリンが過剰に供給されると、珪藻以外の植物プランクトンが増え、特に赤潮の原因となる渦鞭毛藻などの有害藻類の増殖に繋がる可能性も指摘されています。
そこで本研究では、沖縄県石垣島の複数の河川を対象に、ケイ素も加味した水中の栄養塩濃度を測定し、「面源」となる流域の土地利用や地質などの特徴(以下、流域特性)との関係を調べることで、栄養塩濃度に対してどのような影響を及ぼしているのか、機械学習手法の一つであるランダムフォレスト(RF)を用いて評価しました。
研究の内容・意義
- 石垣島の主要な6河川(支流を含む)、計18地点(図1)において、令和2年9月から約1年間、約2ヶ月に1回の頻度で平水時5)に調査を行い、溶存無機態窒素(DIN)6)、全リン(TP)7)および溶存態ケイ素(DSi)の濃度を測定しました。
- 流域特性として、18地点上流域の①土地利用(サトウキビ畑などの農地、牧草地、森林など)の面積割合、②表層地質(琉球石灰岩、国頭礫層など)の面積割合、③人口密度を、GISデータと統計資料により把握しました。
- 河川調査の結果をもとに、RFを用いて、流域特性から各栄養塩濃度を予測するモデルを作成しました。季節による栄養塩濃度の変動も考慮して、「その年の1月1日から調査日までの経過日数」も栄養塩濃度を予測するパラメータに加えました。
- データセットをランダムに5つのサブデータセットに等分し、そのうちの4つを統合したものを学習データ、残りの1つを検証データとして、計15個(5通りのサブデータセットの組み合わせ×3反復)のRFモデルを検証しました。その結果、いずれのモデルも実測値を高い精度で予測できることが示され、栄養塩濃度の変動の大部分を流域特性によって説明できることを明らかにしました(DINについて図2に表示)。河川水中の栄養塩濃度は流域特性、すなわち、流域内の土地利用や地質の影響を強く受けていることを示しています。
- RFモデルにおける各流域特性の重要度(流域特性の値のみをランダムに入れ替えた場合の栄養塩濃度の予測値の平均平方誤差の増加率)、栄養塩濃度と各流域特性との相関性から、サトウキビ畑や畜舎などの面積割合が多い流域では、DINおよびTP濃度が高いのに対し、広葉樹林の面積割合が多い流域ではDSi濃度が高い傾向でした(図3)。石垣島ではサトウキビ栽培や肉牛の飼育が盛んであることから、これらの農業生産活動が河川の栄養塩濃度に強い影響を与えていることが考えられ、今後、環境負荷の具体的な要因や経路を把握する等、課題解決に向けて検討していくことが必要と思われます。
今後の予定・期待
作成したRFモデルは、窒素、リンに加えてケイ素の濃度も予測することができ、ケイ素の減少に起因する有害藻類発生リスクの評価などに活用されることが期待されます。今後、行政機関などによる水質や生態系の監視、さらに沿岸生態系保全対策への活用など、様々な地域への展開が期待されます。
用語の解説
- 1) 流域
- 河川や海に流れ込む雨水(雪や氷を含む)が降り集まる地域。「集水域」とも言います。
- 2) 上流域
- 調査河川の上流から調査地点までの間に雨水が流れ込む地域です。
- 3) ランダムフォレスト
- 2001年にLeo Breiman(米)によって提唱された機械学習アルゴリズムの一種です。データセットの中から重複を許して繰り返しデータを抽出し、それぞれを学習データとして決定木(樹形図によってデータを分析し、予測値を算出するもの)を作成し、各決定木の予測値の平均値を最終的な予測値とします。
- 4) シミュレーションモデル
- ここでは、流域(地下部を含む)における水の移動、土壌や栄養塩など物質の移動、反応に関わる各プロセスを数式化し、それらの時間的・空間的な変化量を一元的に解くことにより、河川の流量や物質の流出量を計算するモデルのことを指します。
- 5) 平水時
- 降雨などによって、河川の流量や水質の顕著な変化が起きていない、平常の状態を言います。
- 6) 溶存無機態窒素(DIN)
- Dissolved Inorganic Nitrogenの略で、硝酸態窒素(NO3-N)、亜硝酸態窒素(NO2-N)、アンモニア態窒素(NH4-N)の総称です。本研究におけるDIN濃度とは、これらの形態の窒素の総濃度のことを指します。なお、本研究では、河川水中の物質を孔隙の大きさが0.7 μm(DINの場合)または0.22 μm(DSiの場合)のフィルターでろ過し、そのろ過水中に溶けている成分を溶存態としました。
- 7) 全リン(TP)
- Total Phosphorusの略です。水中に存在する全ての形態のリン(溶存態、土砂などの懸濁粒子に含まれる、あるいは吸着しているもの)を指します。