مقایسه مدل های رگرسیون خطی وغیرخطی مبتنی بر یادگیری ماشین برای برآورد میزان کلروفیل آ در سواحل قشم و هرمز

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشکده منابع طبیعی و محیط زیست، واحد علوم و تحقیقات، دانشگاه آزاد اسلامی، تهران، ایران

2 گروه سنجش از دور وGIS ، دانشکده منابع طبیعی و محیط زیست، واحد علوم و تحقیقات، دانشگاه آزاد اسلامی، تهران، ایران.

3 پژوهشکده اکولوژیکی خلیج‌فارس و دریای عمان، پژوهشکده علوم شیلات ایران، سازمان آموزش و ترویج تحقیقات کشاورزی، بندرعباس، هرمزگان، ایران

4 گروه علوم دریایی، دانشکده منابع طبیعی و محیطزیست، دانشگاه آزاد اسلامی، واحد علوم و تحقیقات تهران، تهران،ایران.

چکیده

کلروفیل آ، به عنوان یک شاخص مهم برای اندازه‌گیری شکوفایی جلبکی و کیفیت آب، در مطالعات دریایی بسیار اهمیت دارد. این پژوهش با هدف مقایسه مدل‌های رگرسیون خطی و غیرخطی بر اساس الگوریتم های یادگیری ماشین برای بررسی میزان کلروفیل آ در آب‌های ساحلی بندرعباس، جزیره قشم  و هرمز انجام شد. برای این منظور از داده‌های ماهواره TERRA  سنجنده MODIS و برداشت‌های میدانی از نقاط مختلف محدوده مطالعه استفاده شده است. مدل های مورد بررسی شامل رگرسیون خطی، مدل خطی تعمیم یافته با توزیع پواسون، جنگل تصادفی و ماشین بردار پشتیبان است. عملکرد این مدل‌ها با استفاده از معیارهای ریشه میانگین مربعات خطا(RMSE)،  میانگین درصد خطا (MPE)،  میانگین خطای مطلق (MAE) و ضریب تعیین  R-squared (rsq) ارزیابی شد. نتایج نشان می‌دهد که رگرسیون خطی و مدل خطی تعمیم یافته ضعیف عمل می‌کنند، در حالی که جنگل تصادفی و ماشین بردار پشتیبان عملکرد بهتری را نشان می‌دهند. به طور خاص، جنگل تصادفی بالاترین عملکرد را با 0.5725 =RMSE و rsq = 0.6632 نشان می‌دهد. این مدل قابلیت تشخیص الگوهای غیرخطی و پیچیده‌تر را دارد و با استفاده از تعداد زیادی درخت تصمیم‌گیری می‌‌تواند به صورت مؤثر با داده‌های حجیم کار کند. به طور کلی، این پژوهش اثربخشی مدل‌های یادگیری ماشین، به ویژه جنگل‌های تصادفی را در پیش‌بینی دقیق میزان کلروفیل آ به عنوان یک عامل مهم در مدیریت اکوسیستم‌های دریایی در منطقه مورد مطالعه برجسته می‌کند.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Comparison of Linear and Nonlinear Regression Models based on Machine Learning for Estimating Chlorophyll-a values in Coastal Waters of Qeshm and Hormoz Island

نویسندگان [English]

  • Mitra Naimi 1
  • Zahra Azizi 2
  • Mohammad Seddiq Mortazavi 3
  • Seyedeh Laili Mohebbi-Nozar 3
  • Mojtaba Ezam 4
1 , Remote Sensing and GIS Department, Faculty of Natural Resources and Environment, Science and Research Branch, Islamic Azad University, Tehran, IRAN
2 Remote Sensing and GIS Department, Faculty of Natural Resources and Environment, Science and Research Branch, Islamic Azad University, Tehran, IRAN
3 Persian Gulf and Oman Sea Ecological Research Institute, Iranian fisheries science Research Center, Agricultural Education and Extension Research Organization, Bandar Abbas, IRAN
4 Physical Oceanography Department, Faculty of Natural Resources and Environment, Science and Research Branch, Islamic Azad University, Tehran, IRAN
چکیده [English]

Chlorophyll-a, as an important indicator of algal blooms and water quality, holds significant importance in marine studies. This research aims to compare linear and nonlinear regression models based on machine learning algorithms for estimating the chlorophyll-a levels in the coastal waters of Bandar Abbas, Hormuz, and Qeshm Island. The study utilizes data from the TERRA sensor’s MODIS satellite and field measurements from various points within the study area. The examined models include linear regression, generalized linear model with Poisson distribution, random forest, and support vector machine. The performance of these models is evaluated using metrics such as root mean square error (RMSE), mean percentage error (MPE), mean absolute error (MAE), and coefficient of determination (R-squared). The results demonstrate that linear regression and generalized linear models perform poorly, while random forest and support vector machine exhibit better performance. Particularly, the random forest model shows the highest performance with an RMSE of 0.5725 and R-squared of 0.6632. This model has the capability to detect nonlinear and complex patterns and can effectively handle large datasets by employing a large number of decision trees. Overall, this research highlights the effectiveness of machine learning models, especially random forests, in accurately predicting chlorophyll-a levels as a crucial factor in managing marine ecosystems in the study area.

کلیدواژه‌ها [English]

  • Chlorophyll-a
  • machine learning
  • regression model
  • random forest
  • support vector machine
  • Qeshm Island
  • Hormuz Island