تحقیق تعریف مسئله‌ی پیش‌بینی کوتاه مدت ترافیک و متدهای یادگیری تجمعی و رندوم فارست

پیشینه تحقیق و پایان نامه و پروژه دانشجویی

پیشینه تحقیق تعریف مسئله‌ی پیش‌بینی کوتاه مدت ترافیک و متدهای یادگیری تجمعی و رندوم فارست دارای ۳۸ صفحه می باشد فایل پیشینه تحقیق به صورت ورد  word و قابل ویرایش می باشد. بلافاصله بعد از پرداخت و خرید لینک دنلود فایل نمایش داده می شود و قادر خواهید بود  آن را دانلود و دریافت نمایید . ضمناً لینک دانلود فایل همان لحظه به آدرس ایمیل ثبت شده شما ارسال می گردد.

فهرست مطالب

فصل اول. مقدمه
۱-۱-مقدمه۴
۱-۲-متدهای یادگیری تجمعی۴
۱-۲-۱٫تعاریف مفاهیم اولیه۵
۱-۲-۲٫درخت بوستینگ۷
۱-۲-۳٫درخت بگینگ۷
۱-۳-رندوم فارست۱۰
۱-۳-۱٫مراحل توسعه‌ی رندوم فارست۱۱
۱-۳-۳٫رندوم فارست برای رگرسیون۱۸
۱-۳-۴٫مزایا و کاربردهای رندوم فارست۱۹
۱-۴-نتیجه گیری۲۰
۱-۵-مقدمه۲۱
۱-۶-تعریف مسئله۲۱
۱-۷-روش‌های مبتنی بر آنالیزهای سری زمانی:۲۴
۱-۸-روش‌های مبتنی بر مدل‌های شبکه عصبی مصنوعی۲۸
۱-۹-روشهای مبتنی بر الگوریتمهای داده کاوی۳۱
فهرست منابع و مآخذ۳۶

منابع

[۱] Ezell, Stephen. “Explaining international IT application leadership: Intelligent transportation systems.” (2010).

[۲] Box, G. E., and Jenkins, G. M. (1976). Time Series Analysis Forecasting and Control. Holden-Day: San Francisco. MR436499.

[۳] Whittaker, J., Garside, S., and Lindveld, K. (1997). “Tracking and predicting a network traffic process.” International Journal of Forecasting, 13(1), 51-61.

[۴] Okutani, I., and Stephanedes, Y. J. (1984). “Dynamic prediction of traffic volume through Kalman filtering theory.” Transportation Research Part B: Methodological, 18(1), 1-11.

[۵] Davis, G. A., and Nihan, N. L. (1991). “Nonparametric regression and short-term freeway traffic forecasting.” Journal of Transportation Engineering, 117(2), 178-188.

[۶] Smith, B. L., Williams, B. M., and Oswald, R. K. (2000). “Parametric and nonparametric traffic volume forecasting.” In National Research Council (US). Transportation Research Board. Meeting (79th: 2000: Washington, DC). Preprint CD-ROM.

[۷] Chen, H., and Grant-Muller, S. (2001). “Use of sequential learning for short-term traffic flow forecasting.” Transportation Research Part C: Emerging Technologies, 9(5), 319-336.

[۸] Jiang, X., and Adeli, H. (2005). “Dynamic wavelet neural network model for traffic flow forecasting.” Journal of transportation engineering, 131(10), 771-779.

[۹] Park, B., Messer, C. J., and Urbanik II, T. (1998). “Short-term freeway traffic volume forecasting using radial basis function neural network.” Transportation Research Record: Journal of the Transportation Research Board, 1651(-1), 39-47.

[۱۰] Abdulhai, B., Porwal, H., and Recker, W. (1999). “Short term freeway traffic flow prediction using genetically-optimized time-delay-based neural networks.”

[۱۱] Vlahogianni, E. I., Karlaftis, M. G., and Golias, J. C. (2005). “Optimized and meta-optimized neural networks for short-term traffic flow prediction: A genetic approach.” Transportation Research Part C: Emerging Technologies, 13(3), 211-234.

[۱۲] Chang, S.C., Kim, S.J., and Ahn, M.H., (2000). “Traffic-flow forecasting using time series analysis and artificial neural network: the application of judgmental adjustment.” Presented in the 3rd IEEE International Conference on Intelligent Transportation Systems.

۱-۱- مقدمه

پیش‌بینی دقیق وضعیت ترافیکی، امری لازم و تأثیرگذار در مدیریت مؤثر سیستم‌های حمل‌ونقل هوشمند به حساب می‌آید. از آنجا که داده‌های ترافیکی معمولاً داده‌هایی با حجم بالا هستند، تکنیک‌های کاربردی و جدیدی را برای پردازش نیاز دارند. داده کاوی بعنوان یک شاخه از علم کامپیوتر اخیراً توجه زیادی را به خود جلب کرده است که در نتیجه‌ی اعمال آن، آنالیز و پردازش پایگاه داده[۱] های بزرگ فراهم می‌شود. در واقع متدهای داده کاوی معمولاً با هدف استخراج دانش[۲] و ساخت مدل از داده‌های حجیم بکار گرفته می‌شوند[۲۴]. از میان روش‌های گوناگون داده کاوی، تمرکز تعداد قابل توجهی از تحقیقات به روی یادگیری یادگیری تجمعی [۳] ، درخت‌های تصمیم‌گیری و بطور ویژه رندوم فارست[۴] می‌باشد که در ادامه توضیح داده خواهند شد[۲۵].

 ۱-۲- متدهای یادگیری تجمعی

 در سال‌های اخیر گرایش زیادی به سمت تکنیک‌های یادگیری تجمعی مشاهده می‌شود که ایده‌ی اصلی آن‌ها استفاده از ترکیبی از مدل‌ها به جای استفاده از یک مدل است. در واقع این متدها با هدف بهبود کارایی مدل نهایی M، مجموعه‌ای از K مدل (کلاسه‌بند یا پیش‌بینی‌کننده[۵]) شامل   را ترکیب می‌کنند[۲۰].

۱-۲-۱٫  تعاریف مفاهیم اولیه

کلاسه بند: فرآیند پیدا کردن یک مدل (یا یک تابع) که قابلیت توصیف داده‌ای که توسط آن آموزش دیده را دارد، می‌باشد. در نهایت از این مدل می‌توان برای پیش‌بینی کلاس مربوط به نمونه‌هایی که برچسب[۶] کلاس آنها مشخص نیست، استفاده کرد. مدل بدست آمده می‌تواند با فرم‌های متفاوتی از جمله قوانین کلاسه بندی (IF-THEN)[7] ، درخت های تصمیم‌گیری، فرمول‌های ریاضی[۸]، شبکه های عصبی و … ارائه شود [۲۰].

درخت تصمیم‌گیری: در واقع یک ساختار درختی شبه فلوچارت[۹] می‌باشد که هر گره[۱۰]ی تصمیم، نمایانگر یک تصمیم‌گیری روی مقادیر یک ویژگی است و هر شاخه[۱۱] بیانگر نتیجه آن تصمیم‌گیری است. همچنین برگ[۱۲]های یک درخت، برچسب کلاس‌ها یا توزیع‌های کلاسی[۱۳] را نشان می‌دهند .[۲۰]

شبکه عصبی مصنوعی: یک مدل ریاضی الهام گرفته از شبکه عصبی انسان است که از گروه‌هایی از نِرون‌های[۱۴] مصنوعی تشکیل شده است. اساس محاسبات در این روش بر مبنای اتصال بهم پیوسته[۱۵] چندین واحد پردازشی می‌باشد و می‌تواند ساختار خود را در طی مرحله یادگیری تغییر دهد که این موضوع را با تنظیم وزن[۱۶] اتصال‌ها انجام می‌دهد [۲۶].

پیش‌بینی کننده: بر خلاف کلاسه‌بند که برچسب‌های گسسته[۱۷] را پیش‌بینی می‌کند، پیش‌بینی‌کننده، توابع با مقادیر پیوسته[۱۸] را مدل می‌کند، یعنی به جای برچسب کلاس، مقادیر عددی[۱۹] را پیش‌بینی می‌کند. هرچند بطور عمومی اصطلاح پیش‌بینی‌کننده هم برای پیش­بینی برچسب‌های گسسته و هم برچسب‌های پیوسته بکار می‌رود، اما در کتاب های مختلف از جمله کتاب [۲۰]، این واژه مختص پیش­بینی ‌مقادیر عددی است.

آنالیز رگرسیون[۲۰] نیز یک متدولوژی آماری است که غالباَ برای پیش­بینی مقادیر عددی استفاده می‌شود. در طول این پایان نامه نیز، اصطلاح رگرسیون معادل پیش­بینی کننده عددی استفاده شده است. در واقع از آنجا که داده‌های در اختیار گذاشته شده در این پایان نامه، داده‌های ترافیکی و به بیانی دقیق‌تر تعداد وسایل نقلیه عبوری از خیابان‌هاست، هدف اصلی در این‌جا نیز اعمال روشی بهینه مبتنی بر رگرسیون می‌باشد.

دو دسته از مهم ترین و شناخته شده ترین متدها در زمینه‌ی یادگیری  تجمعی ، درخت‌های بوستینگ[۲۱] ارائه شده توسط [۲۷] و درخت بگینگ[۲۲] توسط [۲۸] می باشد که در ادامه به توضیح آن‌ها می‌پردازیم.

 ۱-۲-۲٫  درخت بوستینگ

در این روش نیز مدل نهایی از مجموعه­ای از مدل‌ها تشکیل شده است که در آن مدل‌های پایه­ای مبتنی بر درخت‌های تصمیم‌گیری هستند. در طی اعمال این الگوریتم، درخت‌ها به نمونه‌هایی که توسط درخت‌های قبلی نادرست پیش­بینی شده اند، وزن بیشتری می‌دهند. در نهایت مدل نهایی بر مبنای رأی‌گیری[۲۳] وزن‌دار بین درخت‌ها انجام می‌گیرد که این وزن‌ها بر اساس میزان دقت[۲۴] درخت‌ها تنظیم می‌شوند [۲۷].

۱-۲-۳٫  درخت بگینگ

درخت بگینگ مخفف Bootstrap AggregatlNG (Bagging)  می باشد که در این قسمت توضیح داده شده است. الگوریتم بگینگ از مجموعه­ای از مدل‌های پایه‌ای تشکیل شده و به ترتیب زیر عمل می‌کند. با دریافت مجموعه‌ی آموزشی D با سایز N (تعداد نمونه های داده آموزشی)، به تعداد K مجموعه آموزشی جدید Di، با سایز n<N، تولید می‌شود که حاصل سمپل‌گیری یکنواخت[۲۵] و با جایگزینی[۲۶] از مجموعه اولیه D می‌باشد. همان‌طور که می‌دانیم این نوع سمپل‌گیری بعنوان Bootstrap sample  شناخته می‌شود. K مدل مختلف با استفاده از K زیر مجموعه، آموزش داده می‌شوند و در نهایت یک مدل نهایی را تشکیل می‌دهند. این مدل نهایی در رگرسیون از میانگین‌گیری نتایج مدل‌ها و در کلاسه‌بندی از رأی‌گیری بین مدل‌ها حاصل می‌شود [۲۹]. درخت بگینگ در واقع همان الگوریتم بگینگ است که مدل‌های پایه‌ای آن مبتنی بر درخت‌های تصمیم‌گیری هستند. همانطور که مشخص است، بر خلاف بوستینگ در بحث بگینگ، مدل‌های پایه مستقل از هم ساخته می‌شوند و به دقت مدل‌های قبلی وابسته نیستند. در شکل ۲-۱ الگوریتم مربوط به بگینگ را می­بینیم.

از جمله عوامل تأثیرگذار در موفقیّت متدهای یادگیری  تجمعی، بحث تنوع[۲۷] مدل‌های پایه و همچنین دقت هرکدام از مدل‌هاست. همانطور که واضح است اگر مدل‌های پایه متنوع یا به اصطلاح diverse نباشند، ترکیب آن‌ها بی فایده است. در متد بگینگ، استفاده از مجموعه‌های متفاوت از مجموعه داده اولیه، شرط تنوع را تضمین می‌کند. از طرف دیگر، زمانی یک مدل می‌تواند از تغییرات مجموعه داده آموزشی خود استفاده کند که ناپایدار[۲۸] باشد . ناپایدار بودن به این معناست که تغییرات کوچک در ورودی (مجموعه­ی آموزشی) منجر به تغییرات بزرگ در خروجی مدل شود. از جمله پیش­بینی کننده‌های ناپایدار می‌توان به شبکه‌های عصبی مصنوعی و درختان تصمیم‌گیری اشاره کرد. هرچند مدل نزدیکترین همسایگی[۲۹] جزء کلاسه بندهای پایدار به حساب می‌آید [۲۹].

[۱] Dataset

[۲] Information

[۳] Ensemble learning

[۴] Random Forest(RF)

[۵] Prediction

[۶] Label

[۷] IF_THEN classification rules

[۸] Mathematical formulae

[۹] Flow-chart-like tree structure

[۱۰] Node

[۱۱] Branch

[۱۲] Leaf

[۱۳] Class distribution

[۱۴] Neuron

[۱۵] Interconnection

[۱۶] Weight

[۱۷] Discrete

[۱۸] Continuous-valued

[۱۹] Numerical

[۲۰] Regression analysis

[۲۱] Boosting trees

[۲۲] Bagging trees

[۲۳] Voting

[۲۴] Accuracy

[۲۵] Uniform sampling

[۲۶] Replacement

[۲۷] Diversity

[۲۸] Unstable

[۲۹] K-nearest neighbor(knn)

50,000 ریال – خرید

تمامی فایل های پیشینه تحقیق و پرسشنامه و مقالات مربوطه به صورت فایل دنلودی می باشند و شما به محض پرداخت آنلاین مبلغ همان لحظه قادر به دریافت فایل خواهید بود. این عملیات کاملاً خودکار بوده و توسط سیستم انجام می پذیرد. جهت پرداخت مبلغ شما به درگاه پرداخت یکی از بانک ها منتقل خواهید شد، برای پرداخت آنلاین از درگاه بانک این بانک ها، حتماً نیاز نیست که شما شماره کارت همان بانک را داشته باشید و بلکه شما میتوانید از طریق همه کارت های عضو شبکه بانکی، مبلغ  را پرداخت نمایید. 

مطالب پیشنهادی:
برچسب ها : , , , , , , , , , , , ,
برای ثبت نظر خود کلیک کنید ...

به راهنمایی نیاز دارید؟ کلیک کنید

جستجو پیشرفته

دسته‌ها

آخرین بروز رسانی

    پنج شنبه, ۶ اردیبهشت , ۱۴۰۳
اولین پایگاه اینترنتی اشتراک و فروش فایلهای دیجیتال ایران
wpdesign Group طراحی و پشتیبانی سایت توسط digitaliran.ir صورت گرفته است
تمامی حقوق برایpayandaneshjo.irمحفوظ می باشد.