تحقیق مراحل کلی مدل‌سازی به روش پارامتری

پیشینه تحقیق و پایان نامه و پروژه دانشجویی

پیشینه تحقیق مراحل کلی مدل‌سازی به روش پارامتری دارای ۳۶ صفحه می باشد   فایل پیشینه تحقیق به صورت ورد  word و قابل ویرایش می باشد. بلافاصله بعد از پرداخت و خرید لینک دنلود فایل نمایش داده می شود و قادر خواهید بود  آن را دانلود و دریافت نمایید . ضمناً لینک دانلود فایل همان لحظه به آدرس ایمیل ثبت شده شما ارسال می گردد.

فهرست مطالب

۱) جمعآوری سری دادهها    ۴
۱-۱) روش‌های تقسیم بندی سری داده‌ها    ۵
۱-۱-۱) تحلیل خوشه‌ای (CA)    ۶
۲-۱-۱) انواع خوشه‌بندی    ۶
۱-۱-۳) اندازه‌گیری فاصله    ۷
۱-۱-۴) دسته‌بندی تفکیکی    ۸
۱-۱-۴-۲) دسته بندی مبهم C- میانگین    ۸
۱-۱-۴-۳) الگوریتم دسته‌بندی QT    ۹
۱-۱-۴-۱) خوشه بندی K- میانگین    ۹
۲) بهینهسازی ساختارهای مولکولی    ۱۱
۳) محاسبه توصیفکنندههای مولکولی    ۱۲
۳-۱) توصیفکنندههای ساختاری    ۱۳
۳-۲) توصیفکنندههای توپولوژیکی    ۱۳
۳-۲-۱) توصیفکنندههای جزء    ۱۳
۳-۲-۲) اندیسهای توپولوژی    ۱۴
۳-۲-۳) توصیفکنندههای زیرساختاری    ۱۴
۳-۲-۴) توصیفکنندههای محیطی    ۱۴
۳-۳) توصیفکنندههای هندسی    ۱۵
۳-۴) توصیفکنندههای الکترونی    ۱۵
۳-۵) توصیفکنندههای فیزیکو- شیمیایی    ۱۵
۳-۶) توصیفکنندههای توسعهیافته    ۱۶
۳-۷) توصیفکنندههای LFER    ۱۶
۴) تجزیه و تحلیل آماری توصیفکنندهها و انتخاب مؤثرترین آنها    ۱۷
۴-۱) الگوریتم ژنتیک (GA)    ۱۸
۴-۱-۱) اصول الگوریتم‌های ژنتیکی    ۱۸
۴-۱-۲) روش‌های انتخاب    ۲۰
۵) ایجاد مدلهای آماری    ۲۱
۵-۱) رگرسیون خطی چندگانه    ۲۱
۵-۲) شبکه‌های عصبی پرسپترون چند لایه(MLP)    ۲۲
۵-۲-۱) تک نرون و ساختار (MLP)    ۲۳
۵-۲-۲) پرسپترون چند لایه    ۲۵
۵-۲-۳) آموزش شبکه‌های عصبی MLP    ۲۵
۶) انتخاب بهترین مدل و ارزیابی اعتبار مدل انتخاب شده    ۲۸
۶-۱) قلمرو کاربرد مدل    ۳۲
منابع:    ۳۴

منابع:

Vapnik, V. The Nature of statistical learning theory, Springer-Verlag, New York, 1995.

Puzyn, V.; Leszczynski, J.; Cronin, M.T.D. Recent Advances in QSAR Studies, Springer

Science, New York, 2010.

Kowalski, B. J. chern. Info. Compuy. Sci. 15, 1975, 203.

Massan, D.L.; Vandeginste, B.C.M.; Deming, S.N.; Kaufman, L. Chemometrics: a text book, Elsevier, Amsterdom, 1998.

Walden, P. Molecular weights and electrical conductivity of several fused salts, Bull. Acad. Imper. Sci, St.Petersburg, 1914.

Hurley, F.H.; Wier, T.P. J. Electrochem. Soc. 98, 1951, 207.

Thuy Pham, T.P.; Cho, C.W.; Yun, Y.S. Water Res. 44, 2010, 352.

Earle, M.J.; Seddon, K.R. Pure Appl. Chem. 72, 2000, 1391.

Bourbigou, H.O.; Magna, L.; Morvan, D. Appl. Catal. A 373, 2010, 1056.

Olivier-Bourbigou, H.; Magna, L.; Morvan, D. Applied Catalysis A: General 373, 2010, 1.

Leonard, J.T.; Roy, K. QSAR Comb. Sci. 25, 2006, 235.

Worth, A.P.; Cronin, M.T.D., Report of the Workshop on the Validation of QSARs and

Other Computational Prediction Models, ATLA 2004, 32, Supp 1, 703.

Ramos, E.U.; Vaes, W.H.J.; Verhaar, H.J.M. Environ Sci Pollut Res. 4, 1997, 83.

Everitt, B.S.; Landau, S.; Leese, M. Cluster Analysis, Edward Arnold London, 2001.

McFarland, J.W.; Gans, D. J. Methods and Principles in Medicinal Chemistry, VCH,

Weinheim, 1995, Vol. 2.

Sambamoorthi, N. Hierarchical Cluster Analysis Some Basics and Algorithms,

CRMportals Inc., 2008.

Frisvad, F. Cluster Analysis for Researchers, Lifetime Learning Publications, Belmont, CA, 1984.

Kraskov, A.; Stögbauer, H.; Andrzejak, R.G.; Grassberger, P. Hierarchical Clustering Based on Mutual Information, Cornell University, 2003.

 

نتایج مطالعات ساختار- فعالیت/ ویژگی علاوه بر شفاف­سازی نحوه ارتباط بین خواص مولکول‌ها و ویژگی‌های ساختمانی آنها، به پژوهشگران در پیش‌بینی رفتار مولکول‌های جدید براساس رفتار مولکول‌های مشابه کمک می‌کند. به مجموعه ابزارها و روش­هایی که به این منظور مورد استفاده قرار می‌گیرند روش‌های پارامتری گویند.  در روش‌های پارامتری سعی می‌کنند بین یک سری توصیف کننده‌های مولکولی با فعالیت یا خاصیت مورد نظر ارتباط منطقی برقرار نمایند. توصیف‌کننده‌های مولکولی که به این منظور استفاده می‌شوند، مقادیر عددی می‌باشند که جنبه‌های مختلف ساختاری مولکول را به طور کمی‌نشان می‌دهند. وقتی خصوصیات ساختاری گونه‌ها و فعالیت آنها توسط اعداد و ارقام بیان می‌شود می‌توان رابطه ریاضی یا کمی، بین ساختار و فعالیت گونه ایجاد کرد. این رابطه می‌تواند برای پیش­بینی پاسخ بیولوژیکی یا شیمیایی دیگر ساختارها مورد استفاده قرار گیرد. به عبارتی دیگر در این گونه مطالعات توصیف­کننده­ها به عنوان متغیر­­­های مستقل و پارامتر بیولوژیکی یا شیمیایی مورد نظر به عنوان متغیر وابسته در نظر گرفته می­شوند. در مرحله مدلسازی مدلی از متغیر وابسته بر حسب متغیرهای مستقل ساخته می­شود، سپس در مرحله پیش­بینی مدل ساخته شده مورد ارزیابی قرار می­گیرد. مراحل کلی مدل‌سازی به روش پارامتری به شرح زیر است:

۱- جمع آوری سری داده‌ها

۲- وارد کردن ساختارهای مولکولی و بهینه­سازی آنها

۳- محاسبه توصیف­کننده‌های مولکولی

۴- تجزیه و تحلیل آماری توصیف­کنده­ها و انتخاب مؤثرترین آنها

۵- ایجاد مدل­های آماری

۶- انتخاب بهترین مدل و ارزیابی اعتبار مدل انتخاب­شده

۱) جمع­آوری سری داده­ها

اولین مرحله، جمع­آوری و انتخاب یک سری مولکولی از منابع قابل اعتماد و در دسترس است. بایستی کمیت مورد مدل‌سازی برای ترکیبات مختلف، در شرایط عملی یکسان بدست آمده باشد تا نتیجه قابل قبول­تر و مناسب­تری بدست آید. در مدل­های خطی سری داده­ها به دو قسمت سری کالیبراسیون [۱] و سری ارزیابی[۲] تقسیم می­شوند[۷] . عملیات مدل‌سازی بر روی سری کالیبراسیون که اکثر مولکول­ها را در بر می­گیرد، انجام می­شود. از سری ارزیابی برای بررسی قدرت پیش­بینی و اعتبار مدل استفاده می­شود. ترکیبات سری ارزیابی به نحوی انتخاب می­شوند که نماینده جمعیت مولکول­های سری کالیبراسیون باشند. لازم به ذکر است که مولکول­های سری ارزیابی در هیچ یک از مراحل مدل‌سازی شرکت ندارند. در مدل سازی به روش­هایی مانند شبکه عصبی مصنوعی از سری کالیبراسیون به دلیل استفاده در مرحله آموزش با عنوان سری آموزشی[۳] نام برده می­شود. سری ارزیابی نیز به دو دسته به نام­های سری ارزیابی داخلی[۴] یا سری پیش­بینی و سری ارزیابی خارجی[۵] تقسیم می­شود. سری پیش­بینی برای کنترل خطای مدلسازی و جلوگیری از ایجاد آموزش اضافی[۶] در حین ساخت مدل و سری ارزیابی، برای ارزیابی اعتبار مدل و تخمین قدرت پیش­گویی آن به­کار می­رود.

۱-۱) روش‌های تقسیم بندی سری داده‌ها

به طور معمول، دو روش وجود دارند که از رایج‌ترین روش‌های تقسیم بندی سری داده‌ها در مدل‌سازی QSAR به شمار می‌روند[۱۶] :

۱- روش انتخاب تصادفی[۷]: در این روش سری داده‌ها به صورت کاملا تصادفی و بدون در نظر گرفتن هیچ گونه معیار خاصی، به سری‌های آموزشی و ارزیابی تقسیم می‌گردد. عمده‌ترین نقص این روش این است که در این روش ترکیبات بدون در نظر گرفتن هیچ‌گونه ارتباطی با ساختارشان، دسته‌بندی می‌گردند. به همین دلیل احتمال بسیار زیادی وجود دارد که ترکیباتی خارج از قلمرو کاربرد مدل، در  سری ارزیابی قرار گیرند[۷] . بنابراین از آنجایی که این ترکیبات توسط مدل برون‌یابی می‌شوند، پیش‌بینی‌های مدل برای این ترکیبات غیر‌قابل اعتماد خواهد بود[۱۷] .

۲- روش مرتب­سازیy-[8]: در این روش سری داده­ها به صورت نزولی یا صعودی مرتب شده و از هر قسمت آن به­عنوان نماینده یک داده برای قرار گرفتن در سری ارزیابی انتخاب می­شود[۷] . حتی در این روش نیز ضمانتی وجود ندارد که سری‌های آموزشی و ارزیابی روی تمامی نقاط نماینده در فضای توصیف‌کننده‌ها پراکنده بوده و سری آموزشی بتواند تمامی نقاط موجود در سری داده‌ها را تحت پوشش قرار دهد[۱۸] . در حقیقت انتخاب سری‌های آموزشی و ارزیابی باید بر اساس نزدیکی نقاط نماینده‌ی سری آموزشی به نقاط نماینده‌ی سری ارزیابی در فضای چند بعدی توصیف کننده‌ها صورت گیرد. در اصل مفهوم “نزدیکی”، بر اساس مهمترین فرضی است که منجر به شکل گیری روابط QSAR گردیده است[۱۶] :

” ترکیبات مشابه، خصوصیات مشابهی دارند”

در این پروژه از روشی نوین به نام تحلیل خوشه‌ای (CA)[9]  [۱۹]جهت انتخاب صحیح اعضای سری‌های آموزشی و ارزیابی (براساس ساختار) استفاده شده ‌است که در ادامه معرفی می‌گردد.

 ۱-۱-۱) تحلیل خوشه‌ای (CA)

تحلیل خوشه‌ای یا خوشه‌بندی نسبت دادن یک سری از اشیاء به گروه‌های معین (یا خوشه‌ها) می باشد، به نحوی که اشیاء موجود دریک خوشه از برخی جهات مشابه بوده ودارای وجه اشتراک باشند. خوشه‌بندی یکی از روش‌های موجود یادگیری غیر نظارت شده است که روشی معمول برای آنالیز آماری داده‌ها در بسیاری از زمینه‌های علمی شامل: یادگیری ماشینی[۱۰]، داده‌کاوی، تشخیص الگو، آنالیز تصاویر، بازیابی اطلاعات و زیست فناوری[۱۱] می باشند[۲۰] . علاوه بر اصطلاح خوشه‌بندی عبارات دیگری نیز دررابطه باهمین مفهوم مورد استفاده قرار می‌گیرند که شامل: طبقه‌بندی خودکار[۱۲]، دسته‌بندی عددی[۱۳]، آنالیز رده‌شناسی[۱۴] و بتریولوژی[۱۵] می‌باشند.

۲-۱-۱) انواع خوشه‌بندی

الگوریتم‌های سلسله مراتبی[۱۶] با استفاده از گروه‌هایی که قبلا تشکیل شده‌اند گروه‌های جدیدی را پیدا می‌کنند. این الگوریتم‌ها غالبا یا تراکمی (از بالا به پایین) هستند، یا انشعابی (از پایین به بالا). الگوریتم‌های تراکمی با هر عنصر که به عنوان یک خوشه‌ی مجزا درنظر گرفته شده است شروع می‌شوند و آنها را به گروه‌های بزرگتر تبدیل می‌کنند[۲۱] . الگوریتم‌های انشعابی با تمامی سری داده شروع می‌شوند و با تقسیم کردن آنها به گروه‌ها یا خوشه‌های کوچکتر ادامه می یابند (شکل ۲-۱ را ببینید). الگوریتم‌های تفکیکی معمولا تمامی خوشه‌ها را به صورت یکباره تعیین می‌کنند اما می‌توانند بعنوان الگوریتم‌های انشعابی در خوشه‌بندی سلسله‌ای نیز بکار روند. الگوریتم‌های خوشه‌بندی چگالی مبنا[۱۷]، به منظور کشف گروه‌هایی با شکل دلخواه ابداع شده‌اند. در این رویکرد یک خوشه بصورت منطقه‌ای درنظر گرفته می‌شود که چگالی یا تراکم اشیاء در آن از حد آستانه بیشتر باشد. الگوریتم‌های خوشه‌ای فضایی[۱۸] ، به دنبال خوشه‌هایی می‌گردند که فقط بتوان انها را دریک تجسم خاص از داده‌ها (خمیده، بخشی از فضا) مشاهده کرد[۲۲] .

[۱]. Calibration

[۲]. Validation

[۳]. Training set

[۴]. Internal test set

[۵]. External test set

[۶]. Over training

[۷]. Random selection

[۸]. Y-ranking method

[۹]. Cluster analysis

[۱۰]. Machine learning

[۱۱]. Bioinformatics

[۱۲]. Automatic classification

[۱۳]. Numerical taxonomy

[۱۴]. Typological analysis

[۱۵]. Botryology

[۱۶]. Hierarchical

[۱۷]. Density based clustering

[۱۸]. Subspace clustering method

50,000 ریال – خرید

تمامی فایل های پیشینه تحقیق و پرسشنامه و مقالات مربوطه به صورت فایل دنلودی می باشند و شما به محض پرداخت آنلاین مبلغ همان لحظه قادر به دریافت فایل خواهید بود. این عملیات کاملاً خودکار بوده و توسط سیستم انجام می پذیرد. جهت پرداخت مبلغ شما به درگاه پرداخت یکی از بانک ها منتقل خواهید شد، برای پرداخت آنلاین از درگاه بانک این بانک ها، حتماً نیاز نیست که شما شماره کارت همان بانک را داشته باشید و بلکه شما میتوانید از طریق همه کارت های عضو شبکه بانکی، مبلغ  را پرداخت نمایید. 

مطالب پیشنهادی:
  • تحقیق انسداد میعانی و روش های برطرف کردن آن و مدل سازی و معادلات حاکم بر جریان گازی تک فازی و دو فازی
  • تحقیق مدل سازی و کنترل ربات دوپا به خصوص، با استفاده از تکنیک هوش مصنوعی
  • تحقیق مدل سازی و روش ها و استاندارهای سیگنال صحبت و کدر کم تاخیر LD-CELP
  • برچسب ها : , , , , , , , , , , , ,
    برای ثبت نظر خود کلیک کنید ...

    به راهنمایی نیاز دارید؟ کلیک کنید

    جستجو پیشرفته

    دسته‌ها

    آخرین بروز رسانی

      پنج شنبه, ۶ اردیبهشت , ۱۴۰۳
    اولین پایگاه اینترنتی اشتراک و فروش فایلهای دیجیتال ایران
    wpdesign Group طراحی و پشتیبانی سایت توسط digitaliran.ir صورت گرفته است
    تمامی حقوق برایpayandaneshjo.irمحفوظ می باشد.