تحقیق مراحل کلی مدل‌سازی به روش پارامتری

تحقیق مراحل کلی مدل‌سازی به روش پارامتری

دسته: رشته شیمی

فرمت : word | صفحات : 36

قیمت: 5000 تومان
789 views

پیشینه تحقیق مراحل کلی مدل‌سازی به روش پارامتری دارای ۳۶ صفحه می باشد فایل پیشینه تحقیق به صورت ورد word و قابل ویرایش می باشد. بلافاصله بعد از پرداخت و خرید لینک دنلود فایل نمایش داده می شود و قادر خواهید بود آن را دانلود و دریافت نمایید . ضمناً لینک دانلود فایل همان لحظه به آدرس ایمیل ثبت شده شما ارسال می گردد.

فهرست مطالب

۱) جمعآوری سری دادهها   ۴
۱-۱) روش‌های تقسیم بندی سری داده‌ها   ۵
۱-۱-۱) تحلیل خوشه‌ای (CA)   ۶
۲-۱-۱) انواع خوشه‌بندی   ۶
۱-۱-۳) اندازه‌گیری فاصله   ۷
۱-۱-۴) دسته‌بندی تفکیکی   ۸
۱-۱-۴-۲) دسته بندی مبهم C- میانگین   ۸
۱-۱-۴-۳) الگوریتم دسته‌بندی QT   ۹
۱-۱-۴-۱) خوشه بندی K- میانگین   ۹
۲) بهینهسازی ساختارهای مولکولی   ۱۱
۳) محاسبه توصیفکنندههای مولکولی   ۱۲
۳-۱) توصیفکنندههای ساختاری   ۱۳
۳-۲) توصیفکنندههای توپولوژیکی   ۱۳
۳-۲-۱) توصیفکنندههای جزء   ۱۳
۳-۲-۲) اندیسهای توپولوژی   ۱۴
۳-۲-۳) توصیفکنندههای زیرساختاری   ۱۴
۳-۲-۴) توصیفکنندههای محیطی   ۱۴
۳-۳) توصیفکنندههای هندسی   ۱۵
۳-۴) توصیفکنندههای الکترونی   ۱۵
۳-۵) توصیفکنندههای فیزیکو- شیمیایی   ۱۵
۳-۶) توصیفکنندههای توسعهیافته   ۱۶
۳-۷) توصیفکنندههای LFER   ۱۶
۴) تجزیه و تحلیل آماری توصیفکنندهها و انتخاب مؤثرترین آنها   ۱۷
۴-۱) الگوریتم ژنتیک (GA)   ۱۸
۴-۱-۱) اصول الگوریتم‌های ژنتیکی   ۱۸
۴-۱-۲) روش‌های انتخاب   ۲۰
۵) ایجاد مدلهای آماری   ۲۱
۵-۱) رگرسیون خطی چندگانه   ۲۱
۵-۲) شبکه‌های عصبی پرسپترون چند لایه(MLP)   ۲۲
۵-۲-۱) تک نرون و ساختار (MLP)   ۲۳
۵-۲-۲) پرسپترون چند لایه   ۲۵
۵-۲-۳) آموزش شبکه‌های عصبی MLP   ۲۵
۶) انتخاب بهترین مدل و ارزیابی اعتبار مدل انتخاب شده   ۲۸
۶-۱) قلمرو کاربرد مدل   ۳۲
منابع:   ۳۴

منابع:

Vapnik, V. The Nature of statistical learning theory, Springer-Verlag, New York, 1995.

Puzyn, V.; Leszczynski, J.; Cronin, M.T.D. Recent Advances in QSAR Studies, Springer

Science, New York, 2010.

Kowalski, B. J. chern. Info. Compuy. Sci. 15, 1975, 203.

Massan, D.L.; Vandeginste, B.C.M.; Deming, S.N.; Kaufman, L. Chemometrics: a text book, Elsevier, Amsterdom, 1998.

Walden, P. Molecular weights and electrical conductivity of several fused salts, Bull. Acad. Imper. Sci, St.Petersburg, 1914.

Hurley, F.H.; Wier, T.P. J. Electrochem. Soc. 98, 1951, 207.

Thuy Pham, T.P.; Cho, C.W.; Yun, Y.S. Water Res. 44, 2010, 352.

Earle, M.J.; Seddon, K.R. Pure Appl. Chem. 72, 2000, 1391.

Bourbigou, H.O.; Magna, L.; Morvan, D. Appl. Catal. A 373, 2010, 1056.

Olivier-Bourbigou, H.; Magna, L.; Morvan, D. Applied Catalysis A: General 373, 2010, 1.

Leonard, J.T.; Roy, K. QSAR Comb. Sci. 25, 2006, 235.

Worth, A.P.; Cronin, M.T.D., Report of the Workshop on the Validation of QSARs and

Other Computational Prediction Models, ATLA 2004, 32, Supp 1, 703.

Ramos, E.U.; Vaes, W.H.J.; Verhaar, H.J.M. Environ Sci Pollut Res. 4, 1997, 83.

Everitt, B.S.; Landau, S.; Leese, M. Cluster Analysis, Edward Arnold London, 2001.

McFarland, J.W.; Gans, D. J. Methods and Principles in Medicinal Chemistry, VCH,

Weinheim, 1995, Vol. 2.

Sambamoorthi, N. Hierarchical Cluster Analysis Some Basics and Algorithms,

CRMportals Inc., 2008.

Frisvad, F. Cluster Analysis for Researchers, Lifetime Learning Publications, Belmont, CA, 1984.

Kraskov, A.; Stögbauer, H.; Andrzejak, R.G.; Grassberger, P. Hierarchical Clustering Based on Mutual Information, Cornell University, 2003.

نتایج مطالعات ساختار- فعالیت/ ویژگی علاوه بر شفافسازی نحوه ارتباط بین خواص مولکول‌ها و ویژگی‌های ساختمانی آنها، به پژوهشگران در پیش‌بینی رفتار مولکول‌های جدید براساس رفتار مولکول‌های مشابه کمک می‌کند. به مجموعه ابزارها و روشهایی که به این منظور مورد استفاده قرار می‌گیرند روش‌های پارامتری گویند. در روش‌های پارامتری سعی می‌کنند بین یک سری توصیف کننده‌های مولکولی با فعالیت یا خاصیت مورد نظر ارتباط منطقی برقرار نمایند. توصیف‌کننده‌های مولکولی که به این منظور استفاده می‌شوند، مقادیر عددی می‌باشند که جنبه‌های مختلف ساختاری مولکول را به طور کمی‌نشان می‌دهند. وقتی خصوصیات ساختاری گونه‌ها و فعالیت آنها توسط اعداد و ارقام بیان می‌شود می‌توان رابطه ریاضی یا کمی، بین ساختار و فعالیت گونه ایجاد کرد. این رابطه می‌تواند برای پیشبینی پاسخ بیولوژیکی یا شیمیایی دیگر ساختارها مورد استفاده قرار گیرد. به عبارتی دیگر در این گونه مطالعات توصیفکنندهها به عنوان متغیرهای مستقل و پارامتر بیولوژیکی یا شیمیایی مورد نظر به عنوان متغیر وابسته در نظر گرفته میشوند. در مرحله مدلسازی مدلی از متغیر وابسته بر حسب متغیرهای مستقل ساخته میشود، سپس در مرحله پیشبینی مدل ساخته شده مورد ارزیابی قرار میگیرد. مراحل کلی مدل‌سازی به روش پارامتری به شرح زیر است:

۱- جمع آوری سری داده‌ها

۲- وارد کردن ساختارهای مولکولی و بهینهسازی آنها

۳- محاسبه توصیفکننده‌های مولکولی

۴- تجزیه و تحلیل آماری توصیفکندهها و انتخاب مؤثرترین آنها

۵- ایجاد مدلهای آماری

۶- انتخاب بهترین مدل و ارزیابی اعتبار مدل انتخابشده

۱) جمعآوری سری دادهها

اولین مرحله، جمعآوری و انتخاب یک سری مولکولی از منابع قابل اعتماد و در دسترس است. بایستی کمیت مورد مدل‌سازی برای ترکیبات مختلف، در شرایط عملی یکسان بدست آمده باشد تا نتیجه قابل قبولتر و مناسبتری بدست آید. در مدلهای خطی سری دادهها به دو قسمت سری کالیبراسیون^[۱] و سری ارزیابی^[۲] تقسیم میشوند[۷] . عملیات مدل‌سازی بر روی سری کالیبراسیون که اکثر مولکولها را در بر میگیرد، انجام میشود. از سری ارزیابی برای بررسی قدرت پیشبینی و اعتبار مدل استفاده میشود. ترکیبات سری ارزیابی به نحوی انتخاب میشوند که نماینده جمعیت مولکولهای سری کالیبراسیون باشند. لازم به ذکر است که مولکولهای سری ارزیابی در هیچ یک از مراحل مدل‌سازی شرکت ندارند. در مدل سازی به روشهایی مانند شبکه عصبی مصنوعی از سری کالیبراسیون به دلیل استفاده در مرحله آموزش با عنوان سری آموزشی^[۳] نام برده میشود. سری ارزیابی نیز به دو دسته به نامهای سری ارزیابی داخلی^[۴] یا سری پیشبینی و سری ارزیابی خارجی^[۵] تقسیم میشود. سری پیشبینی برای کنترل خطای مدلسازی و جلوگیری از ایجاد آموزش اضافی^[۶] در حین ساخت مدل و سری ارزیابی، برای ارزیابی اعتبار مدل و تخمین قدرت پیشگویی آن بهکار میرود.

۱-۱) روش‌های تقسیم بندی سری داده‌ها

به طور معمول، دو روش وجود دارند که از رایج‌ترین روش‌های تقسیم بندی سری داده‌ها در مدل‌سازی QSAR به شمار می‌روند[۱۶] :

۱- روش انتخاب تصادفی^[۷]: در این روش سری داده‌ها به صورت کاملا تصادفی و بدون در نظر گرفتن هیچ گونه معیار خاصی، به سری‌های آموزشی و ارزیابی تقسیم می‌گردد. عمده‌ترین نقص این روش این است که در این روش ترکیبات بدون در نظر گرفتن هیچ‌گونه ارتباطی با ساختارشان، دسته‌بندی می‌گردند. به همین دلیل احتمال بسیار زیادی وجود دارد که ترکیباتی خارج از قلمرو کاربرد مدل، در سری ارزیابی قرار گیرند[۷] . بنابراین از آنجایی که این ترکیبات توسط مدل برون‌یابی می‌شوند، پیش‌بینی‌های مدل برای این ترکیبات غیر‌قابل اعتماد خواهد بود[۱۷] .

۲- روش مرتبسازیy-^[8]: در این روش سری دادهها به صورت نزولی یا صعودی مرتب شده و از هر قسمت آن بهعنوان نماینده یک داده برای قرار گرفتن در سری ارزیابی انتخاب میشود[۷] . حتی در این روش نیز ضمانتی وجود ندارد که سری‌های آموزشی و ارزیابی روی تمامی نقاط نماینده در فضای توصیف‌کننده‌ها پراکنده بوده و سری آموزشی بتواند تمامی نقاط موجود در سری داده‌ها را تحت پوشش قرار دهد[۱۸] . در حقیقت انتخاب سری‌های آموزشی و ارزیابی باید بر اساس نزدیکی نقاط نماینده‌ی سری آموزشی به نقاط نماینده‌ی سری ارزیابی در فضای چند بعدی توصیف کننده‌ها صورت گیرد. در اصل مفهوم “نزدیکی”، بر اساس مهمترین فرضی است که منجر به شکل گیری روابط QSAR گردیده است[۱۶] :

” ترکیبات مشابه، خصوصیات مشابهی دارند”

در این پروژه از روشی نوین به نام تحلیل خوشه‌ای (CA)^[9] [۱۹]جهت انتخاب صحیح اعضای سری‌های آموزشی و ارزیابی (براساس ساختار) استفاده شده ‌است که در ادامه معرفی می‌گردد.

۱-۱-۱) تحلیل خوشه‌ای (CA)

تحلیل خوشه‌ای یا خوشه‌بندی نسبت دادن یک سری از اشیاء به گروه‌های معین (یا خوشه‌ها) می باشد، به نحوی که اشیاء موجود دریک خوشه از برخی جهات مشابه بوده ودارای وجه اشتراک باشند. خوشه‌بندی یکی از روش‌های موجود یادگیری غیر نظارت شده است که روشی معمول برای آنالیز آماری داده‌ها در بسیاری از زمینه‌های علمی شامل: یادگیری ماشینی^[۱۰]، داده‌کاوی، تشخیص الگو، آنالیز تصاویر، بازیابی اطلاعات و زیست فناوری^[۱۱] می باشند[۲۰] . علاوه بر اصطلاح خوشه‌بندی عبارات دیگری نیز دررابطه باهمین مفهوم مورد استفاده قرار می‌گیرند که شامل: طبقه‌بندی خودکار^[۱۲]، دسته‌بندی عددی^[۱۳]، آنالیز رده‌شناسی^[۱۴] و بتریولوژی^[۱۵] می‌باشند.

۲-۱-۱) انواع خوشه‌بندی

الگوریتم‌های سلسله مراتبی^[۱۶] با استفاده از گروه‌هایی که قبلا تشکیل شده‌اند گروه‌های جدیدی را پیدا می‌کنند. این الگوریتم‌ها غالبا یا تراکمی (از بالا به پایین) هستند، یا انشعابی (از پایین به بالا). الگوریتم‌های تراکمی با هر عنصر که به عنوان یک خوشه‌ی مجزا درنظر گرفته شده است شروع می‌شوند و آنها را به گروه‌های بزرگتر تبدیل می‌کنند[۲۱] . الگوریتم‌های انشعابی با تمامی سری داده شروع می‌شوند و با تقسیم کردن آنها به گروه‌ها یا خوشه‌های کوچکتر ادامه می یابند (شکل ۲-۱ را ببینید). الگوریتم‌های تفکیکی معمولا تمامی خوشه‌ها را به صورت یکباره تعیین می‌کنند اما می‌توانند بعنوان الگوریتم‌های انشعابی در خوشه‌بندی سلسله‌ای نیز بکار روند. الگوریتم‌های خوشه‌بندی چگالی مبنا^[۱۷]، به منظور کشف گروه‌هایی با شکل دلخواه ابداع شده‌اند. در این رویکرد یک خوشه بصورت منطقه‌ای درنظر گرفته می‌شود که چگالی یا تراکم اشیاء در آن از حد آستانه بیشتر باشد. الگوریتم‌های خوشه‌ای فضایی^[۱۸] ، به دنبال خوشه‌هایی می‌گردند که فقط بتوان انها را دریک تجسم خاص از داده‌ها (خمیده، بخشی از فضا) مشاهده کرد[۲۲] .

[۱]. Calibration

[۲]. Validation

[۳]. Training set

[۴]. Internal test set

[۵]. External test set

[۶]. Over training

[۷]. Random selection

[۸]. Y-ranking method

[۹]. Cluster analysis

[۱۰]. Machine learning

[۱۱]. Bioinformatics

[۱۲]. Automatic classification

[۱۳]. Numerical taxonomy

[۱۴]. Typological analysis

[۱۵]. Botryology

[۱۶]. Hierarchical

[۱۷]. Density based clustering

[۱۸]. Subspace clustering method

تمامی فایل های پیشینه تحقیق و پرسشنامه و مقالات مربوطه به صورت فایل دنلودی می باشند و شما به محض پرداخت آنلاین مبلغ همان لحظه قادر به دریافت فایل خواهید بود. این عملیات کاملاً خودکار بوده و توسط سیستم انجام می پذیرد. جهت پرداخت مبلغ شما به درگاه پرداخت یکی از بانک ها منتقل خواهید شد، برای پرداخت آنلاین از درگاه بانک این بانک ها، حتماً نیاز نیست که شما شماره کارت همان بانک را داشته باشید و بلکه شما میتوانید از طریق همه کارت های عضو شبکه بانکی، مبلغ را پرداخت نمایید.

مطالب پیشنهادی:

تحقیق انسداد میعانی و روش های برطرف کردن آن و مدل سازی و معادلات حاکم بر جریان گازی تک فازی و دو فازی

تحقیق مدل سازی و کنترل ربات دوپا به خصوص، با استفاده از تکنیک هوش مصنوعی

تحقیق مدل سازی و روش ها و استاندارهای سیگنال صحبت و کدر کم تاخیر LD-CELP