پیچیدگی مولکولی که توسط بعد فراکتال محاسبه می شود

ساخت وبلاگ

پیچیدگی مولکولی یک ویژگی مهم مولکولهای آلی برای کشف مواد مخدر است. نحوه محاسبه پیچیدگی مولکولی برای چندین دهه در ادبیات علمی مورد بحث قرار گرفته است. از اوایل شناخته شده بود که تعداد زیر ساخت هایی که می توانند از یک نمودار مولکولی بریده شوند برای این کار از اهمیت برخوردار هستند. با این حال ، هرگز متوجه نشد که زیر ساخت های بریده شده ، خود را به ساختارهای والدین نشان می دهد. حذف پی در پی یک باند و یک اتم یک سری قطعات را با کاهش اندازه برمی گرداند. چنین سریال خود را نشان می دهد که خود شفابخشی شبیه به اشیاء فراکتال است. در اینجا ما از تعداد قطعات مجزا برای محاسبه ابعاد فراکتال مولکول استفاده کردیم. بعد فراکتال یک مولکول یک ماده جدید است که شامل تمام ویژگی هایی است که در حال حاضر برای توصیف پیچیدگی مولکولی مهم است. علاوه بر این ، این اولین کاری است که ماهیت فراکتالی مولکول های آلی را نشان می دهد.

معرفی

زمینه پیچیدگی مولکولی

پیچیدگی مولکولی بیش از شصت سال است که موضوع تحقیق است. با این وجود ، هیچ تعریف مشترکی از اصطلاح "پیچیدگی مولکولی" در حال حاضر در دسترس نیست ، حتی اگر این موضوع مورد بحث روزانه در آزمایشگاه های شیمی آلی مصنوعی باشد. عدم وجود تعریف مشترک برای پیچیدگی مولکولی اخیراً منجر به رویکرد جمعیت 1 شد. بسیاری از کارهای ذکر شده در زیر با نیاز به ارزیابی پیچیدگی مولکولی مربوط به سنتز شیمیایی انجام شد. پیچیدگی مولکولی یک ویژگی ذاتی است که فقط به ساختار مولکولی بستگی دارد اما با این وجود ، تخمین برای تلاش مصنوعی 2 فراهم می کند. در مقابل ، دسترسی به سنتز ترکیبی از خواص مولکولی ذاتی و بیرونی است زیرا بستگی به ویرایش های کاربردی ، معرفها و شرایط واکنش دارد.

همانطور که در بالا اشاره شد ، پیچیدگی مولکولی به طور طبیعی موضوعی برای شیمی است. با این حال ، این در زیست شناسی سرچشمه می گیرد. در سال 1955 ، رشفسکی 3 با هدف محاسبه محتوای اطلاعات یک ارگانیسم زنده و بنابراین ، نیاز به دانستن محتوای اطلاعاتی از قطعات جدایی ناپذیر آن مانند مولکول های آلی داشت. رشفسکی فرمولی را برای محاسبه محتوای اطلاعات مولکول ها ، بر اساس آنتروپی شانون 4 پیشنهاد کرد. رشفسکی به طور مترادف از اصطلاحات "پیچیدگی" و "محتوای اطلاعات" استفاده کرد. تجزیه یک نمودار در زیر بخش های آن ، در حالی که تقارن را در نظر می گیرد ، توسط Mowshowitz برای اندازه گیری پیچیدگی نمودار 5 استفاده شد. براساس کار رشفسکی ، Bonchev از محتوای اطلاعات توپولوژیکی برای محاسبه ویژگی های نمودار مولکولی 6 استفاده کرد. پیچیدگی توپولوژیکی بر اساس تعداد کل زیرگرافهای متصل مولکول 7 بود. به عنوان بسیاری از اقدامات پیچیدگی دیگر ، پیچیدگی توپولوژیکی با تعداد اتمها و اوراق قرضه افزایش می یابد. به طور مستقل از کار رشفسکی و بونچف ، برتز روشی را برای محاسبه شاخص پیچیدگی برای یک مولکول 8 منتشر کرد ، همچنین با تکیه بر آنتروپی شانون. برتز ایده استفاده از متغیرهای نظری نمودار را برای محاسبات پیچیدگی در ساختارهای شیمیایی معرفی کرد. یک اصطلاح اصلی در ملاحظات پیچیدگی وی ، تعداد راه هایی بود که می توان یک زیرگراف را از یک نمودار جدا کرد. در یک انتشار جدیدتر ، برتز و هرندون تعداد کل زیرگراف ها را به عنوان اندازه گیری برای پیچیدگی مولکولی 9 گرفتند. هندریکسون و همکاران. 10 بعداً الگوریتم Bertz را ساده و تصحیح برای تقارن مولکولی. رندیک "شاخص اتصال مولکولی" را که وی برای محاسبه پیچیدگی مولکولی 11 به کار برد ، معرفی کرد. بر اساس ایده های Bertz ، اخیراً Proudfoot یک اندازه گیری پیچیدگی مولکولی را انجام داده است که خلاصه پیچیدگی هر محیط اتم در یک مولکول 12 را خلاصه می کند.

رویکرد حوزه محور و مجموعه محدودی از عناصر شیمیایی و زیرساخت‌های مورد استفاده در شیمی آلی، به‌ویژه در شیمی دارویی، ایده توسعه کلاس دیگری از معیارهای پیچیدگی برای مولکول‌های آلی با شمارش ویژگی‌های مولکولی را برانگیخت. ویتلاک از تعداد حلقه‌ها، پیوندهای غیراشباع، اتم‌های هترو و مراکز کایرال برای محاسبه پیچیدگی محصولات طبیعی استفاده کرد، الگوریتمی که بعداً بورون و چانون 14 ساده‌سازی کردند. به طور مشابه، Allu و Oprea 15 از تعداد مراکز کایرال، حلقه های ذوب شده، گروه های عاملی و الکترونگاتیوی برای محاسبه پیچیدگی مولکولی استفاده کردند. یک رویکرد کلی تر توسط Rücker و Rücker 16، با استفاده از یک برنامه برای شمارش راه رفتن بر روی یک نمودار مولکولی ایجاد شد. کار آنها همچنین نمونه ای برای انتقال روان بین رویکردهای نظری گراف و رویکردهای مبتنی بر ویژگی های مولکولی است.

علاوه بر تلاش برای توصیف پیچیدگی مولکولی با یک مقدار واحد، توصیفگرهای فیزیکی و شیمیایی برای چندین دهه برای به دست آوردن عددی برای ویژگی های مولکولی مانند پیچیدگی 17،18 استفاده شده است. توسط شریدان و همکاران نشان داده شد. که برخی از ترکیبات توصیفگرهای فیزیکی-شیمیایی، مانند تعداد مراکز کایرال، تعداد پیچش‌های توپولوژیکی منحصربه‌فرد، و تعداد توصیفگرهای جفت اتم منحصربه‌فرد، با درک پیچیدگی مولکولی توسط شیمی‌دانان دارویی همبستگی دارند.

از آنتروپی شانون تا بعد فراکتال مولکول ها

پس از بررسی ادبیات موجود در مورد پیچیدگی مولکولی، ما دو رویکرد اصلی مورد استفاده برای محاسبه پیچیدگی مولکولی را شناسایی کردیم.

اولین رویکرد نظری گراف، ویژگی‌های مرتبط با زیرساخت را ارزیابی می‌کند و آنها را با فرمول آنتروپی شانون که در ابتدا برای اندازه‌گیری محتوای اطلاعات باینری توسعه داده شد، خلاصه می‌کند. برای محاسبات پیچیدگی مولکولی، راشفسکی استفاده از فرمول شانون را با P (x) پیشنهاد کرد.من) تعداد ویژگی های نمودار برای یک اتم یا یک زیرساخت x استمن. این نشان دهنده افزایش آنتروپی و پیچیدگی مولکول با افزایش تعداد قطعات اطلاعاتی است. با این حال، افزایش اندازه یک مولکول لزوماً با افزایش پیچیدگی مولکولی آن در چشم شیمیدانان ارتباط ندارد.

رویکرد دیگر از طرح های وزنه برداری برای ترکیب ویژگی های مولکولی در یک تعداد پیچیدگی استفاده می کند. ضرر استفاده از طرح های وزنه برداری این است که به پارامتری نیاز دارد که فقط با تعداد محدودی از مولکول ها قابل انجام است. محاسبه پیچیدگی با یک طرح وزنی فقط برای کلاسهای مولکول هایی که پارامتر سازی برای آن انجام شده ، معتبر خواهد بود.

به طور شهودی ، شیمیدانان ارگانیک موافقت کردند که برخی از ویژگی های مختلف که باعث ایجاد تنوع در نمودار مولکولی می شوند (به عنوان مثال ، مراکز کایرال ، کربن های SP3 ، حلقه های ذوب شده ، حلقه های پل و اتم های هترو نیز باعث افزایش پیچیدگی مولکولی می شوند اما تنها در صورتی که این ویژگی ها تکراری نباشند. از طرف دیگر ، تکرار ویژگی های مولکولی یکسان یا بسیار مشابه ، پیچیدگی یک مولکول را کاهش می دهد. بر اساس این نکته ، ما تصمیم گرفتیم پیچیدگی مولکولی را به روشی کاملاً جدید محاسبه کنیم.

در حین کار ما در مورد ویژگی های مولکولی تکراری ، متوجه شدیم که هر زیر ساخت مولکولی شفابخش بودن خود را به ساختار والدین خود نشان می دهد. شفابخش بودن به این معنی است که یک شیء شبیه به بخشی از خودش است. بگذارید مفهوم خود را برای مولکول های آلی در مثال N-Hexane ، یک آلکان خطی به دست آوریم (شکل 1). یک آلکان خطی از زنجیره ای از اتم های کربن اشباع شده با اتم های هیدروژن تشکیل شده است. از بین بردن یکی از دو اتم کربن و پیوند اتصال ، زنجیره ای جدید با یک پیوند کمتر ایجاد می کند. به اتم کربن زنجیره ای که از آنجا که پیوند برداشته شده است ، برای تکمیل اشباع زنجیره باید یک اتم هیدروژن اضافه شود. نتیجه یک آلکان جدید ، پنتان است که کمی کوچکتر از شروع آلکان است اما بسیار شبیه به آن است. اگر دیگر پیوند از زنجیره کربن هگزان برداشته شود ، دوباره زنجیره ای با پنج اتم کربن بدست می آید. این قطعه را می توان با اشباع با هیدروژن به پنتان منتقل کرد. بنابراین ، به طور مستقل که بیرونی ترین پیوند برداشته شد ، همان قطعه به دست می آید. این دو قطعه غیر متمایز یا ایزومورفیک هستند. حذف اوراق قرضه پی در پی می تواند تا آخرین پیوند تکرار شود. آلکان حاصل همیشه شبیه به زنجیره والدین خواهد بود.

figure 1

N-Hexane و چهار آلکان متمایز به دست آمده با حذف پیاپی یک پیوند و یک اتم و به دنبال آن اشباع با هیدروژن.

تنوع ساختاری کمی بیشتر توسط اسید هپتانوئیک نشان داده شده است (شکل 2). برای این و همه مولکول‌های زیر از نماد خط پیوند استفاده می‌کردیم، جایی که رئوس و انتهای هر خط نشان‌دهنده اتم‌های کربن هستند و اتم‌های هیدروژن متصل به آنها نشان داده نمی‌شوند. در نماد خط پیوند، اسید هپتانوئیک از نه اتم و هشت پیوند تشکیل شده است. حذف یک پیوند و یک اتم در دو طرف مولکول منجر به سه زیرساخت مجزا با هشت اتم و هفت پیوند می شود. با تکرار این روش با این سه زیرساخت، چهار زیرساخت جدید با هفت اتم و شش پیوند به دست می‌آید. حذف یک اتم و پیوند مجاور را می توان تا زمانی ادامه داد که فقط قطعاتی با یک پیوند و دو اتم باقی بمانند. برای اسید هپتانوئیک سه قطعه مجزا با یک پیوند و دو اتم وجود دارد. هر قطعه با هر تعداد پیوند شبیه مولکول اصلی خود است.

figure 2

هپتانوئیک اسید و زیرساختارهای متمایز آنگروه بندی بر اساس تعداد اوراق قرضه

گلوکز یک بیومولکول مهم است. شکل 3 گلوکز و برخی از زیرساختارهای کوچکتر آن را نشان می دهد. دو زیرساخت (A و B) به دو شکل خمیده و کشیده نشان داده شده است. این زیرگراف ها از قطعات حلقه والد با حذف پیوند بدون حذف اتم ایجاد شده اند.

figure 3

گلوکز و برخی از زیرگراف های متمایز آن. زیرگراف های A و B دو بار به دو صورت خمیده و کشیده نشان داده شده اند.

شباهت آشکار زیرگراف‌های مولکولی به نمودارهای والد آنها، ایده اندازه‌گیری شباهت خود را به وجود آورد. خود شباهت مفهومی جا افتاده در علوم ریاضی و فیزیکی است. اندازه گیری شباهت خود با هاوسدورف 19 آغاز شد و توسط ماندلبروت 20 با محاسبه ابعاد فراکتال ایجاد شد. به گفته مندلبروت، یک بعد فراکتال نسبتی است که با مقایسه نحوه تغییر جزئیات یک الگو با مقیاسی که در آن اندازه گیری می شود، شاخص پیچیدگی را ارائه می دهد. شاخص پیچیدگی دقیقاً همان چیزی است که می‌خواهیم اندازه‌گیری کنیم. از چندگانه الگوریتم‌های موجود برای تعیین ابعاد فراکتال، تصمیم گرفتیم که بعد فراکتالی مولکول‌ها را به طور مشابه با بعد مینکوفسکی-بولیگاند (2) که به طور گسترده استفاده می‌شود، محاسبه کنیم.

با N به عنوان تعداد اشیاء و ε مقیاس است که اشیاء با آن اندازه گیری می شوند. در عمل ، بعد فراکتال توسط شیب محاسبه می شود که با رگرسیون خطی ورود به سیستم (1/ ε) در مقابل ورود به سیستم N (ε) برای همه ε تعیین می شود. یک روش متداول برای تعیین بعد Minkowski-bouligand الگوریتم شمارش جعبه برای شکل دو بعدی است. در الگوریتم شمارش کادر ، N برابر با تعداد جعبه های مورد نیاز برای پوشاندن شکلی که بعد فراکتال تعیین می شود ، برابر است. مقیاس ε طول جانبی یک جعبه است. با استفاده از این مقیاس ، جعبه های N برای پوشاندن شکل مورد نیاز است. با مقیاس کاهش دهنده ، ε تعداد جعبه های N (ε) را که برای پوشاندن شکل مورد نیاز است ، افزایش می دهد ، یعنی نامزد و هم مخرج معادله (2) با افزایش N. نمونه کلاسیک برای تعیین بولیگاند Minkowski افزایش می یابد. ابعاد با الگوریتم شمارش جعبه محاسبه بعد فراکتال برای خط ساحلی انگلیس توسط ماندلبروت 20 است. این نشریه ایده ابعاد فراکتالی را به جامعه علمی گسترده تبدیل کرد. با این حال ، ساختارهای ساده تری وجود دارد که امکان مطالعه ابعاد فراکتال را فراهم می کند. برای توضیح شباهت های بین مولکول ها و فراکتال ها ، ما به دنبال یک ساختار خودی بودیم که می تواند بر اساس مجموعه ای از قوانین ساخته شود. منحنی Von Koch 23 با یک خط شروع می شود ، شکل 4. قسمت میانی خط با یک مثلث متشکل از دو خط با طول مساوی جایگزین می شود که همچنین برابر با طول قسمت جایگزین است. با مقایسه منحنی Von Koch با نماد خط آلکان ها آشکار می شود که می تواند یک آلکان خطی را نیز نشان دهد. در نماد خط ، یک راس از یک زاویه یک اتم کربن با اتم های هیدروژن وصل شده و خطوط نشان دهنده پیوندهای بین اتم های کربن است. برای یک آلکان که به عنوان منحنی Koch به تصویر کشیده شده است ، ابعاد فراکتال برابر است با ورود به سیستم (4)/ورود به سیستم (3) 1. 262.

figure 4

اگرچه می توان یک آلکان را با منحنی فون کچ نشان داد ، اما شیمی دانان مجموعه ای از قوانین ساده تر را ترجیح می دهند. زاویه بین دو خط روی 120 درجه تنظیم شده است. اگر خط مبدأ به سمت بالا حرکت کند ، باید خط بعدی که به آن متصل شده است ، به سمت پایین حرکت کند ، و برعکس. این منجر به الگوی زیگزاگ ، شکل 5 می شود.

figure 5

N-Hexane در نماد خط ، تحت پوشش جعبه های الگوریتم شمارش جعبه.

از آنجا که این الگوی دو بعدی است ، می توان از الگوریتم "جعبه شمارش" استفاده کرد. در این الگوریتم ، حداکثر طول جانبی εحداکثراز یک جعبه مربع روی یکی تنظیم شده است. بزرگترین مربع شکل کامل را در بر می گیرد و کل مولکول را نشان می دهد. در نتیجه ، طول جانبی مربع های کوچکتر کمتر از یک است. ما طول جانبی مربع دوم ε را تعریف می کنیم2توسط εحداکثر/2تمام طول جانبی مربع دیگر با تقسیم طول جانبی مربع قبلی به 2 قانون را دنبال می کنند. از الگوی زیگ زاگ. هر دو الگوی زیگ زاگ و منحنی Koch بازنمایی معتبر برای آلکان ها هستند. آنها در بعد فراکتال خود متفاوت هستند ، که باعث می شود رویکرد توپولوژیکی برای محاسبه ابعاد فراکتال مولکول ها نامناسب باشد.

در هر صورت ، بازنمایی توپولوژیکی از مولکول ها تقریب بسیار ناچیزی از ساختار سه بعدی آنها است. در راستای این ، محاسبه ابعاد فراکتولوژیکی فقط برای آلکان های غیر بریده ، ساده ترین مولکول های آلی امکان پذیر است. اگر یک هترواتوم اضافه شود ، مانند نیتروژن یا اکسیژن ، دیگر نمی توان از الگوریتم شمارش جعبه استفاده کرد. هترواتوم بعد جدیدی را اضافه می کند که نمی تواند با شکل دو بعدی پوشانده شود. با اتم هترو ، شکل به یک نمودار تبدیل می شود. تجزیه و تحلیل نمودار با روشهای توپولوژیکی مانند الگوریتم شمارش کادر ، نتایج نامعتبر ایجاد می کند. همچنین ، شباهت زیر ساخت های استخراج شده به مولکول والدین توسط الگوریتم شمارش جعبه ضبط نمی شود و بنابراین ، محاسبه بعد فراکتال یک نمودار نیاز به یک رویکرد متفاوت دارد. خوشبختانه ، تعریف فراکتال ها توسط Mandelbrot بسیار بیشتر از اشیاء مبتنی بر شکل است. همانطور که قبلاً نیز گفته شد ، تعریف پیچیدگی توسط Mandelbrot فقط به یک شاخص نیاز دارد که اندازه گیری جزئیات یک الگوی با مقیاس اندازه گیری شاخص را اندازه گیری می کند. همانطور که قبلاً در شکل 1 تا 3 نشان داده شده است ، زیر ساخت ها جزئیات الگوی مولکول هستند. مقیاس با تعداد اوراق قرضه در زیر ساخت تعریف می شود. در یک مولکول ، سطح جزئیات با افزایش تعداد پیوند γ در زیر ساختارها در حال افزایش است ، همانطور که در شکل 6 نشان داده شده است و در بخش نتایج مورد بحث قرار می گیرد. کمترین سطح جزئیات در زیر ساخت ها تعداد اوراق قرضه است. بر این اساس ، تعداد اوراق قرضه یک برابر با بزرگترین طول سمت در الگوریتم شمارش جعبه است. و تعداد اوراق قرضه با بیشترین تعداد زیر ساخت ها بالاترین سطح جزئیات را نشان می دهد. این تعداد باند γحداکثرمطابق با کوتاهترین طول جانبی در الگوریتم شمارش کادر است. به عبارت دیگر ، تعداد تعداد اوراق قرضه γ به طور معکوس متناسب با تغییر در طول جانبی ε از الگوریتم شمارش جعبه ε همیشه کمتر از یک است و در بالاترین سطح جزئیات به صفر ، ε → 0 نزدیک می شود. تعداد باند γ در حال افزایش است تا اینکه به بالاترین سطح جزئیات γ → γ برسدحداکثربشربرای به دست آوردن بالاترین سطح جزئیات γحداکثردر قالب مناسب برای محاسبه ابعاد فراکتال ، معادل معادله 2 ، حد مجاز توسط 1/ γ → 0 این تغییر باید در مخرج منعکس شود و بنابراین ، معادله 2 به معادله 3 تبدیل می شود: < Pan> مطابق باکوتاهترین طول جانبی در الگوریتم شمارش جعبه. به عبارت دیگر ، تعداد تعداد اوراق قرضه γ به طور معکوس متناسب با تغییر در طول جانبی ε از الگوریتم شمارش جعبه ε همیشه کمتر از یک است و در بالاترین سطح جزئیات به صفر ، ε → 0 نزدیک می شود. تعداد باند γ در حال افزایش است تا اینکه به بالاترین سطح جزئیات γ → γ برسد

کتاب آموزش بورس...
ما را در سایت کتاب آموزش بورس دنبال می کنید

برچسب : نویسنده : محسن زنجانچی بازدید : 64 تاريخ : چهارشنبه 9 فروردين 1402 ساعت: 21:44