Оцінка прогнозних можливостей емпіричних моделей розподілу октанол - вода на нових гетероциклічних сполуках

Проведення оцінки прогнозних можливостей емпіричних моделей розподілу октанол/вода на двох класах гетероциклічних сполук – похідних карбазолу та відносно малодослідженого [1,2,4]триазоло[4,3-b]піридазину. Використання методів дослідницького аналізу даних.

Рубрика Химия
Вид научная работа
Язык украинский
Дата добавления 20.10.2010
Размер файла 646,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Оцінка прогнозних можливостей емпіричних моделей розподілу октанол - вода на нових гетероциклічних сполуках

Сергій Суйков,

кандидат хімічних наук, старший науковий співробітник

Олександр Луцик,

кандидат хімічних наук, зав. відділом

Ліна Плющакова,

аспірант

Прогноз розподільчих характеристик нових органічних сполук привертає увагу вже кілька десятків років. За цей час створено значну кількість емпіричних моделей та узгоджених баз даних, за якими провадиться їх параметризація [1,2]. Кількість безпосередньо виміряних величин за базою Санкстера [1] не перевищує 18 тисяч сполук. Не зважаючи на суттєвий поступ, досягнутий у розробці неемпіричних підходів, прості моделі знаходять широке використання при плануванні синтезу та попередньому аналізі перспективності нових синтезованих сполук, у першу чергу в галузі фармакології. Тому аналіз можливостей таких моделей, особливо на представниках класів сполук, які раніше не входили у "навчальні" набори даних, є важливою умовою використання і подальшого розвитку емпіричного підходу в цілому. Крім того, визначення "проблемних" наборів експериментальних даних має велике значення для дослідження ефективності неемпіричних методів оцінки розподільчих характеристик і рівня розвитку теорії розподілу в цілому.

Метою даної роботи є проведення оцінки прогнозних можливостей емпіричних моделей розподілу октанол/вода на двох класах гетероциклічних сполук - похідних карбазолу та відносно малодослідженого [1,2,4]триазоло[4,3-b]піридазину (усього 32 сполуки). Обидва класи мають значний фармакологічний потенціал [3,4] і досі не були предметами систематичного дослідження. Експериментальні дані [5,6] свідчать про те, що ці сполуки є гідрофобними з досить широким діапазоном значень коефіцієнта розподілу октанол/вода (Pow) (рис.1).

Для прогнозу було використано моделі ALOGP, CLOGP, IAlogP, KOWWIN, miLogP, XLOGP [7], доступні через http://vcclab.org.

Рис.1 Гістограма коефіцієнтів розподілу октанол - вода для використаного набору експериментальних даних [5, 6]

Загалом задача оцінки прогнозних можливостей поширених моделей розрахунку з точки зору прикладної статистики не є достатньо дослідженою. Вона пов'язана з прогнозом значень випадкових величин, які є логарифмами від реально виміряних, тобто найбільш вірогідно мають логнормальний розподіл [8]. Але коефіцієнт розподілу, як відношення концентрацій, може мати і значно "гірші" характеристики ймовірності, аж до характерних для розподілу Коші [8]. Оскільки використані у прогнозі типи математичних моделей різняться досить сильно, важко строго визначити єдину схему визначення довірчих інтервалів або вибору модельних розподілів для створення єдиного критеріального ряду.

Першим спрощенням, яке може бути використано для уніфікації аналізу, є представлення результатів прогнозу у координатах logPowcalc. vs logPowexper. Графік такого представлення дозволяє візуально оцінити ефективність прогнозу за конкретною моделлю, але не дуже корисний при аналізі результатів кількох моделей.

Тип розподілу нев'язок моделі logPowcalc. vs logPowexper. також невідомий, але такий підхід дозволяє представити результати прогнозу у рамках уніфікованого підходу і є досить популярним [9,10]. Розподіл нев'язок такої моделі легко інтерпретується у рамках інтуїтивних оцінок вірогідності прогнозу. Порівняння нев'язок моделей виду у = kx та y = kx + k0 у цих координатах дозволяє оцінити ефективність простої модифікації (наприклад, введенням коригувального адитивного вкладу або коефіцієнта) прогнозної моделі.

Рис.2 Карбазоли, lgDow

Рис. 3 Карбазоли, lgPow

Рис.4 N-(1-R-етиліден)-N'-[1,2,4]триазоло[4,3-b]піридазин-6-іл-гідразини, lgPow

Такий аналіз нев'язок прогнозу розглянутих моделей для похідних карбазолів (рис.2, 3) та N-(1-R-етиліден)-N'-[1,2,4]триазоло[4,3-b]піридазин-6-іл-гідразинів (рис. 4) [5,6] наведено у вигляді так званого Notch BoxPlot (статистичний пакет GNU R, [11]). На графіку для кожної групи даних представлено наступні статистичні параметри [12]:

прямокутний прорізаний box вміщує 2-й та 3-й квартилі, тобто 50 % усіх значень, широка горизонтальна лінія в ньому - медіана, а виріз відповідає 90 % довірчому інтервалу для медіани, визначеному методом бутстрепу;

пунктирні лінії з засічками дають границю додаткового 1,5 міжквартильного інтервалу (міжквартильний інтервал - різниця між верхнім та нижнім квартилями);

значення, що "випадають" за засічки, приводяться індивідуально (колами).

Для похідних карбазолу, через встановлену суттєву основність досліджених у [3] сполук, наведено аналіз як безпосередньо експериментальних даних (відповідно lgDow, рис.2), так і розрахованих на основі прогнозних значень pKa [3] lgPow (рис.3). Використання оцінки lgPow несуттєво зменшує розподіл нев'язок, але вочевидь на якісному рівні не впливає на оцінку відносної ефективності моделей. Характеристики нев'язок моделей приведено парами, відповідно, (зліва направо) у = kx та y = kx + k0 (останню виокремлено сірим фоном) для кожної прогнозної моделі.

Очевидно, що для N-(1-R-етиліден)-N'-[1,2,4]триазоло[4,3-b]піридазин-6-іл-гідразинів ефективність прогнозу за всіма розглянутими моделями значно вища, ніж для карбазолів, і, загалом, може бути цілком прийнятною для використання (50 % інтервал у 0,4 - 0,5 логарифмічних одиниць).

Найліпша якість прогнозу для всіх розглянутих сполук досягається у рамках моделей ALOGP та XLOGP. Остання є однією з найпростіших за реалізацією (адитивна схема, 80 вкладів та 5 поправок). Видно, що для N-(1-R-етиліден)-N'-[1,2,4]триазоло[4,3-b]піридазин-6-іл-гідразинів за прийнятних, але не найліпших характеристик розподілу ця модель забезпечує повну відсутність значних відхилень, тобто для неї низька вірогідність випадкових "викидів". Цікаво, що прийнята у літературі за "золотий стандарт" CLOGP [2] на використаних наборах даних нічим не виділяється серед інших. Набагато складніша AlogP ("нейронна сітка") хоча й забезпечує дещо вужчий інтервал для 50 % нев'язок, але не виключає значних випадкових похибок прогнозу (викидів).

Другим важливим результатом є, що для N-(1-R-етиліден)-N'-[1,2,4]триазоло[4,3-b]піридазин-6-іл-гідразинів існує помітна різниця між розподілом нев'язок двох моделей. Зокрема, він значно вужчий для моделі виду y = kx + k0, тобто є прості підходи до поліпшення прогнозної сили моделі.

Таким чином, для аналізу прийнятності прогнозних моделей запропоновано використання методів дослідницького аналізу даних (EDA) [13]. Показано, що наявний рівень вірогідності прогнозу не є прийнятним для похідних карбазолу, але може задовольнити потреби планування синтезу в ряду похідних N-(1-R-етиліден)-N'-[1,2,4]триазоло[4,3-b]піридазин-6-іл-гідразинів.

Література

1. LOGKOW Database http://www.tds-tds.com/fs_log.htm.

2. Irwin J.J., Shoichet B.K. // J. Chem. Inf. Model., 2005, 45, 177.

3. Суйков С., Луцик О., Бондаренко А., Харанеко О., Мисик Д. // Ця збірка, С.127.

4. Суйков С., Кальницький М., Луцик О., Бондаренко А., Богза С. // Ця збірка, С.39.

5. Hartwellc J R., Abbott B. // Adv.Pharm.Chemother., 1969, 7, 117.

6. Cucek K., Vercek B. // ARKIVOC, 2001, 5, 79

7. Panchagnula R., Narisetty S.T. // Int. J. Pharm., 2000, 201, 131.

8. Королюк В.С., Портенко Н.И., Скороход А.В., Турбин А.Ф. Справочник по теории вероятностей и математической статистике. - Киев, 1978. - 582 с.

9. Hongmao S.A. // J. Chem. Inf. Comput. Sci., 2004, 44, 748.

10. Stefanis E., Constantinou L., Panayiotou C. // Ind. Eng. Chem. Res., 2004, 43, 6253.

11. Gnu R. http://www.R-project.org/.

12. NIST/SEMATECH e-Handbook of Statistical Methods, http://www.itl.nist.gov/div898/handbook/eda/

13. Tukey J. Exploratory Data Analysis, 1977, Addison-Wesley Massachusetts, 688 p.


Подобные документы

  • Поняття сульфенів; способи їх одержання шляхом фотохімічних реакцій та термічних перегрупувань. Лабораторний метод генерації сульфенів, виходячи з алкансульфохлоридів, для подальшого їх використання в синтезах органічних, зокрема, гетероциклічних сполук.

    курсовая работа [276,6 K], добавлен 31.01.2014

  • Поняття, класифікація, будова і біологічна роль гетероциклічних сполук. Фізичні і хімічні властивості гетероциклів. Біциклічні сполуки з п'ятичленними гетероциклами. Ароматичні сполуки з конденсуючими ядрами. Шестичленні гетероцикли з одним гетероатомом.

    курсовая работа [434,7 K], добавлен 05.12.2015

  • Характеристика стічної води за якісним та кількісним складом. Хімічні та фізичні властивості сульфатної кислоти та її сполук. Статистично-математична обробка результатів аналізу по визначенню сульфатів комплексонометричним і турбидиметричним методом.

    курсовая работа [1,2 M], добавлен 13.06.2011

  • Характеристика та застосування мінеральних вод. Розгляд особливостей визначення кількісного та якісного аналізу іонів, рН, а також вмісту солей натрію, калію і кальцію полуменево-фотометричним методом. Визначення у воді загального вмісту сполук феруму.

    курсовая работа [31,1 K], добавлен 18.07.2015

  • Mac-спектрометрія є одним з найбільш ефективних експресних методів аналізу, установлення будови як індивідуальних органічних сполук, так і синтетичних, природних сполук та їхніх сумішей. Автоматичне порівняння зареєстрованого спектра з банком спектрів.

    реферат [456,8 K], добавлен 24.06.2008

  • Причины необычного свойства воды: горячая вода замерзает быстрее холодной. Сверхохлаждение и "мгновенное" замерзание воды. "Стеклянная" вода - твердое вещество, в котором отсутствует кристаллическая структура. Сущность и понятие эффекта "памяти воды".

    презентация [1,4 M], добавлен 01.10.2012

  • Аналіз мінеральної води на вміст солей натрію, калію, кальцію полуменево-фотометричним методом та на вміст НСО3- та СО32- титриметричним методом. Особливості визначення її кислотності. Визначення у природних водах загального вмісту сполук заліза.

    реферат [31,1 K], добавлен 13.02.2011

  • Шляхи надходження в довкілля сполук купруму, форми його знаходження в об'єктах навколишнього середовища та вміст в земній корі. Запаси мідних руд. Огляд хімічних та фізичних методів аналізу. Екстракційно-фотометричне визначення купруму в природній воді.

    курсовая работа [270,8 K], добавлен 09.03.2010

  • Macспектрометрія є найбільш ефективним експресним методом аналізу й установлення будови як індивідуальних органічних сполук, так і синтетичних, природних сполук та їхніх сумішей. Поняття, теоретичні основи масспектроскопічного методу аналізу.

    реферат [873,2 K], добавлен 24.06.2008

  • Химические и физические свойства воды. Переход в твёрдое и газообразное состояние. Вода в природе, ее роль в геологии и истории планеты. Изучение природных вод, их взаимодействия с атмосферой и литосферой. Применение воды в хозяйственной деятельности.

    реферат [831,5 K], добавлен 24.11.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.