Количественное соотношение структура–активность

Проблема экспертизы баз данных и выработки алгоритма QSAR–анализа. Исследование особенностей программ CASE и MULTICASE. Размер и неоднородность базы данных. Проблема выделения дескрипторов. Характеристика аспектов QSAR в системе оценки мутагенности.

Рубрика Экономика и экономическая теория
Вид курсовая работа
Язык русский
Дата добавления 27.03.2016
Размер файла 350,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

МИНОБРНАУКИ РОССИИ

Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования

«Астраханский государственный университет»

Реферат

Количественное соотношение структура-активность (QSAR)

Астрахань, 2016

Содержание

Введение

1. Создание QSAR

2. QSAR в системе оценки мутагенности

3. Перспективные методы QSAR

3.1 Программы CASE и MULTICASE

3.2 МЕТА - программа

4. Уравнения QSAR

5. Общие проблемы использования методов SAR и QSAR

5.1 Размер и неоднородность базы данных

5.2 Проблема выделения дескрипторов

5.3 Проблема экспертизы баз данных и выработки алгоритма QSAR - анализа

Заключение

Список литературы

экспертиза дескриптор мутагенность

Введение

Я уверен, что наступит время, когда книги, называемые нами «Фармакопеи», будут построены на основе рассуждений, и когда химик и врач будут действовать заодно.

Б.Ричардсон, 1869 г.

С древнейших времен в качестве источника лекарственных препаратов использовалось растительное или животное сырье. Уже в средние века получила широкое распространение идея применения химических (главным образом неорганических) веществ для лечения заболеваний. Во второй половине XIX в. благодаря созданию структурной теории и быстрому развитию органической химии произошла подлинная революция в химии лекарств - появились и нашли применение чисто синтетические препараты. Традиционный путь поиска лекарственных веществ в XX в. заключался в синтезе самых разнообразных типов органических соединений и их тестировании на различные виды активности. Были синтезированы и протестированы сотни тысяч веществ. Трудоемкость и длительность этого процесса заставляла ученых задумываться над разработкой теоретических основ поиска лекарств, и главным образом - над проблемой ограничения количества синтезируемых соединений. Постепенно возникали подходы не только к выявлению взаимосвязи биологических свойств веществ с их структурой, но и к количественному описанию этой взаимосвязи. Подобные исследования привели к рождению целого научного направления, называемого в современной химии лекарств QSAR («Quantitative Structure - Activity Relationship», или «количественное соотношение структура-активность»).

QSAR - это математический аппарат, позволяющий проводить корреляции между структурами химических соединений и их биологической активностью. Важная задача QSAR заключается в идентификации и количественном выражении структурных параметров или физико-химических свойств молекул с целью выявления факта влияния каждого из них на биологическую активность. Если такое влияние имеет место, то возможно составление уравнений, позволяющих просчитать заранее активность новых соединений и сократить количество синтезируемых веществ. Методология QSAR сформировалась к середине 1960-х гг. Ее основателем во многих литературных источниках считается американский ученый Корвин Ганч, хотя в ее создание существенный вклад внесли и такие ученые, как Ч.Овертон, Г.Мейер, Г.Фюнер, С.Фри, Дж.Вильсон, Т.Фуджита и др.

1. Создание QSAR

Идея о существовании математической зависимости между структурой и биологическими свойствами соединений была высказана еще во второй половине XIX в. В 1869 г. А.Крум-Браун и Т.Фрезер, исследуя токсическое действие различных алкалоидов (стрихнина, кодеина, морфина, никотина) и продуктов их метилирования (рис. 1), показали, что такое «незначительное» структурное изменение, как введение метильной группы к атому азота, вызывает существенное уменьшение токсичности алкалоидов. Крум-Браун и Фрезер пришли к выводу, что физиологическая активность (Ф) должна быть функцией химической структуры (С), и опубликовали уравнение, которое считается первой общей формулировкой количественной зависимости структура-активность:

Ф = f(С) (1)

Рис. 1 Метилирование алкалоидов (на примере морфина)

Стали появляться и другие работы, в которых предпринимались попытки найти количественные выражения зависимости физиологической активности от химической структуры. Так, в том же 1869 г. Б.Ричардсон обнаружил, что в гомологических рядах спиртов жирного ряда концентрации веществ, вызывающих наркоз (отсутствие реакции на внешние раздражители) у животных, уменьшаются пропорционально увеличению количества атомов углерода в их молекулах. С.Бинц в 1880-х гг. вывел заключение о возрастании наркотического действия с увеличением количества атомов хлора в ряду CH4, CH3Cl, CH2Cl2, CHCl3, CCl4. Было установлено также, что снотворное действие некоторых сульфосодержащих соединений возрастает с увеличением количества этильных групп в их молекулах. Поиски подобных закономерностей, связывающих биологическую активность с количеством определенных атомов или групп, продолжались и в XX в. Можно привести довольно много примеров, однако подавляющее большинство этих закономерностей имели существенные ограничения и оказывались справедливыми лишь для очень небольших рядов соединений. Возникла необходимость привлечения каких-то других параметров для построения корреляций структура-свойство, и в дальнейшем существенно более плодотворными оказались попытки искать зависимости биологической активности веществ от их физико-химических свойств (которые в свою очередь зависят от химической структуры).

В конце XIX - начале XX в. появилась серия работ М.Рише, Ч.Овертона и Г.Мейера, в которых были обнаружены количественные корреляции между различными физико-химическими параметрами молекул и их токсичностью, а также способностью вызывать наркоз и местную анестезию. В 1893 г. Рише получил количественную зависимость токсичностей этилового спирта, диэтилового эфира, «экстракта полыни» и других веществ от их растворимостей в воде. В проводимых им экспериментах рыбки весом 2-5 г помещались в 1-1,5 л воды, содержащей измеренное количество исследуемого соединения, и определялась доза последнего, которая позволяла жить этим рыбкам в течение определенного времени. На основании полученных результатов Рише сделал заключение: чем более соединение растворимо, тем менее оно токсично.

Овертон через несколько лет после работ Рише, проанализировав наркотическое действие более 130 коммерчески доступных органических веществ на многочисленные растительные и животные объекты (водоросли, головастики, рыбы и др.), получил линейные зависимости между их активностью и липофильностью (способностью растворяться в жирах). В качестве меры последней он использовал коэффициент распределения вещества в системе оливковое масло-вода (т.е. соотношение концентраций вещества в липидной и водной фазах). Полученные результаты привели Овертона к выводу о том, что явление наркоза следует приписать к чисто физическим изменениям, вызванным растворением органических веществ в липидных компонентах животных и растительных клеток. К аналогичным выводам пришел и Мейер в 1899 г.

Работы Ричардсона, Рише и Овертона стимулировали появление в начале XX в. ряда исследований по построению зависимостей величин биологической активности от самых разнообразных физико-химических параметров. Например, Дж.Холт и В.Мур показали, что для тараканов и домашних мух токсичность паров жидкостей увеличивалась с увеличением их температуры кипения вплоть до определенной величины (около 225 °С). Более высококипящие соединения (225-250 °С) были настолько малолетучими, что гибель мух наблюдалась только после очень длительного нахождения в их парах, а соединения с температурами кипения выше 250 °С оказались нетоксичны.

Важные работы по изучению влияния физико-химических свойств веществ на биологическую активность были сделаны русским ученым Николаем Васильевичем Лазаревым. В начале 1940-х гг. (в блокадном Ленинграде) он проанализировал значения токсичностей и коэффициентов распределения в системе оливковое масло-вода для тысячи органических соединений. Лазарев построил графические корреляции, используя двойную логарифмическую шкалу, что позволило наблюдать линейные зависимости логарифмов коэффициентов распределения от логарифмов концентраций веществ, вызывающих тот или иной токсический эффект, например остановку изолированного сердца лягушки, раздражение кожных покровов животных.

В 1950-х гг. методология поиска корреляций между структурой и биологической активностью стала интенсивно развиваться благодаря исследованиям, целью которых было изучение вкладов отдельных заместителей в биологическую активность. Отметим, что еще в 1907 г. Г. Фюнер, изучавший задержку развития яиц морских ежей под влиянием одноатомных спиртов жирного ряда, обнаружил, что в пределах гомологических серий каждый следующий член ряда действовал приблизительно втрое сильнее, чем предыдущий, что явилось первым количественным свидетельством аддитивности вкладов отдельных структурных фрагментов в значение активности.

Важным достижением середины XX в. по созданию корреляций, основанных на определении вкладов заместителей в данный вид активности, являются исследования С.Фри и Дж.Вильсона (1964). В предложенном ими методе биологическая активность определяется как сумма вкладов, вносимых каждым заместителем в каждом положении, и никакие физико-химические характеристики молекул при этом не привлекаются. Так, для серии гипотетических соединений (рис. 2, соединения 1, 2, 3), активность (А) будет определяться уравнением:

(2)

где - вклад заместителя Ri, находящегося в положении i. При отсутствии заместителя в данном положении K = 0, при его наличии k = 1.

Константы, выражающие влияние на активность каждого заместителя в каждой позиции, определяют на основании экспериментальных данных (в нашем гипотетическом примере - на основании значений активностей соединений 1, 2 и 3) и подставляют их в уравнение. Полученное уравнение может быть использовано для вычисления активности лишь тех новых соединений рассматриваемого ряда, которые содержат заместители, по природе и положению идентичные заместителям уже исследованных соединений (например, в нашем случае (см. рис. 2) - для соединений 4, 5, 6). Часто, однако, таким образом удается рассчитать активность довольно большого числа новых структур.

Рис. 2 Серия гипотетических соединений, иллюстрирующая возможности теоретического расчета биологической активности

Помимо таких чисто эмпирических методов в середине XX в. были предприняты попытки использовать в корреляционных уравнениях параметры, учитывающие липофильность соединений, а также электронные и стерические эффекты заместителей. В 1964 г. Корвин Ганч опубликовал в журнале Американского химического общества свою работу «с - у - р анализ. Метод корреляции биологической активности и химической структуры», которая впоследствии получила такой высокий индекс цитирования, что была названа Международным институтом научной информации «классической работой». 1964 год условно считается годом рождения современной методологии QSAR.

Заслугой Корвина Ганча явились следующие важные идеи. Во-первых, он предложил скомбинировать в одном уравнении сразу несколько структурных параметров, характеризующих электронные, стерические и гидрофобные свойства молекулы. Во-вторых, для нелинейных соотношений липофильность - активность Ганч предложил параболическую модель. Он заключил, что для связывания с молекулами-мишенями лекарственные соединения должны иметь возможность, с одной стороны, циркулировать в кровотоке (т.е. быть растворимыми в воде), а с другой стороны - проникать через мембраны клеток (т.е. растворяться в жирах). В таком случае активность веществ с очень маленьким или очень большим коэффициентом распределения (т.е. очень гидрофильных или очень липофильных) будет незначительной, т.к. они либо не смогут пройти через липидные мембраны, либо будут захвачены жировой тканью. Это означает, что зависимость активности от коэффициента распределения будет в общем случае представлять собой параболическую кривую, имеющую максимум. Подобные зависимости Ганч предложил описывать уравнениями, содержащими вторую степень. В общем виде предложенное им корреляционное уравнение для данного вида активности в данном ряду химических соединений имеет вид:

(3)

где с - любая экспериментальная величина, характеризующая биологическую активность, Р - коэффициент распределения вещества между липидной и водной фазами (Ганч использовал систему октанол-вода), параметры у и Es отражают соответственно электронные и стерические влияния заместителей, ai - постоянные, полученные при обработке экспериментальных данных методом наименьших квадратов. В частных случаях один или несколько коэффициентов ai могут принимать нулевое значение, тогда величина log(1/c) зависит от меньшего числа параметров.

Например, биологический ответ живого организма может определяться только гидрофобными характеристиками вещества, в то время как его электронные и стерические параметры могут не играть существенной роли, и наоборот.

Основной характеристикой липофильности молекулы, используемой в корреляционных уравнениях, является логарифм коэффициента распределения в системе октанол-вода. Одна из идей Ганча заключалась в том, что эту величину можно представить как сумму введенных им величин р, характеризующих вклад в липофильность отдельных атомов или фрагментов структуры. Очевидно, что параметр р имеет отрицательные значения для гидрофильных групп (например, для карбоксила) и положительные - для гидрофобных групп (например, для метила). Важность этой идеи заключается в том, что, суммируя определенные экспериментальные значения для структурных фрагментов данного соединения, можно получить расчетную величину lgP и в ряде случаев оценить биологическую активность молекул до их синтеза. Например, при создании снотворных средств имеет смысл рассчитать теоретические значения логарифма коэффициента распределения для серии перспективных соединений и синтезировать только те, для которых lgP ? 2, т.к. именно это значение является для них оптимальным.

В настоящее время подход Ганча получил свое развитие и широко используется для поиска корреляций между биологической активностью, липофильностью и другими молекулярными характеристиками. Корреляционные соотношения чрезвычайно важны для предсказания структурных модификаций химических соединений, способствующих повышению их биологической активности. Именно в этой предсказательной силе и заключается основная ценность методологии QSAR - необходимого инструмента для рационального синтеза лекарственных препаратов. Начальные научные исследования Ганча были посвящены изучению реакций высокотемпературной каталитической дегидроциклизации, однако основной областью деятельности является разработка методов поиска количественных соотношений между биологической активностью и химической структурой. Ученый считается одним из главных основателей дисциплины QSAR. Он автор более 300 публикаций, в том числе нескольких монографий. Ряд книг других авторов посвящен Корвину Ганчу в знак признания его выдающихся научных заслуг. По данным Института научной информации Ганч является одним из наиболее цитируемых ученых всего мира.

В 2000 г. Международное общество химической информатики и QSAR (основано в 1989 г.) учредило в честь К.Ганча, почетного председателя общества, специальную награду, которая вручается ежегодно на европейском симпозиуме по QSAR [1].

2. QSAR в системе оценки мутагенности

Роль структуры химических мутагенов в эффективности индукции тех или иных генетических изменений изучается фактически с момента открытия химического мутагенеза. Не вдаваясь в историю этого вопроса, можно отметить, что исследования зависимости между структурой химического соединения и проявляемой им биологической активностью (в частности, мутагенной) опираются на основное положение структурной теории химии, утверждающее, что химическая структура определяет основные физико-химические свойства данного соединения. Это положение послужило основанием для выделения у химических соединений определенных факторов (дескрипторов) и установления связи, качественной (SAR) или количественной (QSAR), между ними и биологической активностью соединения. В качестве таких дескрипторов используются различные характеристики молекулы:

топологические - фрагменты структуры (подструктурные дескрипторы), индексы атомов и связей, каппа-индексы, описывающие форму молекулы, индексы молекулярных связей (MCI);

квантовые параметры - энергии HOMO (высшей занятой орбитали) и LUMO (низшей незанятой орбитали), заряды на различных атомах, электронные плотности, поляризуемости;

параметры, относящиеся к целой молекуле - молярная рефракция,

коэффициент распределения октанол-вода.

Применительно к генотоксичности толчком к применению методологии SAR и QSAR послужили представления, развитые в конце 70-хх годов Миллером и Миллером [2] о решающей роли электрофильности в способности химических соединений реагировать с ДНК и индуцировать мутагенез и канцерогенез. Основываясь на этой концепции, Эшби ввел понятие «структурного алерта», представляющего собой структурный сигнал опасности в молекулах химических соединений. Эшби и Теннан [3] сделали выборку наиболее часто встречаемых в молекулах генотоксикантов электрофильных групп - «структурных алертов» и объединили их в гиперструктурную молекулу. Сравнивая эту гипотетическую молекулу с молекулами соединений, для которых нужно предсказать генотоксические свойства, можно выявить в этих соединениях наличие “структурных алертов”. Тогда, следовательно, такие соединения могут считаться потенциальными мутагенами и канцерогенами. Прогностическая значимость оценки, основанной на наличии или отсутствии алертов в молекуле близка к показателям в тесте Эймса [3].

Но если «структурные алерты» показывают только потенциальную возможность молекулы проявлять генотоксическую активность, то возможные модуляторы биологической активности уменьшают или увеличивают этот потенциал. Такими модуляторами могут являться реактивность, растворимость соединения, существование специфических метаболических сайтов. Причем, при анализе нельзя смешивать функции “структурных алертов”, ответственных за активность, с функциями модуляторов, что может привести к ложным предсказаниям.

Определение множества дескрипторов для каждой молекулы, их корреляций с мутагенной/канцерогенной активностью, отбор наиболее значимых дескрипторов, вносящих наибольший вклад в биологическую активность, требуют использования специальных компьютерных программ. Наиболее перспективными с точки зрения предсказания генотоксичности можно считать пакеты программ CASE, MULTICASE, META [4, 5, 6].

3. Перспективные методы QSAR

3.1 Программы CASE и MULTICASE

Для анализа взаимосвязей между мутагенной/канцерогенной активностью и структурой наиболее применимыми и надежными считаются методы, базирующиеся на экспертной оценке, которая сравнивает и категоризирует структуры новых соединений в соответствии с информацией, извлекаемой из большой базы данных. Таковы программы CASE (Computer Automated Structure Evaluation) [4] и MULTICASE [5]. Последняя является модификацией первой, включающей иерархический отбор дескрипторов.

CASE - обучаемая программа, начинает свою работу со считывания всех структур в обучающей выборке и их фрагментирования на цепочки по 2-10 связанных неводородных атомов, затем программа для этих фрагментов оценивает вероятность их соотношения с активностью, используя биноминальный и другие статистические методы. В отличие от CASE, MULTICASE отбирает наиболее значимые из этих фрагментов как биофоры, считая их ответственными за активность, наблюдаемую у соединений, содержащих эти фрагменты. Таким образом, биофор понимается как участок локализации основных реакций, приведших к появлению активности. Затем программа идентифицирует внутри уменьшенной обучающей выборки молекул, содержащих биофоры, фрагменты и физико-химические свойства, играющие роль в модуляции активности биофоров.

CASE и MULTICASE -анализ полностью автоматизирован и удобен для пользователя. Для оценки новой молекулы (анализируемая выборка) программа сначала проверяет наличие в ней биофоров, если их нет, то молекула предсказывается как неактивная; если молекула содержит биофоры, тогда исследуется наличие модуляторов для этих биофоров - результатом является качественное и количественное предсказание активности. Получаемые уравнения QSAR действительны только внутри домена, определяемого соответствующими биофорами.

3.2 МЕТА - программа

Канцерогенность и мутагенность часто ассоциируется с электрофильным потенциалом молекулы, однако, электрофильность молекулы может выявиться или сразу, или после одного или нескольких этапов метаболической трансформации. Для решения проблемы метаболической трансформации ксенобиотиков была создана экспертная программа МЕТА [6], которая использует предварительно установленные правила в идентификации структурных мишеней для некоторых ферментов и преобразует эти мишени, имитируя метаболическую трансформацию.

Множество известных метаболитов может быть классифицировано в соответствии с их потенциальной биологической активностью по различным критериям: терапевтически активный, неактивный экскретируемый, неактивный неэкскретируемый, потенциально токсичный т.д. Различные метаболиты могут локализоваться в различных тканях в зависимости от способа введения, коэффициента распределения, способности связываться различными белками и от специфических для соединения механизмов действия.

Взаимодействие специфического фермента и данной молекулы возможно при определенном уровне растворимости данной молекулы. Например, циотхром Р-450 имеет тенденцию к существованию в липофильном окружении, поэтому молекула с низкой липофильностью имеет меньшую вероятность подвергнуться воздействию этого фермента. Проблема влияния растворимости на метаболическую трансформацию решается с помощью программы LOGP, входящей в пакет МЕТА, и рассчитывающей коэффициенты распределения октанол-вода. В зависимости от расчетной величины logP, молекула подлежит или не подлежит трансформации соответствующим ферментом, также оценивается ее способность проходить через мембрану или двигаться от органа к органу.

Наиболее распространенным структурным элементом многих ксенобиотиков являются ароматические кольца с делокализованными двойными связями. Для оценки способности метаболитов таких молекул подвергаться, например, окислению цитохромом Р-450, привлекаются квантово-химические параметры.

Большинство данных касается путей биотрансформации различных метаболитов для животных, а не для человека. Поэтому первый этап оценки стабильности метаболитов, основывается на общих для всех видов реакциях, а специальные задачи могут быть решены с учетом различий метаболизма между видами. В отдельных случаях могут рассматриваться генетически обусловленные индивидуальные вариации метаболизма, такие как полиморфизм, связанный с N-ацетилированием и P-450-опосредованным окислением.

После каждого этапа трансформации программа с помощью словаря спонтанных реакций оценивает стабильность полученного метаболита и продолжает трансформировать структуру до образования конечного продукта, нестабильные метаболиты автоматически разрушаются. Метаболиты, оцениваемые как потенциально мутагенные/канцерогенные, вносятся в базу данных CASE или MULTICASE.

4. Уравнения QSAR

Конечным результатом анализа является линейно-регрессионное QSAR-уравнение, содержащее наиболее значимые дескрипторы с соответствующими коэффициентами примерно такого вида:

(4)

где А - это какой-либо биологический ответ, xi - дескриптор, который описывает присутствие или отсутствие i-ого заместителя, zi - вклад i-ого заместителя в log(A), m -константа;

Как видно из этого уравнения они описывают линейную аддитивную комбинацию свойств заместителей в молекуле, между тем нелинейные взаимодействия вносят существенный вклад в биологическую активность. В основном, нелинейные эффекты обусловлены:

- кинетикой транспорта и распределения соединения в биологической системе;

- лимитом пространства для взаимодействия гидрофобных групп с сайтом связывания;

- аллостерическими эффектами;

- возрастающим метаболизмом липофильных аналогов;

-ингибированием конечного продукта липофильными продуктами ферментных реакций;

- ограниченной растворимостью высших аналогов;

- принципом минимальной оккупации рецептора.

Для математического описания основных нелинейных эффектов, связанных с липофильностью, Ганч сформулировал параболическую модель [6]. Его уравнение включает квадрат параметра, описывающего липофильность и выглядит следующим образом:

log(A)= as + bp + cp2 + dEs + eMR + f (5)

где p Ганча измеряет липофильность (гидрофобность), Es Тафта - стерические факторы, MR - молярную рефракцию и дисперсионные силы, а s Хаммета - электронные взаимодействия. Величины s, p, Es, MR относятся к отдельным заместителям и определяются по таблицам.

Была сделана компьютерная модель транспорта в биологической системе с гипотетическими константами и она не показала существенного отклонения от сторон параболы, что говорит о хорошем соответствии модели Ганча конкретным взаимодействиям.

Было проведено сравнительное изучение мутагенной активности производных бифенила, флуоренона, фенантренхинона, пирена и его гетероциклических аналогов в тесте Эймса на штамме Salmonella typhimurium TA 1538 (всего 60 соединений). Большинство из исследованных соединений показало мутагенную активность и некоторые из них индуцируют до 7000 ревертантов/нмоль [8-11]. Анализ полученных данных выявил, что пара-положение нитро-, амино- групп определяет высокую мутагенную активность, наличие же заместителей (нитро-, ацетил-, карбонил- ) в других положениях ослабляет или усиливает эту активность.

Для получения уравнений QSAR на выборке исследованных соединений были выбраны следующие дескрипторы:

d1 - энергия нижней незанятой молекулярной орбитали (LUMO);

d2 - величина максимального заряда на атоме азота;

d3 - величина максимального заряда на атоме кислорода;

d4 - logP (липофильность);

d5 - наличие нитрогруппы в пара- положении;

d6 - наличие аминогруппы в пара- положении;

d7 - наличие заместителей в мета- и орто- положениях.

Квантово-химические параметры каждой молекулы рассчитывали по методу Хюккеля, анализ корреляций между дескрипторами и мутагенной активностью проводили с помощью программы «EMMA» (Effective Modeling of Molecular Activity), которая позволяет осуществить множественный линейный регрессионный анализ [9, 10] .

Соединения были разделены на 2 группы: первая включала гетероциклические аналоги пирена, производные фенантрена и флуоренона; вторая - производные бифенила.

Была получена серия регрессионных уравнений со следующими параметрами:

Nhis+ - число his+ ревертантов при дозе 7,5 нмоль/чашку;

R - коэффициент корреляции между экспериментальными и прогнозируемыми значениями логарифма числа his+ ревертантов;

Sv - среднеквадратичная ошибка прогноза логарифма his+ ревертантов в контрольной выборке;

F - значение критерия Фишера;

Для гетероциклических аналогов пирена и производных фенантрена и флуоренона (всего 39 соединений) были получены следующие уравнения QSAR:

(6)

R = 0,72; Sv = 1,31; F = 14,72

(7)

R = 0,75; Sv = 1,24; F = 11,25

(8)

R = 0,80; Sv = 1,21; F = 6,68

Для замещенных бифенилов (21 соединение) были получено следующее уравнение:

(9)

R = 0,82; Sv = 1,12; F = 16,37

Для всех соединений, т.е. для объединенной группы соединений, было получено уравнение:

(10)

R = 0,75; Sv = 1,94; F = 18,80

Все эти соединения удовлетворительно прогнозировали мутагенную активность контрольных выборок соединений (3 производных пирена и фенантрена и 2 производных бифенила).

Следует отметить, что во всех уравнениях присутствует дескриптор d1 - энергия LUMO, которая характеризует способность соединения реагировать с нуклеофилами, т.е. его электрофильность. Для замещенных бифенилов (уравнение 4) QSAR-уравнение включает только 2 дескриптора: d1 и d4 , характеризующие энергию LUMO и степень липофильности, соответственно.

Анализ уравнений QSAR, характеризующих взаимосвязь структура-активность в группе разнородных соединений, включающей гетероциклические аналоги пирена, производные фенантрена и флуоренона показывают, что величина R зависит от числа включенных в уравнение дескрипторов (уравнения 1 - 3). Например, R = 0.80 достигается только при включении в QSAR-модель таких дескрипторов как d2 и d3, характеризующих величину максимального заряда на атомах азота и кислорода, соответственно. Вместе с тем наличие в этом уравнении дескрипторов d5 и d6, характеризующих наличие нитро- и амино- группы в пара- положении, соответственно, отражает наши эмпирические выводы, сделанные на основе анализа экспериментальных данных.

Объединенная выборка описывалась уравнением 5 (R=0.75), которое включало такие дескрипторы как d1 - энергия LUMO (электрофильность), d4 - logP (липофильность), d5 - наличие нитро- группы в пара- положении молекулы.

Дальнейшее повышение коэффициента корреляции между экспериментальным и прогнозируемым значением мутагенной активности (логарифм числа his+ ревертантов) достигалось только при увеличении числа квантово-химических и подструктурных дескрипторов. Однако, как известно, увеличение числа дескрипторов в уравнениях QSAR, с одной стороны повышает точность прогноза, с другой стороны сужает круг прогнозируемых структур [12]. Это может привести к тому, что уравнение с высоким уровнем значения коэффициента корреляции (R>0.90) и общим количеством дескрипторов будет прогнозировать активность в реальной ситуации не лучше, чем уравнения с дескрипторами, характеризующими наиболее общие свойства обучающей выборки, поскольку речь идет о конкретных количественных показателях (количество his+ ревертантов, процент клеток с хромосомными аберрациями и т.д.), а не о качественных характеристиках, таких как “активен “ и “неактивен.”

В целом, прогностическая ценность уравнений QSAR зависит от ряда общих проблем, касающихся принципов подготовки материала для анализа методами SAR и QSAR. Это связано с тем, что сами подходы к изучению взаимосвязи структура-активность основаны на использовании и экспертной оценке существующих знаний о физико-химических свойствах исследуемых соединений и о механизмах их биологической активности. Все это зависит от современного уровня знаний, точек зрения, предположений, которые могут быть верными и неверными.

5. Общие проблемы использования методов SAR и QSAR

5.1 Размер и неоднородность базы данных

От размера и однородности обучающей выборки зависит прогностическая способность уравнений QSAR. Большая и однородная база данных, полученная на группе родственных соединений, позволяет получить уравнение с высокими предсказательными возможностями и с ограниченным числом дескрипторов, описывающих главные свойства химических соединений, с которыми связано наличие или отсутствие биологической активности (например, уравнение 4 для производных бифенила). Неоднородная база данных и, соответственно, такая же обучающая выборка, не позволяет получить уравнения с высокими предсказательными возможностями (уравнение 1). Увеличения значения R для таких выборок можно достичь только за счет увеличения ее размера или числа дескрипторов (уравнение 3).

5.2 Проблема выделения дескрипторов

В принципе, в качестве дескрипторов для включения в уравнения QSAR можно использовать всевозможные квантовые, физико-химические свойства и структурные характеристики, а затем с помощью статистических процедур отбирать те из них, которые лучше всех коррелируют с активностью. Однако, такой подход нуждается в проведении большой предварительной работы, например, расчета квантово-химических параметров для каждого соединения, включенного в базу данных, с помощью специальных программ. Поэтому при анализе структура-активность химических мутагенов особое внимание уделяется механизмам мутагенного действия химических соединений (алкилирование, интеркаляция и др.). Так, известно, что мутагенная активность отражает способность молекул к реакции с азотистыми основаниями ДНК. В таком случае общим свойством соединений с мутагенной активностью является наличие в их молекуле электрофильных свойств или эти сайты образуются в результате метаболизма. Недостатком подобного подхода является то, что для выделения таких «структурных алертов» необходимы глубокие знания химии и метаболизма соединений, чего нет на практике, и то, что электрофильная теория не может быть признана единственно верной. Анализ существующих баз данных по мутагенной активности нитроароматических соединений и ароматических аминов показывает, что чтобы отличить мутагенные соединения от немутагенных при наличии у всех структурного алерта - нитро- или амино- группы, необходимо обязательно учитывать наличие дескрипторов-модуляторов мутагенной активности. Из уравнений 2 и 3 следует, что включение в уравнение таких позиционных эффектов, как наличие заместителей в пара-, орто-, мета- положениях, увеличивает его прогностическую значимость. Если энергию LUMO, отражающую электрофильность молекулы и logP - показатель ее биологической доступности, принять за основные дескрипторы, то другие дескрипторы являются модуляторами мутагенной активности.

Путем пошагового отбора квантово-химических дескрипторов с максимальным индивидуальным коэффициентом корреляции с мутагенной активностью было получено следующее уравнение для бифенильных соединений:

(11)

R = 0.95; Sv = 0.69; F = 35

где d1 - минимальный квадрат коэффициента вклада атомной орбитали углерода в низшую свободную молекулярную орбиталь;

d2 - минимальный квадрат коэффициента вклада атомной орбитали азота в низшую свободную молекулярную орбиталь;

d3 -максимальный индекс свободной валентности на атоме углерода;

d4 - среднее значение индекса свободной валентности на атомах кислорода.

Данное уравнение отличается от уравнения 4 для бифенилов высоким уровнем коэффициента корреляции R=0,95. Однако, оно не отражает возможного механизма мутагенного действия соединения и не имеет очевидного биологического смысла, что затрудняет его восприятие с точки зрения биолога-экспериментатора. Поэтому при выборе дескрипторов всегда возникает дилемма как поступить - выбрать дескрипторы исходя из одних механизмов мутагенного действия и результатов анализа экспериментальных данных или перебирать всевозможные квантовохимические параметры.

Как показывает опыт, в первом случае получаем уравнения с коэффициентом корреляции между экспериментальными и прогнозируемыми значениями показателя мутагенности R от 0,80 до 0,90, а во втором - более 0,90. Однако, реальная предсказательная ценность уравнений второго типа пока остается неизвестной.

5.3 Проблема экспертизы баз данных и выработки алгоритма QSAR - анализа

Следует отметить, что при существующем разнообразии программ QSAR и баз данных по мутагенной активности химических соединений в различных тест-системах, достаточно корректное уравнение QSAR можно получить только при совместной работе биологов, химиков, математиков. Первая задача заключается в определении цели - получить коэффициент корреляции между активностью и структурными особенностями молекулы (качественный анализ - SAR) или получить коэффициент корреляции между экспериментальными и прогнозируемыми значениями мутагенной активности (количественный анализ - QSAR). В последнем случае количественные экспериментальные данные анализируются и формализуются (log числа his+ ревертантов/нмоль; log числа хромосомных аберраций на 1 кл/на ед. дозы). Затем решается вопрос об однородности базы данных с точки зрения структур химических соединений. Если принимается обоснованное решение о разделении базы данных на подгруппы, исходя из химических структур, то дальнейший анализ проводится для каждой подгруппы по отдельности. Выбор дескрипторов зависит как от общих знаний механизма мутагенного действия, так и от возможности программ, которые предполагается использовать для расчета квантовохимических параметров и анализа фрагментов структур, а также для регрессионного анализа связи между рассматриваемыми дескрипторами и мутагенной активностью.

В конечном итоге выбираются те уравнения QSAR, которые достаточно удовлетворительно прогнозируют активность соединений, отнесенных к контрольной выборке.

Заключение

Исследование количественных соотношений связи структура-активность (КССА), позволяющие проводить целенаправленный синтез новых соединений с определённым уровнем выраженности биологического действия, является одной из задач фармации. для выявления количественной зависимости КССА используется широкий спектр как экспериментально определяемых констант ионизации и липофильности, так и теоретически рассчитываемых физико-химических параметров исследуемых веществ (дипольный момент, молекулярная масса, заряды на атомах и т.д.).

В большинстве исследований по изучению зависимости структура-активность использованы результаты тестирования химических соединений на мутагенную активность на штаммах S. typhimurium в тесте Эймса. Для QSAR - анализа были использованы самые различные подходы, однако наибольшее число исследований проведено с использованием метода CASE. В настоящее время имеются данные анализа почти всех основных групп химических соединений от алкилирующих агентов до полициклических ароматических углеводородов. Пока рано говорить об общеизвестных уравнениях, описывающих зависимость мутагенной активности от структуры тех или иных классов химических соединений. Вместе с тем, имеющиеся данные свидетельствуют о том, что методология QSAR может быть с успехом использована для вне экспериментального прогноза активности новых соединений, если они относятся к тому или иному ряду химических соединений, для которых уже имеются уравнения QSAR. Это имеет большое значение при установлении очередности, а в ряде случаев глубины, экспериментальных исследований. Пока речи о замене теста Эймса или другого теста методологией QSAR нет. Возможно, такая постановка проблемы в будущем встанет. Но ясно одно, что QSAR является хорошим инструментом для вне экспериментального прогноза.

Литература

1. Зефирова О.Н., Палюлин В.А. История QSAR. Ранние исследования количественной связи между структурой и биологической активностью органических соединений; В кн.: История химии: область науки и учебная дисциплина. Под ред. В.В.Лунина и В.М.Орла. М.: Изд-во МГУ, 2001, с. 60-73, 74-81.

2. Miller J.A., Miller E.C. / In: Hiatt H.H., Watson J.D., Winstein J.A. (Eds) Origins of Human Cancer // Cold Spring Harbor Laboratory. 1977. P. 605-628

3. Ashby J., Tennant R.W. // Mutat. Res. 1991. V. 257. P. 229-306

4. Rosenkranz H.S., Klopman G. // Toxicol. Ind. Health. 1988. V.4. P. 533-540

5. Klopman G., Rosenkranz H.S. // Mutat. Res. 1994. V. 305. P.33-46

6. Klopman G., Ddimayuga M., Talafos J. // J. Chem. Inf. Comput. Sci. 1994. V.34. P. 1320-1325

7. Hansch C., Fujita T. // J. Ann. Chem. Soc. 1964. V.86. P . 1616-1626

8. Любимова И.К., Абилев С.К., Мигачев Г.И. // Генетика, 1995. N 2. С. 268-272

9. Баскин И.И., Любимова И.К., Абилев С.К., Палюлин В.А., Зефиров Н.С. // Доклады АН. 1993. Т. 332. N 5. С. 587-589.

10. Баскин И.И., Любимова И.К., Абилев С.К., Палюлин В.А., Зефиров Н.С. // Доклады АН. 1994. Т. 339. N 1. С. 106-108.

11. Любимова И. К. Зависимость мутагенной активности полициклических ароматических соединений от их структуры. Автореферат канд. диссертации. М. 1994. 25 с.

12. Bengini R., Andreoli C., Giuliani A. // Mutat. Res. 1989. V. 221. P. 197-216

Размещено на Allbest.ru


Подобные документы

  • История исследования неформальной экономики. Проблема дефиниции термина "неформальная занятость". Основные критерии выделения неформальных работников и выбора данных для анализа. Анализ экономической ситуации и последствий выбора неформальной занятости.

    курсовая работа [817,9 K], добавлен 13.10.2016

  • Система национального счетоводства. Валовой внутренний продукт (ВВП), принципы его расчета. Соотношение показателей в системе национальных счетов. Номинальный и реальный ВВП, индексы цен. Состав и структура, проблема оценки национального богатства.

    реферат [50,5 K], добавлен 20.07.2015

  • Понятие экономического анализа как науки, его сущность, предмет, общая характеристика методов и социально-экономическая эффективность. Основные группы эконометрических методов анализа и обработки данных. Факторный анализ экономических данных предприятия.

    реферат [44,7 K], добавлен 04.03.2010

  • Материальные затраты на разработку базы данных. Основная и дополнительная заработная плата разработчиков. Расходы по содержанию и эксплуатации машин и оборудования. Расчёт коммерческой и экономической эффективности применения базы данных в организации.

    курсовая работа [322,1 K], добавлен 21.04.2012

  • Машинное обучение и статистические методы анализа данных. Оценка точности прогнозирования. Предварительная обработка данных. Методы классификации, регрессии и анализа временных рядов. Методы ближайших соседей, опорных векторов, спрямляющего пространства.

    контрольная работа [833,1 K], добавлен 04.09.2016

  • Организационные формы и субъекты экономического анализа. Элементы информационной системы анализа, цели предоставления и степень точности информации. Состав информации, необходимой для принятия управленческого решения; справочно-правовые базы данных.

    лекция [46,5 K], добавлен 27.01.2010

  • Статистика в медицине как один из инструментов анализа экспериментальных данных и клинических наблюдений. Понятие количественных (числовых) данных. Выборки численных переменных. Виды критериев для независимых выборок, особенности их использования.

    презентация [750,1 K], добавлен 16.10.2016

  • Производственные возможности экономики. Сущность производства, его основные формы. Проблема выбора в экономике, его диапазона для потребителя. Альтернативные издержки и размер упущенной выгоды. Расчет равновесной цены и объема продаж, излишек потребителя.

    контрольная работа [46,7 K], добавлен 30.10.2014

  • Изучение особенностей земли как товара в России. Исследование основных принципов рыночной стоимости земли. Согласование результатов оценки стоимости земли. Анализ методов сравнения продаж, распределения, выделения, остатка и капитализации земельной ренты.

    реферат [25,0 K], добавлен 30.11.2016

  • Роль корреляцонно-регрессионного анализа в обработке экономических данных. Корреляционно-регрессионный анализ и его возможности. Предпосылки корреляционного и регрессионного анализа. Пакет анализа Microsoft Excel.

    курсовая работа [68,4 K], добавлен 11.06.2002

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.