Біоінформатика як основа сучасної біотехнології

Дисципліна біоінформатика, опис глобальних проблем, пов’язаних з нею. Створення молекулярно-біологічних баз даних для нуклеотидних та амінокислотних послідовностей. Визначення точної просторової структури біомолекули та процедура її розшифровки.

Рубрика Программирование, компьютеры и кибернетика
Вид реферат
Язык украинский
Дата добавления 16.12.2013
Размер файла 105,8 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Міністерство освіти та науки України

Національний технічний університет України «Київський політехнічний інститут»

Реферат на тему:

«Біоінформатика як основа сучасної біотехнології»

Виконала студентка ІІ курсу

групи АМ-83

факультету: Соціології та права

Швець А. Є.

Перевірила Гнатюк Н. Ф.

Київ 2009

Бажання пізнавати - це той голод, який людству мабуть ніколи не втамувати. Перешкоди ж на шляху пізнання лише розпалюють апетит. Людство, як і кожний окремий його представник, здебільшого долає ці перешкоди беззастережно, не озираючись назад і не дивлячись уперед. А тому результати нашої діяльності подекуди виявляються жахливими. Так спроба пізнати закони мікросвіту призвела до відкриття можливості ядер ділитися або зливатися (ядерної та термоядерної реакцій). Відносно швидко ми навчилися використовувати нові закони природи, і от ми вже «долаємо» наслідки гонки озброєнь та необачного використання «мирного атому». Дослідження ж довготривалого впливу радіації на людину та довкілля тільки розпочалися.

З іншого боку ніхто не стане заперечувати, що науково-технічний прогрес призвів до істотного поліпшення умов життя більшої частини людства, порівняно з середньовіччям - століттями наукового «застою». Однак і тут на нас чатує небезпека. Через покращення умов життя стрімко зросла кількість людей на нашій планеті, зокрема, і тих хто просуває вперед науково-технічний прогрес - науковців, інженерів та ін. Так на початку 20-ого сторіччя усіх фізиків-теоретиків можна було перерахувати по пальцях, а сьогодні їх вже десятки тисяч. Така сама ситуація і в інших галузях науки. Це призводить до стрімкого збільшення обсягів нової інформації і до практичної неможливості не тільки контролювати, а й спрогнозувати її вплив на людство та біосферу Землі в цілому.

Неможливість охопити розумом однієї людини всього розмаїття наукових даних та їхніх застосувань спричиняє, не зважаючи на новітні засоби обміну інформацією, певну ізоляцію науковців і цілих їх осередків та, через певну упередженість, до їх безвідповідальності за наслідки власних досліджень.

Однак нарощування темпів наукового пізнання дає і надію на вихід з описаної вище пастки. По-перше, слід відійти від вузької спеціалізації при підготовці фахівців в усіх галузях науки, а по-друге, необхідно постійно стимулювати наукові дослідження, щоб долати перешкоди на шляху пізнання, пов'язані з негативними наслідками, швидше ніж ці наслідки подолають нас.

Прикладом такого підходу може слугувати новий напрямок молекулярної біології - біоінформатика, або обчислювальна молекулярна біологія [1-11]. Це складна дисципліна, що потребує від фахівців знань в області фізики, хімії, математики, біології та інформатики. Розвиток цієї галузі науки активно стимулюється. В останній час кількість центрів біоінформатики зросла в декілька разів і складає більше двох сотень у всьому світі.

Однак нестача дослідників, які мають навички в цій області, є фактором, що стримує дослідження в сфері геноміки. У біологію зазвичай йдуть люди з іншим складом розуму, ніж у фізику. Вчених, які здатні вести дослідження на перетині інформатики, природничих та інженерних наук, дуже мало. За кордоном біоінформатика є галуззю науки, що швидко розвивається. Проекти з біоінформатики активно фінансуються фармацевтичними і біологічними фірмами, а також науковими фондами і урядами США, Японії та країн Євросоюзу.

Біоінформатику відносять до числа високих технологій сучасної біології, яка забезпечує інформаціонно-комп'ютерні та теоретичні основи генетики і селекції, молекулярної біології, генетичної та білкової інженерії, біотехнології, медичної генетики, генної діагностики та генотерапії, екології, тобто тих наук, завдяки досягненням яких біологія перетворилася в одну з провідних наук цього сторіччя. Вона посідає в сучасній біології ключову та виключно важливу позицію.

Предметом досліджень біоінформатики є біологічні системи на трьох рівнях їх організації [11,12]: молекулярно-генетичному; на рівні клітин, тканин та цілих організмів; популяційному та екосистемному.

До глобальних проблем, які стоять перед людством у 21 сторіччі, розв'язок яких пов'язаний з революційними досягненнями молекулярної біології, відносяться наступні:

* забезпечення населення Землі, що стрімко зростає, продуктами харчування на основі сучасних генетичних технологій - клонування організмів і трансгенезу;

* створення технологій нового покоління на основі методів промислової мікробіології, що орієнтуються на стратегію енергозбереження та енергозаміщення;

* розробка стратегій збереження та відновлення біосфери, що руйнується в результаті техногенної діяльності людини;

* збереження природного генофонду планети, в тому числі і людства в умовах руйнації природного довкілля;

* створення медицини нового покоління, що здатна розв'язати проблему онкологічних та гормональних захворювань, контролювати глобальні пандемії, що набувають все небезпечніші для людства риси (вірус СНІДА, нові форми туберкульозу та ін.), опрацювати стратегії лікування спадкоємних та мультифакторних захворювань які базуються на спрямованій дії на молекулярно-генетичні механізми життєдіяльності організму людини.

Насьогодні молекулярна біологія і генетика є лідерами як за обсягом нової інформації, так і за темпами її впровадження в технології. Математиці, наприклад, від обчислення площі кола до створення перших обчислювальних машин знадобилося більше 2000 років, а фізиці від відкриття закону всесвітнього тяжіння до польотів у космос - біля 300 років.

Молекулярній же біології від відкриття у 1953 році структури ДНК та принципів кодування генетичної інформації знадобилося всього біля 30 років до її широкомасштабного промислового використання. Істотний прорив у цій області пов'язують з відкриттям у 70-х роках 20 сторіччя оберненої транскрипції (синтезу ДНК з використанням РНК в якості матриці) та клонування ДНК і створенням на цій основі методів швидкого секвенування, тобто встановлення первинної структури нуклеотидних послідовностей. У 1987 р. було розроблено методи автоматичного секвенування (Л. Худ, Т. Хункапиллер).

Водночас потік інформації стосовно структури та властивостей генів і кодованих ними білків почав зростати експоненційно (див. Рис. 1). Обробка та аналіз цієї інформації традиційними статистичними методами стали практично неможливими. Проте, швидкий розвиток обчислювальної техніки та значний прогрес у розробці ефективних методів організації, збереження й аналізу інформації створили необхідні умови для розв'язання цієї задачі.

Основою успіху молекулярної біології є не тільки великий інтерес до неї науковців та промисловців, але й використання нею нетрадиційних для математики, фізики або хімії підходів. По-перше, це створення і широке використання загальнодоступних молекулярно-біологічних баз даних (БД), які є одним з основних її інструментів.

При цьому особливу роль відіграє Інтернет (та інші мережеві технології), з одного боку, як засіб забезпечення вільного доступу до накопиченої інформації та інструментів для її обробки, а з другого, як спосіб розгалуження великих обчислювальних задач. З 1982 р. з молекулярній біології, зокрема, для нуклеотидних та амінокислотних послідовностей, створено декілька тисяч баз даних. Серед них є електронні банки даних, як загального призначення, так і вузькоспеціалізовані, а також бази даних наукових робіт з біології та медицини (Medline, PubMed, та інш.) [13-17].

По-друге, це надання певним емпіричним правилам, що одержані шляхом статистичного аналізу інформації з відповідних БД, статусу «законів». Яскравим прикладом такого підходу можуть бути так звані «золоті правила», які дозволяють робити висновки про фізико-хімічні та функціональні характеристики складних молекул на основі їхньої подібності до інших молекул з уже відомими властивостями [1-5].

Слід зауважити, що в основі математичних або фізико-хімічних дисциплін лежать певні, здебільшого прості постулати, на основі яких розбудовано за допомогою строгих формалізованих міркувань сучасне підґрунтя всіх точних наук. Також значного успіху як у фізиці так і хімії було досягнуто тільки на тих напрямах, де досліджувані системи допускали істотне спрощення математичних моделей, що їх описують (так задача руху трьох тіл, які взаємодіють за допомогою гравітаційних або кулонівських сил, досі не має аналітичного розв'язку в загальному випадку). На відміну від цих наук молекулярна біологія є, по-перше, дуже молодою дисципліною, а по-друге, вона має справу із надзвичайно складними об'єктами (органічними макромолекулами та великими їх сукупностями), що можуть містити понад 107 взаємодіючих атомів, і, як правило, не допускають істотних спрощень при їх математичному описі. Тобто, ця наука досі знаходиться на стадії первинного накопичення знань і не має строгих математичних основ для опису фізичних властивостей навіть найпростіших її об'єктів - невеликих білків (біля 100 амінокислот).

Однак обчислювальна молекулярна біологія, в основу якої закладені згадані вище емпіричні правила та комп'ютерне порівняння послідовностей, вже зараз відкриває широкі можливості не лише для пошуку й аналізу вже наявної інформації, але й для отримання нових знань з меншими затратами матеріальних та часових ресурсів порівняно з фізико-хімічними дослідженнями.

Так, у людини генів тільки в 4-5 разів більше, ніж, наприклад, у нематоди (круглий черв'як), з яких певна частина є спорідненими. Застосовуючи методи порівняння та аналогії істотно спрощується пошук та опис нових генів людини та їх функцій.

Створення інструментів для аналізу інформації і розвиток необхідних для цього математичних методів, а також нагляд за наповненням баз даних біоінформаційного напряму та їх супровід здійснюється відповідними організаціями з багатьох країн світу.

Однією з таких найвідоміших організацій є International Nucleotide Sequence Database Collaboration (INSDC) - Міжнародний консорціум банків даних, що об'єднує три установи (їхні нуклеотидні БД завдяки постійному обміну інформацією є практично копіями одна одної, але мають різний набір сервісів для подання та аналізу інформації [13-15]).

На відміну від інших галузей науки і техніки, в галузі молекулярної біології більшість фахових видань та молекулярно-біологічних БД надають користувачеві через Інтернет вільний доступ не тільки до повних текстів наукових публікацій, а й до самих досліджуваних об'єктів - кодів нуклеотидних та амінокислотних послідовностей.

Основною причиною такого «альтруїстичного» ставлення до інформації є бажання урядів провідних держав та великих біотехнологічних корпорацій медичної, фармацевтичної, сільськогосподарської спрямованостей прискорити процес накопичення, аналізу та, у підсумку, розуміння та практичного використання даних про найбільш складні з відомих на сьогодні систем - живих об'єктів, від окремих органічних макромолекул до багатоклітинних організмів. Проте, в останній час простежується тенденція до обмеження доступу до інформації, яка вже набула статусу промислової таємниці (це стосується, передусім, первинних структур макромолекул).

Як вже згадувалось, сучасний стан молекулярної біології характеризується стрімким накопиченням інформації. Так, нині вже частково чи повністю просеквеновано біля 200 видів еукаріотичних геномів, серед них, геноми людини (повністю у 2006 р.), шимпанзе, миші, пацюка, кішки, собаки, курки, риби, дрозофіли, малярійного комара, червів і дріжджів, біля десятка геномів рослин та інших організмів. Окрім того, просеквеновано більше тисячі бактеріальних геномів та біля сотні геномів архей.

Встановлено, що довжина генома людини сягає більше ніж 6 мільярдів пар залишків (понад 30 тисяч генів), а з врахуванням інформації, яка одержана при його розшифровці, це становить десятки терробайт даних

Проте для більшості задач молекулярної біології, зокрема, своєчасної діагностики хвороб та підбору нових високоселективних ліків недостатньо прочитати всі літери генетичного коду та визначити необхідний комплект генів, що приймає участь в життєдіяльності організму. У зв'язку з цим наприкінці ХХ століття в біології виник новий розділ, який вивчає якісний і кількісний склад білків, що синтезуються клітиною - протеоміка [1-3,9]. Порівняння протеом різних клітин в нормі і за патології дозволяє визначити механізми, які впливають на розвиток патологічних реакцій. Результатом цього є, наприклад, розробка методів медичної діагностики, що базуються на змінах фізіологічного стану клітини і виражаються в пригніченні або стимуляції синтезу окремих білкових компонентів клітини.

Слід зауважити, що секвенувати бактеріальний геном (біля 1000 генів) можна за добу, а для експериментальної фізико-хімічної характеристики тільки одного білка необхідно як мінімум 2 місяці роботи сучасної лабораторії. Тому для прискорення цього процесу часто використовують специфічні методи комп'ютерної обробки інформації, які складають основу біоінформатики. молекулярний біологічний просторовий біомолекула

При секвенуванні геному одержують довгу послідовність нуклеотидів, яка містить гени, тобто білок-кодуючі ділянки і ділянки, що кодують тРНК та рРНК. Перша задача біоінформатики - знайти ці гени.

Друга задача - пошук сигналів в ДНК, тобто ділянок ДНК, що відповідають за регуляцію транскрипції (сайти зв'язування регуляторних білків) та відтворення інтрон-екзонної структури пре-мРНК, яка транскрибується з гена (тобто ділянок гена, що, відповідно, не кодують та кодують білок), та інше.

Третя задача - передбачення вторинної структури РНК. Існує також значна низка задач з аналізу білків (їхньої просторової структури та функцій). До того ж мають місце задача пошуку генів/білків - потенційних мішеней ліків та задача комп'ютерного пошуку й конструювання ліків. Виходячи з задач біоінформатики створюються та розвиваються методи аналізу даних молекулярної біології та відповідні алгоритми й програми [1-3,11].

Основу біоінформатики складають порівняння. Якщо є дві амінокислотні послідовності, і для першої з них наявні експериментальні дані та відомі її функції, а для другої відомо тільки, що вона має схожу первинну структуру, то можна припустити, що ці послідовності мають подібні просторові структури та виконують схожі функції.

Отож, після секвенування послідовності шукають в базах даних її гомологи (схожі послідовності), щоб після порівняння судити про те, яку структуру може мати досліджувана послідовність та які функції вона може виконувати. Для виконання цих задач розробляються спеціальні числові методи [3].

Однак для розробки числового методу потрібен критерій того, що метод є адекватним, тобто відповідає дійсності. Як оцінити "правильність" методу? Для цього і існує «золотий стандарт»: якщо за застосування обчислювального методу до будь-якої експериментально дослідженої послідовності одержані результати співпадають з експериментом на 80-90%, то даний метод вважається правильним та ефективним. Це стосується як задачі визначення генів, так і передбачення вторинної структури РНК чи білків.

Як вже зазначалося, основним інструментом біоінформатики є порівняння (шляхом вирівнювання) макромолекул. Саме порівнюючи нуклеотидний або амінокислотний склад нової послідовності з первинною структурою біомолекул, що вже занесені в бази даних та досліджені фізико-хімічними методами, роблять висновки щодо гомологічності порівнюваних послідовностей, а на цій основі про еволюційні шляхи розвитку різних організмів, а також про можливе функціональне призначення досліджуваної молекули, що досліджується, її вторинну і третинну просторові структури.

Роль просторової структури макромолекул ДНК, РНК і білків є визначальною у формуванні механізмів їх взаємодії з іншими атомами та молекулами. На сьогодні доведено існування спеціального конформаційного коду подвійної спіралі ДНК, що записаний у просторовій структурі нуклеотидної послідовності.

Наприклад, конформаційний параметр, який описує взаємну орієнтацію сусідніх комплементарних пар в спіралі ДНК (кут спірального оберту twist), залежить від дінуклеотидного контексту (від сусідів). Взаємодія регуляторних білків з ДНК потребує тонкої стереохімічної відповідності між ними та сайтами їх зв'язування. Наприклад, спорідненість СRO-репресора до свого оператора визначається шириною великої борозенки ДНК (рис. 2), спорідненість транскрипційного фактора USF до ДНК залежить від кута twist спіралі ДНК, а спорідненість ТВР білка з сайтом його зв'язування визначається шириною малої борозенки ДНК.

Мутаційні зміни конформації ДНК, які руйнують тонку відповідність між сайтами і регуляторними білками є однією з причин виникнення молекулярної патології. Іншою ж причиною можуть бути відхилення у просторовій структурі самих білків.

Білки також мають декілька рівнів тривимірної структури. Вторинні структури класифікуються за трьома основними видами: б-спіралі, в-листки і петлі. Петлі - це ділянки послідовності, що з'єднують вторинні структури двох інших видів.

На відміну від спіралей і листків, петлі - нерегулярні структури за формою та за розміром. Петлі знаходяться зовні згорнутого білка, тоді як інші структури білкової молекули формують її ядро.

Еволюційно споріднені білки, зазвичай, складаються з однакових спіралей і листків, але можуть мати різні нерегулярні структури (петлі). Тобто, сегменти (мотиви і домени, які є білковими структурами вищого рівня), що формують ядро, є консервативними. Це означає, що вони знаходяться під тиском відбору, тобто вони функціонально важливі. Заміна ж однієї амінокислоти на іншу може в різній мірі впливати на властивості білка. Якщо, наприклад, лізин (позитивно заряджену амінокислоту) замінити на лейцин (незаряджену амінокислоту), то це може змінити як просторову структуру, так і функції білка. А ось заміна лізину на аргінін (також позитивно заряджену амінокислоту) може і не вплинути на структуру та фізико-хімічні властивості білка.

Чутливість просторової структури білка до заміни навіть однієї амінокислоти можна проілюструвати на прикладі інсулінів людини і свині [18-20]. Первинна структура інсуліну людини відрізняється від аналогічної структури інсуліну свині лише амінокислотою в положенні B30: у свині в цьому положенні знаходиться аланін, а у людини -- треонін.

При цьому інсуліни людини і свині мають майже однакові фізико-хімічні властивості (інсулін свині навіть можна деякий час використовувати для людини (що і робили з 1923 по 1961 роки), але з часом чужорідний для людини тваринний інсулін провокував імунний відгук організму і накопичення антитіл до інсуліну свині зводило нанівець його дію).

Однак ці інсуліни різняться не лише амінокислотним складом, а й за що обумовлюють вторинну та третинну структури цих гормонів, а відтак, їхню біологічну активність та антигенні властивості.

Починаючи з 80-х років минулого сторіччя, інсулін людини продукується у промислових масштабах на основі таких біотехнологічних методів, як методи рекомбінантних ДНК, коли певним чином модифікований ген інсуліну людини вводиться в геном архей або бактерій, здатних продукувати відповідний білок у значній кількості, який після деякої хімічної обробки перетворюється на інсулін людини.

Так як макромолекули ДНК, РНК чи білків представляють собою тривимірні об'єкти, чия просторова структура визначає їхні біохімічні функції, то визначення точної просторової структури біомолекул є однією з найголовніших задач біоінформатики. Вищезазначене стало причиною створення баз даних [16,17] функцій та просторових структур білків, які визначаються фізико-хімічними методами [21-29].

Однак визначити тривимірну структуру білків та РНК за допомогою електронної мікроскопії [21], рентгеноструктурного аналізу [22-26] чи методу ядерного магнітного резонансу (ЯМР) [27-29] дуже складно, а часто і взагалі неможливо.

Процедура розшифровки просторової структури, наприклад, за допомогою рентгеноструктурного аналізу є довготривалим і коштовним процесом, який передбачає наступні операції:

а) виділення й очищення білка;

б) кристалізацію очищеного білка (неможливість чого і є головною завадою на шляху рентгенівських досліджень макромолекул);

в) рентгеноструктурний експеримент (отримання розподілу електронної густини;

г) комп'ютерне розшифровування структури білка, яке зводиться до складної задачі пошуку локального мінімуму в просторі більше ніж 100 змінних.

Така складність отримання інформації про тривимірну структуру різко контрастує з відносною легкістю, з якою можна визначити первинну структуру цих молекул.

У зв'язку з цим, сьогодні існує розрив між числом білків з відомою послідовністю амінокислотних залишків (мільйони) та числом білків з визначеною тривимірною структурою (десятки тисяч). Така ситуація призвела до інтенсивного пошуку методів передбачення структури, методів, що можуть на основі аналізу первинної структури молекули, тобто на основі методів біоінформатики, передбачити її тривимірну структуру. Цю групу складають різні методи: від моделювання динаміки молекул до нейронних мереж.

Молекула РНК представляє собою ланцюг нуклеотидів A, C, G і U. Нуклеотид однієї ділянки молекули може утворювати пару з комплементарним нуклеотидом іншої ділянки і таким чином молекула згортається (див. рис. 1). Тобто, послідовність нуклеотидів однозначно визначає механізм згортання молекули, але, навіть, в цьому разі реальна тривимірна структура дуже складна для відомих методів передбачення. В основі цих методів лежить алгоритм обчислення конформацій РНК з мінімальною вільною енергією.

Рисунок 1 Вторинна і третинна структури РНК та елементи вторинної структури РНК

Найпростіший алгоритм - перебрати всі можливі структури та вибрати одну з мінімальною енергією. Але для великих молекул цей алгоритм є практично незастосовним. Тому для пошуку структури з мінімальною вільною енергією використовується метод динамічного програмування [30].

Алгоритмічні методи в загальному випадку ще не можна застосовувати до передбачення структури довільних молекул, бо вони повинні покладатися на достатньо точні моделі згортання молекули, але такі моделі ще не відомі. У випадку передбачення вторинної структури РНК алгоритмічне формулювання може бути знайдено і застосовано на практиці.

Для передбачення ж вторинної структури білка не відомий ніякий загальний та надійний алгоритм методу динамічного програмування. Однак існує метод «протягування» білків, який базується на уявленні про те, що подібні послідовності повинні мати подібні структури. Якщо ми знаємо структуру білка А (наприклад, за даними рентгеноструктурного аналізу), а білок В є подібним до нього на рівні послідовності амінокислотних залишків, то логічно припустити, що структури білка В будуть повністю чи майже повністю відповідати структурам білка А. Однак в більшості випадків це невірно. Білки з подібними первинними структурами, можуть мати вторинні структури, що істотно розрізняються. З іншого боку, було помічено, що деякі білки, досить різні за первинною структурою мають споріднені вторинні структури: вони мають різні форми петель, але їхні ядра дуже подібні. Ці спостереження спонукали до створення нового методу розв'язання оберненої задачі згортання білка за його послідовністю шляхом її співставлення з відомими (гомологічними) структурами з молекулярно-біологічних баз даних.

При дослідженні гомологічності нуклеотидних чи амінокислотних послідовностей за допомогою різних алгоритмів знаходять найбільш консервативні ділянки цих послідовностей. Наприклад, порівнюючи трансляти нуклеотидних послідовностей із відповідними амінокислотними послідовностями можна передбачити межі генів та спрогнозувати наявність для них сплайсингу (у тому числі альтернативного). Для білків, консервативні амінокислотні залишки, зазвичай, є ключовими для виконання однієї чи декількох функцій білка. Важливе місце посідають дослідження доменної структури білків за шляхом пошуку в них відомих структурних мотивів і доменів. Також за допомогою різних баз даних можна здійснити пошук гомолога даного білка в різних організмах та побудувати філогенетичне дерево для цих білкових послідовностей.

Щоб зрозуміти еволюційні зв'язки між білками, а відтак, на глибшому рівні пояснити еволюційну історію сучасних видів, і, зокрема, як види, що живуть зараз, пов'язані один з одним через загальних предків, в молекулярній біології будуються філогенетичні дерева.

"Листя" філогенетичного дерева представляють сучасні види, внутрішні вузли - їх гіпотетичних предків. Проблема побудови філогенетичного дерева полягає в тому, що ми, як правило, не маємо достатньо даних про віддалених предків сучасних видів, тому еволюційну історію можна вивести тільки шляхом узагальнювальних міркувань на основі даних про порівняння сучасних видів.

В еволюційній біології будуються філогенетичні дерева для видів, популяцій, родів, чи інших таксономічних категорій (таксономія - наука про класифікацію). Ключовими в аналізі філогенетичних дерев є питання топології, або схеми розгалуження, та відстані між парами вузлів, яка може бути визначена шляхом "зважування ребер" дерева. В найпростішому випадку, еволюційна відстань між внутрішнім вузлом (предковий об'єкт) та "листком" (сучасний об'єкт) може бути інтерпретована як оцінка часу, що необхідний для еволюції об'єкта-предка в сучасний об'єкт. Для цього спочатку підраховують мінімальну кількість змін, за допомогою якої можна перевести одну символьну послідовність (наприклад, нуклеотидну) в іншу, далі роблять оцінку часу необхідного на реалізацію однієї зміни (мутації), а потім перемножують ці величини. Це загальний підхід, яким визначають, зокрема, спорідненість слів, що належать до різних мов (він прийшов у біологію саме з лінгвістики). Загалом, еволюційна відстань не є еквівалентною до часу, що був затрачений на відповідну еволюційну подію.

Використання біоінформаційних технологій, а саме порівняння ДНК вірусів пташиного грипу та "іспанки", яка забрала 40 мільйонів життів на початку минулого сторіччя, дозволили встановити, що іспанка є не чим іншим, як мутованим вірусом пташиного грипу, який набув здатності передаватися від людини до людини. Ця властивість привернула увагу міжнародної спільноти щодо розробки ефективних методів боротьби з пташиним грипом [31].

Біотехнологічні компанії конкурують між собою в пошуках методів обробки генетичної інформації. Так комп'ютерний алгоритм багатоваріантного аналізу активності генів, розроблений в американському Національному інституті дослідження генома людини, дозволяє вченим аналізувати взаємодію різних генів, що здатна спричиняти захворювання. Так як лише близько 2% захворювань викликано тільки одним геном, алгоритм багатоваріантного аналізу активності генів може застосовуватись при дослідженні будь-якого захворювання. Фактором, що стримує прогнозування означених явищ є обчислювальна потужність комп'ютерів, які застосовуються при обробці генетичних даних за певним алгоритмом. Білл Кемп, директор Національної лабораторії в Сандії (шт. Нью-Мехико, США), сказав: «У нас, у співтоваристві ядерників, вважається, що нічого складніше, ніж розробка ядерного озброєння, не існує, визнаю, геноміка складніша».

Як вже зазначалось, при розшифровці геному людини отримані данні об'ємом десятки терробайт про фізичні та цитогенетичні карти хромосом, їхні нуклеотидні послідовності, локалізацію генів, мутації: виявлено не менше ніж 1,5 мільйона мутацій, за якими геноми людей розрізняються один від одного.

У зв'язку з цим суперкомп'ютерні технології для біологічних досліджень є дуже актуальним напрямом. Насьогодні найшвидкішим у світі є створений у листопаді 2008 року суперкомп'ютер, здатний виконувати 1,105Ч1015 операцій на секунду. Він складений за гібридною схемою з 7000 двоядерних процесорів AMD Opteron та майже 13 000 процесорів IBM Cell 8i (для порівняння суперкомп'ютер НТУУ «КПІ», який займає шосте місце у списку найпотужніших суперкомп'ютерів СНД, містить менше 200 процесорів 2хIntel Xeon).

Однією з головних задач при побудові таких машин є розробка оптимізованої до потреб геноміки програмної архітектури, що буде однаково ефективно працювати як на суперкомп'ютері зі 100, так і з 20 000 процесорів. Іншою задачею є розробка технологій візуалізації, які б дозволили перевести великі масиви інформації у зручніші для сприйняття форми, ніж строки коду чи потоки випадкових, на перший погляд, послідовностей літер [32].

Результати досліджень в галузі біоінформатики можуть також знайти застосування в проектуванні фармацевтичних засобів в залежності від генотипу кожного конкретного пацієнта (індивідуальний підхід до конструювання ліків або персоніфікована медицина), і в застосуванні хімічних речовин для стимуляції сільськогосподарського виробництва в залежності від генотипу певної рослини або тварини.

Біоінформатика та нанобіотехнологія є перспективними і наукоємними галузями технології та науки, в яких вітчизняні вчені можуть працювати на світовому рівні.

Для цього необхідно брати участь у сучасних біотехнологічних проектах, формувати вітчизняні біоінформаційні центри та інтегрувати їх зі світовими біоінформаційними ресурсами. Такі центри могли б вирішувати наступні задачі:

Наукова робота (проведення наукових досліджень та розробка нових інформаційних технологій);

Навчальна робота (організація учбового процесу студентів, аспірантів, докторантів та викладацького складу; створення курсів підвищення кваліфікації; проведення конференцій, семінарів і т. ін.);

Надання послуг в сфері біоінформатики (методичних, інформаційних, наукових та ін.).

При створенні таких центрів може бути використана наявна матеріально-технічна база, яку необхідно модернізувати та доукомплектувати, як новим дослідницьким біотехнологічним обладнанням, так і сучасною обчислювальною технікою.

Створення комп'ютерних центрів біоінформатики дасть можливість розширити інтеграцію України в світові біотехнологічні та біоінформаційні дослідження, та виконувати на сучасному рівні роботи по міжнародних проектах із області генетичної та протеомної тематик, починаючи з розробки теоретичних методів і закінчуючи практичним застосуванням результатів фундаментальних досліджень в біології, медицині та інші.

Вищезазначене є особливо актуальним в умовах світової економічної кризи, коли шанс на подальший розвиток мають лише ті області діяльності людини, які базуються на найсучасніших наукових і технологічних розробках та мають підтримку держави.

Безсумнівно, що розвиток високих технологій у наступні кілька десятиліть буде визначатись злиттям нано-, біо- та інформаційних технологій.

Перелік посилань

1. Arthur M. Lesk. Introduction to Bioinformatics, Oxford University Press, 2002, 256 p.

2. Andrzej Polanski, Marek Kimmel, Bioinformatics, Springer-Verlag Berlin Heidelberg, 2007, 376 p.

3. Hans-Joachim Bцckenhauer, Dirk Bongartz, Algorithmic Aspects of Bioinformatics, Springer-Verlag Berlin Heidelberg, 2007, 392 p.

4. Глазко В.И., Глазко В.Г. Введение в ДНК-технологию и биоинформатику. - К.: Нора-принт, 2005, с.

5. Ж. Сетубал, Ж. Мейданис. Введение в вычислительную молекулярную биологию. Москва, Ижевск, Научно-издательский центр ”Регулярная и хаотическая динамика”, 2007, 420 с.

6. С.В. Горобець, О.Ю. Горобець, Д.О.Дереча. Біоінформатика як основний инструмент нанобіотехнології та наномедицини. Клиническая информатика и телемедицина, 2008, т.4., Вып.5. с.41- 49.

7. Гельфанд М.С., Миронов А.А. Вычислительная биология на рубеже десятилетий. Молекулярная биология. 1999. Т. 33. С. 969-984.

8. А.И. Арчаков Геномика, протеомика и биоинформатика -- науки XXI столетия //Фармацевтический вестник №9 (208) 13 марта 2001 г

9. А.И. Арчаков Геномика, протеомика, биоинформатика, Медицинская газета № 26 11 апреля 2001 г.

10. Арчаков А.И., Поройков В.В., Белкина Н.В., Гусев С.А., Дубанов А.В., Иванов А.С., Лагунин А.А., Лисица А.В., Скворцов В.С., Соболев Б.Н. Новые технологии в биомедицине: Биоинформатика. (url) http://www.mirrebenka.h10.ru/genomics.htm

11. Компьютеры и суперкомпьютеры в биологии / Под редакцией В. Д. Лахно и М. Н. Устинина. -- Москва-Ижевск: Институт компьютерных исследований, 2002, 528 стр.

12. Албертс Б. и др. Молекулярная биология клетки. - М.: Мир, 1986.

13. NCBI - National Center for Biotechnology Information, USA, http://www.ncbi.nlm.nih.gov/ ,

14. EBI - European Bioinformatics Institute, United Kingdom, http://www.ebi.ac.uk/ ,

15. NIG - National Institute of Genetics, Japan, http://www.ddbj.nig.ac.jp/ .

16. RCSB - Research Collaboratory for Structural Bioinformatics, USA (PDB - Protein data bank), http://www.rcsb.org/,

17. SIB - Swiss Institute of Bioinformatics, Switzerland (Swissprot), http://www.isb-sib.ch/.

18. Д.И. Баирамашвили, Генноинженерный инсулин человека: успехи и перспективы. - Рос. хим. журн., 2005, Том XLIX, №1, с. 34-45.

19. Школа диабета. (url) http://www.critical.ru/DiaSchool/index.php

20. Инсулин. Часть II. Микробиологическое получение инсулина. (url) http://www.rusbiotech.ru/article/insulin2.php

21. Киселев Н. А., Электронная микроскопия биологических макромолекул, М., 1965; Электронно-микроскопическая анатомия, пер. с англ., М., 1967; Балашов Ю. С., Миккау Н. Е., Изучение живых животных в растровом электронном микроскопе, «Природа», 1977, № 1; Tribe М. A., Eraut M. R., Snook R. K., Basic biology course, book 2 -- Electron microscopy and cellstructure, Camb., 1975; Electron microscopy of enzymes. Principles and methods, v. 1--2, N. Y., 1973--74.

22. Е.М.Попов. Современные достижения рентгеноструктурного анализа белков, Успехи химии, Вып. 12, 1995, с. 1143

23. Вайнштейн Б. К. Современная кристаллография, т. 1-3. -- М.: Наука,1979

24. Бландел Т., Джонсон Л. Кристаллография белка. 1979.--М.: Мир.

25. Порай-Кошиц М. А. Основы структурного анализа химических соединений. -- М.: Высшая школа, 1982

26. Лунин В. Ю. Восстановление недостающих структурных факторов при рентгено-структурном исследовании макромолекул, Доклады АН СССР, 1988, т. 299, в. 2, с. 363-366

27. К.Х. Хауссер, Х.Р. Кальбитцер, ЯМР в медицине и биологии: структура молекул, томография, спектроскопия in vivo, Киев: Наукова думка, 1993, 259 с.

28. Дж. Робертс, Ядерный магнитный резонанс. Применение в органической химии, М: ИИЛ, 1961, 140 с.

29. Фрэнк А. Бови, ЯМР высокого разрешения макромолекул, М: Химия, 1977, 456 с.

30. Балдин К.В. Брызгалов Н.А. Рукосуев А.В. Математическое программирование, Москва: Издательский дом "Дашков и К", 2008, 220 с.

31. Грани. Ру. Внутренняя политика США. Америка готовится к новой войне. www.grani.ru/Society/Health/m.96372.html.

32. Banatao, R. "Visualization." Bioinformatics Methods and Techniques. Stanford University, Stanford Center for Professional Development, 2002.

Размещено на Allbest.ru


Подобные документы

  • Опис процесу створення технічного завдання на розробку бази даних для сільської бібліотеки. Виявлення масиву даних та їх структури. Внесення інформації в базу. Визначення типів і зв’язків між таблицями. Створення інтерфейсу системи керування базою даних.

    контрольная работа [174,9 K], добавлен 07.01.2015

  • Опис предметного середовища. Перелік вхідної інформації. Концептуальна, даталогічна, фізична модель бази даних. Опис функціональних запитів та залежностей. Визначення цілісності посилань між таблицями бази даних. Форма "спеціальність", "дисципліна".

    курсовая работа [1,3 M], добавлен 13.10.2014

  • Опис структури даних та вимоги до них. Характеристика файлів та їх призначення. Процедури та функції користувача. Опис стандартних процедур та функцій, що використовувались у програмі. Інструкція для роботи з програмою: програмісту, користувачу.

    курсовая работа [1,2 M], добавлен 21.01.2012

  • Структури даних як способи їх організації в комп'ютерах. Підтримка базових структури даних в програмуванні. Дерево як одна з найпоширеніших структур даних. Бінарні дерева на базі масиву. Створення списку - набору елементів, розташованих у певному порядку.

    контрольная работа [614,7 K], добавлен 18.02.2011

  • Основні відомості про реляційні бази даних, система управління ними. Основні директиви для роботи в середовищі MySQ. Визначення та опис предметної області. Створення таблиць та запитів бази даних автоматизованої бази даних реєстратури в поліклініці.

    курсовая работа [2,9 M], добавлен 06.11.2011

  • Поняття та переваги реляційної бази, автоматизація аналізу даних. Опис основних компонентів сховища даних AS/400. Процес перетворення оперативних даних в інформаційні. Багатовимірні бази даних (MDD). Опис даних і створення файлів в інтеграційних базах.

    реферат [36,8 K], добавлен 14.01.2012

  • Теоретичні відомості про пакет ІЗВП Borland Delphi та СУБД MS Access, оцінка їх функціональних особливостей. Опис структури бази даних. Проектування інтерфейсу програми, опис її логічної структури та функцій. Контроль коректності вхідних, вихідних даних.

    курсовая работа [4,5 M], добавлен 03.01.2014

  • Створення програми, що видає результати голосування та підсумки виборів. Алгоритм розробки програми. Опис структури даних та вимоги до них, стандартних процедур та функцій, файлів та їх призначення. Приклад тестування та результати роботи програми.

    курсовая работа [1,0 M], добавлен 28.06.2012

  • Створення баз даних для автоматизування роботи торгового представника в середовищі програмування Delрhі. Опис вхідної та результуючої інформації, формалізований опис задачі. Розробка технічного та робочого проекту, опис та обґрунтування вибору структури.

    курсовая работа [135,8 K], добавлен 11.10.2010

  • Система управління базами даних, ієрархічна модель даних, її проектування та створення. Інтерфейс Microsoft Access, створення структури таблиці, запитів, форм, звітів, макросів. Аналіз зв'язків між таблицями, що описують поняття проблемного середовища.

    курсовая работа [2,7 M], добавлен 10.11.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.