Считается, что геном
человека расшифровали в 2003 году. Считается – потому что сразу стало понятно,
что сама по себе последовательность трёх миллиардов нуклеотидов человеческой
ДНК мало говорит о том, как эта ДНК работает.
Даже если мы знаем, в
какие «слова»-гены складываются генетические «буквы»-нуклеотиды, смысл многих
«слов» пока остаётся тайной – мы не знаем, как именно работают многие гены (не
говоря уже о массе регуляторных участков в ДНК). С другой стороны, в обоих
проектах по расшифровке человеческого генома в конечном счёте полностью
прочитали ДНК только двух людей (руководителя одного из двух проектов Крэйга
Вентера и одного из авторов двуспиральной модели ДНК Джеймса Уотсона). Однако
очевидно, что все мы разные, и все наши индивидуальные особенности записаны в
наших генах: какого цвета у нас глаза, какой рост и т. п. Более того, в геноме
находится информация и о нашей предрасположенности к заболеваниям: мутации в
ДНК могут повышать или понижать риск возникновения той или иной болезни.
Поэтому геном каждого отдельного человека, как, впрочем, и любого другого
живого существа, можно считать уникальным в своём роде.
Биорепозитарий
на Шпицбергене,
в
котором хранятся семена сельскохозяйственных культур со всего мира.
Фото:
Mari Tefre/Global Crop Diversity Trust
|
Но из одного, двух и
даже десятка расшифрованных геномов отдельных индивидуумов нельзя выделить
достоверной статистической информации, например, о том, что мутация в
каком-нибудь гене повышает риск развития злокачественной опухоли. Это как если
бы вы захотели провести социологическое исследование, опросив всего лишь пару
своих знакомых. Какие-то данные вы, несомненно, получите, но вот отражать общую
картину они вряд ли будут. Чтобы узнать общую закономерность и чтобы она была
достоверной, нужно по максимуму увеличить число опрошенных. Тот же принцип
работает и с генетической информацией: чтобы надёжно определить влияние мутации
на работу гена, нужна большая статистическая выборка. Иными словами, чтобы
понять, что представляет собой генетическая информация, нам нужны «прочитать»
геномы как можно большего числа людей.
В области расшифровки
генома за последнее десятилетие наблюдается заметный прогресс, в первую очередь
в смысле доступности методов секвенирования. Если на первый геном ушло 10 лет
плюс усилия сотен, если не тысяч, человек и миллион, а то и миллиард долларов,
то сейчас технологии позволяют секвенировать геном отдельного человека за сумму
порядка одной тысячи долларов, что сделало расшифровку генома доступной для
обычных людей и послужило мощным толчком к развитию персонифицированной
медицины. Собственно, тут мы подходим к вопросу о том, а для чего всё это надо,
и что хочет от этого получить наука, а что – простые граждане?
Огромное число
организаций по всему миру занимается генетическими исследованиями: и крупные
национальные центры, и академические институты, и фармацевтические компании, и
молодые стартапы – все вместе они генерируют огромный объём данных, который
растёт в геометрической прогрессии. Сегодня речь идёт уже о величине порядка
нескольких петабайт информации – сравнимый объём данных ежегодно генерирует
Большой Адронный Коллайдер (петабайт = 1024 терабайт). Их нужно где-то хранить,
к ним нужно организовать доступ, их нужно быстро обрабатывать. Научное
сообщество давно осознало, что свободный доступ к такой информации будет
полезен всем участникам, занимающимся генетикой. Так появились открытые базы
данных, содержащие генетическую информацию о самых разных живых организмах:
существует базы с генетической информацией мух дрозофил (Fly Base), паразитов (Worm Base), крыс (Rat Genome Database) или, например,
шпорцевых лягушек (Xen Base).
Результаты сравнения геномов различных организмов бывают порой весьма
забавными: к примеру, выяснилось, что у человека и шпорцевой лягушки был общий
предок, который жил порядка 360 миллионов лет назад. А как обстоят дела с
генетическими данными самого человека?
Тут ситуация немного
сложнее. С одной стороны, геном человека необходимо изучать, чтобы понять
молекулярные, клеточные, физиологические механизмы внутри нас и, может быть,
научиться ими управлять или хотя бы корректировать неполадки в них. Сюда
относятся и исследования генетики старения, и исследования наследственных
заболеваний, и анализ предрасположенности к раку, и многое другое. Для этого
развиваются технические средства: разрабатываются и совершенствуются технологии
секвенирования, создается инфраструктура для работы с геномными данными.
Многие IT-компании
обратились в сторону Life Science – наук о живом. Например, компания IBM развивает проект IBM Watson Health – систему поддержки
принятия решения в медицинской диагностике. Суть системы состоит в том, что
суперкомпьютер, анализируя огромный массив неструктурированной информации –
научные статьи, истории болезни, методики лечения и многое другое – может дать
ответ на вопрос, чем болен пациент. По замыслу разработчиков это должно снизить
вероятность постановки неправильно диагноза и, как следствие, неправильного
лечения. Насколько успешно компьютер сможет заменить «доктора Хауса» – покажет
время. Другой крупный производитель систем хранения и обработки информации,
компания EMC активно занимается разработкой облачной инфраструктуры для работы
с геномными данными, которая могла бы быть полезной для медицинских и научных
организаций. Биоинформатика сейчас становится тем звеном, которое может
объединить знания и возможности исследователей, врачей и инженеров во благо
человечества.
Государства и крупные
научные центры запускают проекты по созданию базы геномов тысяч и даже
миллионов людей, выделяя на них солидное финансирование. В Китае, к примеру,
начался проект, целью которого станет расшифровка генома миллиона человек,
миллиона животных и растений и миллиона микроорганизмов. Крейг Вентер, один из
тех, кто первым расшифровал человеческий геном, анонсировал, что к 2020 году
собирается секвенировать миллион геномов. В Германии планируют прочитать геномы
200 000 человек с последующим наблюдением за их здоровьем на протяжении 30 лет.
Есть проекты по поиску связей между вероятностью возникновения
сердечно-сосудистых заболеваний и особенностями ДНК, опирающиеся на наблюдения
за тысячами людей в течение 20 лет и более.
Примеры можно приводить
и далее, но всех их объединяет одно – масштабность исследований, их
продолжительность и огромный массив информации, который будет генерироваться на
всём протяжении экспериментов. Чтобы облегчить доступность и обмен информацией,
создаются различные объединения, цель которых в разработке единых стандартов и
методик. Разрозненные генетические банки данных объединяются в национальные и
межнациональные структуры – так же, как в своё время стандартизировались
протоколы обмена информацией по сети. Но всё это техническая сторона вопроса,
которая, без сомнения, будет развиваться и возможности которой мы, может быть,
еще даже не представляем. А что с другой стороны? Как генетические данные будут
менять жизнь людей?
Тут есть целый ряд
проблем, для которых пока нет однозначных решений, и касаются они даже не тех
возможностей, которые может дать нам генетика, а того, как мы сможем воспринять
новые факты о нас самих. Например, уже сейчас существует ряд генетических
тестов, позволяющих установить мутацию в том или ином гене, которая связана с
повышенной вероятностью возникновения определенных онкологических заболеваний.
Однако её наличие в геноме вовсе не означает, что вы непременно заболеете, –
мутация лишь повышает вероятность, что это произойдёт. Такие выводы обычно
основываются на том, что у исследованной ранее группы людей выявлена
зависимость между мутацией и риском болезни. Насколько точны подобные оценки,
можно установить, только исследовав очень большую выборку пациентов,
одновременно исключив множество других несущественных факторов. Как раз на
накопление подобной информации и направлены «миллионные» проекты по расшифровке
генома, а также проекты длительностью несколько десятков лет. Накапливая всё
больше информации, мы сможем лучше узнать, как мы устроены.
Как бы то ни было,
сейчас мы относимся к своему будущему как к «чёрному ящику». Готово ли
человечество к тем знаниям, которые мы получим, посветив в него фонариком? Как
изменится сознание человека, если он с самого детства будет знать, к примеру,
что вероятность развития у него рака мозга в несколько десятков раз выше, чем
среднестатистическая? Кому могут быть доступны такие данные? Могут ли родители
узнать, что светит в будущем их детям ещё до их рождения? Сейчас мы еще не
знаем ни границ наших возможностей, ни сколько времени понадобится науке для
того, чтобы от стадии получения знания перейти к его использованию.
И здесь словосочетание
«генетический банк» приобретает дополнительный смысл. Это не только базы
данных, содержащие расшифрованные геномы, но и своего рода вклад нынешнего
поколения в развитие биотехнологий, воспользоваться которыми смогут, скорее
всего, только наши потомки, долгосрочный вклад, который потом вернётся с
большими процентами в виде бесценного знания. При одном условии, что банк не
«лопнет», а «вкладами» не воспользуются в преступных и неэтичных целях – но это
зона ответственности не одной лишь науки.