Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Потапов В.В. Решение задач биоинформатики при помощи веб - и интернет-сервисов.pdf
Скачиваний:
124
Добавлен:
14.09.2020
Размер:
2.93 Mб
Скачать

УДК 557.3 ББК 28.071

Рекомендовано к изданию УМК биолого-почвенного факультета ИГУ

в качестве учебно-методического пособия Рецензенты:

Доктор биологических наук, профессор кафедры физико-химической биологии Иркутского государственного университета

Д. Ю. Щербаков Доктор физико-математических наук, профессор, генеральный

директор Объединенного института проблем информатики НАН Беларуси А. В. Тузиков

В.В. Потапов, У. В. Потапова, С. И. Феранчук,

А.А. Приставка, С. И. Беликов

Решение задач биоинформатики при помощи веб- и интернет-сервисов: учебно-методическое пособие. - Иркутск, гос. ун-т, 2011. - 50 стр

Учебно-методическое пособие содержит примеры использования современных веб- и интернет-сервисов для решения возникающих перед биологом биоинформатических задач.

В нем освещены общие вопросы работы с биологическими последовательностями и пространственными моделями, кратко описаны применяющиеся в биоинформатике форматы файлов, содержится обзор основных биологических баз данных и сервисов работы с ними. Рассмотрены примеры работы с сервисами для поиска последовательностей, множественного выравнивания, филогенетического анализа, для молекулярного компьютерного моделирования трехмерных структур белков, поиска научных статей по заданным критериям и др. Особое внимание уделено построению пространственных моделей по гомологии.

Задача пособия — дать первоначальные навыки работы с биоинформатическими сервисами и базами данных.

Предполагается, что читатель является уверенным пользователем персонального компьютера и имеет навыки навигации и поиска данных в сети Интернет.

Для студентов, аспирантов, преподавателей интересующихся биоинформатикой.

УДК 557.3 ББК 28.071

Настоящая работа выполнена при финансовой поддержке Министерства образования и науки Российской Федерации (Госконтракта № П389) в рамках Федеральной Целевой Программы «Научные и научно-педагогические кадры инновационной России» на 20092013 годы

Оглавление

 

1 Введение....................................................................................................................

4

Подготовка рабочего места..........................................................................................

5

2 Базы данных для биоинформатика: инструмент и результат..............................

6

2.1

GenBank — база данных биологических последовательностей.................

9

2.2

Protein Data Bank - банк данных трехмерных структур белков и

 

нуклеиновых кислот..............................................................................................

10

2.3

PubMed — база публикаций по медицине и биологии...............................

11

2.4

Контрольные вопросы...................................................................................

12

3 Программы и форматы...........................................................................................

12

3.1 UCSF Chimera и формат PDB.......................................................................

12

3.2

Редактор JalView и FASTA - формат.............................................................

16

3.3

Контрольные вопросы .................................................................................

19

4 Интернет- и веб-сервисы: основные понятия, проблемы и перспективы..........

19

4.1

Принципы работы интернет- и веб-сервисов..............................................

19

4.2

Выравнивание последовательностей в MAFFT..........................................

20

4.3

GeneBee и Bri-shur: сделано у нас...............................................................

22

4.4

Облачные вычисления — дорога в будущее..............................................

24

4.5

Контрольные вопросы...................................................................................

25

5 Учебная работа по моделированию пространственной структуры

 

биологического объекта..............................................................................................

26

5.1

Задание...........................................................................................................

26

 

5.1.1 Извлечение знаний (Data mining)........................................................

26

5.2

Анализ вирусного белка NS3........................................................................

28

 

5.2.1 Скрининг по гомологии.........................................................................

28

 

5.2.2 Скрининг с кластеризацией.................................................................

31

 

5.2.3 Построение филогенетического древа...............................................

33

 

5.2.4 Конструирование трехмерной структуры вирусного белка NS3......

36

 

5.2.5 Система поиска научных статей в базе данных Медлайн................

41

 

5.2.6 Исследование функциональных доменов вирусного белка NS3.....

43

5.3

Необходимое послесловие к моделированию............................................

45

6 Список рекомендованной литературы..................................................................

48

1 Введение

Данное руководство состоит из двух непохожих частей. В первой части приводится краткий обзор биоинформатических баз данных и сервисов, приводятся простейшие примеры работы с ними. Эта часть посвящена скорее не биологии, а информатике, ведь прежде чем читать, человек должен изучить буквы и слоги. Во второй части пособия на основе полученных навыков выполняется приближенная к реальной биоинформатическая научная работа, включающая в себя множество множество связанных подзадач.

В руководстве приводится множество гиперссылок, ими полезно пользоваться для иллюстрации представленных материалов.

Мелким курсивом в тексте выделены примечания

Курсивом - задания, которые нужно сделать и вопросы, на которые нужно ответить

Жирным шрифтом — названия пунктов меню в программах и надписи на кнопках в веб-интерфейсах

В конце каждой темы приводится список контрольных вопросов.

4

Подготовка рабочего места

Для выполнения практических заданий при помощи настоящего пособия нужно иметь доступ к следующему аппаратно-программному комплексу:

1.Персональный компьютер с операционной системой Microsoft Windows, Mac OS X или GNU Linux, объемом оперативной памяти не менее 1024 Мб и процессором не слабее Pentium 4, цветным дисплеем с разрешением не хуже 1024/600, клавиатурой и манипулятором типа «мышь».

2.Доступ к сети Интернет на скорости не менее 128 kB/c, наличие браузера для просмотра интернет-страниц, доступ к почтовому ящику электронной почты

3.Установленные на персональном компьютере бесплатные программы:

a)Редактор множественного выравнивания JalView

b)Программный пакет визуализации пространственных структур белков UCSF Chimera

c)Простой текстовый редактор, например Блокнот (Microsoft Windows), TextWrangler (Mac OS X) или KWrite (GNU Linux)

5