151742 (598956), страница 4
Текст из файла (страница 4)
Критериями удовлетворительного решения, соответствующего оптимальному набору базисных спектров, являются следующие условия:
-
Сумма коэффициентов
должна находиться в диапазоне от 0.96 до 1.05 (или, по крайней мере, от 0.90 до 1.10). -
Значение содержания произвольной структурной формы в исследуемом белке (
) должно быть выше - 0,05. -
Воспроизведение анализируемого спектра на основе выбранного набора базисных спектров должно быть лучше, чем при использовании полного их набора.
-
Более предпочтительным является набор, содержащий большее число базисных спектров.
-
Более предпочтительными являются те белки, спектры которых ближе к анализируемому спектру.
На практике в большинстве случаев удовлетворительных результатов удается достичь при исключении из исходного набора всего трех или четырех белков, причем среднеквадратичная ошибка при воспроизведении анализируемого спектра составляет меньше 0.2 единицы . Если несколько наборов базисных белков оказываются удовлетворительными в одинаковой степени, то результаты, полученные на их основе, усредняются.
В заключение можно отметить, что метод "выбора переменных" является мощным средством анализа спектров КД белков в ситуациях, когда другие распространеннные методы дают заведомо неверные результаты.
Сравнение различных методов анализа спектров КД.Поскольку все методы анализа спектров КД имеют чисто эмпирический характер, каждый из них нуждается в экспериментальной проверке на белках с известными рентгеноструктурными данными. Обычно подобная проверка проводится на белках, включенных в базисный набор для данного метода. При этом белки поочередно исключаются по одному из этого набора, а их спектры анализируются на основе спектров оставшихся белков. После этого результаты, полученные для каждого типа вторичной структуры, сравниваются со значениями, полученными при рентгеноструктурном анализе, с помощью подсчета коэффициента корреляции между этими двумя наборами данных, определяемого следующим выражением:
.(1.2.22)
Здесь
и
- экспериментальный и рассчитанный наборы данных, n - число белков в базисном наборе. Значения коэффициента корреляции r лежат в диапазоне от - 1 до 1, причем значеия r, близкие к 1, свидетельствуют об успешном предсказании, характеризующимся достаточно высокой точностью. Значения r, близкие к 0 или - 1, говорят о случайном совпадении или полном несоответствии рассчитанных и экспериментальных данных.
Ниже приведены значения коэффициентов корреляции для четырех рассмотренных методов: метода "эталонных спектров" [2,3], метода "регуляризации" [4], метода "ортогональных спектров" [5,6] и метода "выбора переменных" [7]:
| метод | диапазон, | коэффициент корреляции r | |||||
| нм | + | -изг. | Ост. | ||||
| [2,3] | 190-240 | 0.85 | - | - | 0.25 | -0.31 | 0.46 |
| [4] | 190-240 | 0.96 | - | - | 0.94 | 0.31 | 0.49 |
| [5,6] | 190-260 | 0.98 | 0.40 | 0.00 | -0.27 | 0.18 | 0.24 |
| [7] | 190-260 | 0.95 | 0.57 | 0.47 | 0.45 | 0.54 | 0.69 |
| [4] | 178-260 | 0.96 | 0.23 | 0.39 | 0.12 | 0.51 | 0.64 |
| [5,6] | 178-260 | 0.98 | 0.55 | 0.63 | 0.54 | 0.30 | 0.61 |
| [7] | 178-260 | 0.97 | 0.78 | 0.67 | 0.76 | 0.49 | 0.86 |
1.3 Работа с пакетом программ STRUCTURE по анализу спектров КД белков
Пакет программ STRUCTURE разработан в институте белка РАН (1991-1992 К.С. Василенко). Он предназначен для анализа спектров кругового дихроизма белков и определения их вторичной структуры. Алгоритм анализа спектров основан на методах, описанных выше. Пакет STRUCTURE состоит из следующих программ и вспомогательных файлов:
-
STRUCTURE (файл structur.exe) - программа, обеспечивающая интерфейс для всех программ пакета, позволяющая также создавать и редактировать файлы данных в универсальном для всех программ формате.
-
CONTIN (файл contin.exe) - программа, определяющая вторичную структуру белка методом "регуляризации" [4].
-
PROVCD (файл provcd.exe) - программа, осуществляющая проведение статистического теста для программы CONTIN.
-
DEF_CLASS (файл def_clas.exe) - программа, определяющая тип третичной структуры белка.
-
CDESTIMATE (файл cdestima.exe) - программа, определяющая вторичную структуру белка методом "эталонных спектров" [3].
-
VARSELEC (файл varselec.exe) - программа, определяющая вторичную структуру белка методом "ортогональных спектров" с процедурой "выбора переменных" [7].
-
RUN.BAT - командный файл, используемый для запуска программ пакета в условиях недостаточного объема оперативной памяти.
-
*.DAT - файл, содержащий спектр КД белка, а также данные о его вторичной структуре (если они известны).
-
*.GRP - файл, содержащий список базисных спектров КД (принадлежащих одной из базисных групп).
-
*.STR - файл, содержащий набор структурных типов (элементов вторичной структуры белка).
После запуска файла structur.exe на экране появляется главное меню программы, состоящее из следующих пунктов:
-
File - создание и редактирование файлов данных;
-
Group - создание и редактирование групп базисных спектров КД белков;
-
Calculate - выбор метода анализа, анализируемого спектра, группы базисных спектров, запуск вычислений и просмотр результатов;
-
Options - выбор набора структурных типов;
-
Setup - изменение цветового оформления окон программы;
-
Quit - выход из программы.
В нижней части экрана располагаются три окна, содержащие информацию об анализируемом спектре КД (Protein), а также о выбранных для анализа группе базисных спектров (Group) и наборе типов вторичной структуры белка (Structures).
Создание и редактирование файлов данных. Создание и редактирование файлов данных осуществляется с помощью команд меню File/Create и File/Edit соответственно. В файл необходимо внести следующую информацию:
-
Комментарий длиной не более 45 символов (пункт меню Comment).
-
Идентификатор длиной не более 7 символов, который становится именем файла и автоматически приобретает расширение.dat (пункт меню Identificator).
-
Содержание в белке (относительные доли) различных типов вторичной структуры по данным рентгеноструктурного анализа (пункт меню Structure data). Эти данные необходимы только в случае использования вводимого спектра в дальнейшем в качестве базисного.
-
Диапазон и шаг по длинам волн, а также сам спектр КД (пункт меню Spectrum). Для программы CDESTIMATE диапазон анализируемого спектра не должен быть шире, чем 240 - 190 нм, а шаг должен быть равен 1 нм или больше. Для программы CONTIN число точек в анализируемом спектре не должно превышать 51. Для программ CONTIN, VARSELEC и PROVCD диапазон анализируемого спектра не должен быть шире диапазона базисных спектров, а шаг должен совпадать с шагом базисных спектров.
После ввода всей перечисленной выше информации необходимо сохранить ее с помощью пункта меню Save. При необходимости можно построить введенный спектр КД на экране в графическом виде с помощью пункта меню View.
Команды меню File/Load и File/Delete используются соответственно для добавления новых спектров в список рабочих спектров, запоминаемых программой, и для удаления из него ненужных спектров. Для добавления нового спектра с помощью команды Load необходимо указать имя файла, в котором он хранится (предварительно его надо записать в текущий каталог). При удалении какого-либо спектра из списка с помощью команды Delete соответствующий ему файл не удаляется, поэтому его всегда можно будет включить обратно в список с помощью команды Load.
Создание и редактирование групп базисных спектров. В программе STRUCTURE уже существует 6 предопределенных групп базисных спектров, соответствующих различным методам анализа спектров КД. Эти группы имеют следующие имена:
-
PG_3_16.GRP и PG_4_16.GRP - базисные наборы, состоящие из 16 спектров, использованные для анализа авторами метода "регуляризации" [4] (Provencher & Glockner), предназначенные для определения вторичной структуры по 3 и 4 структурным классам соответственно (смотри ниже);
-
PG_3_20.GRP и PG_4_20.GRP - базисные наборы, содержащие те же самые 16 спектров, что и в двух предыдущих наборах, плюс 4 спектра денатурированных белков;
-
HJ_16.GRP и HJ_22.GRP - базисные наборы, состоящие из 16 и 22 спектров соответственно, использованные для анализа авторами метода "ортогональных спектров" [7] (Henessey & Johnson), предназначенные для определения вторичной структуры по 5 структурным классам (смотри ниже).
В программе предусмотрена возможность создания собственных групп базисных спектров. Для этого необходимо воспользоваться командой главного меню Group/Create, позволяющей выбрать из списка существующих спектров те, которые вы хотите включить в свой базисный набор. Аналогичным образом осуществляется редактирование групп базисных спектров (команда главного меню Group/Edit). Удаление группы базисных спектров осуществляется с помощью команды главного меню Group/Delete.
Выбор набора структурных типов. В программе STRUCTURE предопределены следующие 3 набора типов вторичной структуры белка:
| Provencher 3 (PG3.STR) | ALFA_hl (-спираль) BETA_sh (-структура) Remain (остальные типы) |
| Provencher 4 (PG4.STR) | ALFA_hl (-спираль) BETA_sh (-структура) BETA_tn (-поворот) Remain (остальные типы) |
| Johnson 5 (HJ.STR) | ALFA_hl (-спираль) BETA_Ash (антипараллельная -структура) BETA_Psh (параллельная -структура) BETA_tn (-поворот) Other (остальные типы) |
Набор All structures (FULL.STR) содержит дополнительные типы вторичной структуры белка, однако он ни с одной из предопределенных групп базисных спектров не используется.
Каждая группа базисных спектров соответствует одному из выше перечисленных наборов структурных типов. Это соответствие выглядит следующим образом:
PG_3_16.GRP и PG_3_20.GRP - Provencher 3;
PG_4_16.GRP и PG_4_20.GRP - Provencher 4;
HJ_16.GRP и HJ_22.GRP - Johnson 5.
При выборе одной из групп базисных спектров необходимо выбрать соответствующий набор типов вторичной структуры белка. Выбор нужного набора структурных типов осуществляется с помощью команды главного меню Options/Structure types.
Запуск вычислений. Для начала вычислений необходимо воспользоваться командой главного меню Calculate. В появляющемся меню нужно выбрать один из предлагаемых методов вычислений. В появляющемся после этого списке имеющихся белковых спектров необходимо выбрать анализируемый спектр. Если для расчетов были выбраны программы CONTIN, VARSELEC, PROVCD или DEF_CLASS, то необходимо также выбрать группу базисных спектров, на которой будут основаны вычисления. После этого производится запуск вычислений.
должна находиться в диапазоне от 0.96 до 1.05 (или, по крайней мере, от 0.90 до 1.10).














