Особенности строения белка: 13.3. Особенности строения белков

Содержание

13.3. Особенности строения белков

Белками называются сложные высокомолекулярные органические соединения, построенные из остатков α-аминокислот, соединенных между собой вторичными амидными связями. При полном гидролизе белок превращается в смесь аминокислот.

Различные молекулы белков с химической точки зрения отличаются друг от друга количественным, качественным составом и порядком аминокислотных остатков полипептидной цепи. Структура цепи, определяемая этими факторами называется первичной структурой белка.

На физические, химические и физико-химические свойства пептидов и белков большое влияние оказывает пространственная конфигурация молекулы, которая описывается вторичной и третичной структурой.

Вторичная структура для большинства белков имеет спиралевидный характер, т.е. полипептидная цепь закручивается в спираль таким образом, что на один виток приходится 3,6 остатка аминокислоты.

В макромолекулах белков обычно, наблюдается чередование спирализованных и неспирализованных участков.

Третичная структура белка представляет собой пространственное расположение спирализованных и неспирализованных участков полипептидной цепи. Связи, определяющие третичную структуру, возникают между функциональными группами боковых радикалов пептидной цепи (водородные, дисульфидные, эфирные, солеобразующие и др.).

Четвертичная структура возникает за счет образования водородных связей, солевых мостиков и т.д. Четвертичная структура между полностью сформировавшимися молекулами характерна для гемоглобина крови (межмолекулярное взаимодействие позволяет получить структуру, состоящую из 4-х полноценных белковых молекул).

Строение белковой молекулы в природных условиях называется нативной структурой белка.

Любое изменении природной структуры белка называется денатурацией. Обратимая денатурация может быть вызвана солями щелочных металлов или аммония, мочевиной и т.д. Необратимая денатурация происходит под действием солей тяжелых металлов, кислот и щелочей, а также высокой температуры

Белки разделяют на протеины (альбумины, глобулины и т.д.), в состав которых входят только остатки аминокислот и протеиды (сложные белки), которые при гидролизе дают аминокислоты и какие-либо другие вещества, например углеводы, гетероциклические соединения, фосфорную кислоту и др. К протеидам относятся нуклеопротеиды, фосфопротеиды, гликопротеиды, хромопротеиды и т.д.

В последнее время белки классифицируются преимущественно по их функциям в организмах:

— Резервные белки (альбумин яйца, казеин молока, глиадин пшеницы, ферритин селезенки и др.)

— Структурные белки (миозин мышц, кератин волос, эластин связок и т.д.)

— Белки, управляющие метаболизмом (ферменты, гормоны, иммунопротеины, транспортные белки, фото- и хеморецепторы)

Белковую природу имеют многочисленные ферменты, которые катализируют реакции определенного типа. Ферментам свойственна высокая избирательность, наибольшая активность при нормальной температуре организма, зависимость ферментной активности от pH. Ферменты разделяются на шесть классов:

1. Оксидоредуктазы – катализируют окислительно-восстановительные процессы.

2. Трансферазы – катализируют перенос химических групп (радикалов).

3. Гидролазы – катализируют гидролитические процессы.

4. Лиазы – обеспечивают присоединение по двойным связям или их образование.

5. Изомеразы – участвуют в процессах изомеризации.

6. Синтетазы – обеспечивают реакции конденсации двух молекул с участием фосфатных групп.

Для обеспечения каталитической функции многие ферменты содержат в молекуле небелковую часть – кофактор. Кофакторами могут быть органические вещества, а также атомы металлов или неметаллов.

«Особенности строения и свойств точечных мутантов малых белков теплового шока, экспрессия которых коррелирует с некоторыми врожденными заболеваниями человека» — НИР

1 22 февраля 2016 г.-30 декабря 2016 г. «Особенности строения и свойств точечных мутантов малых белков теплового шока, экспрессия которых коррелирует с некоторыми врожденными заболеваниями человека»
Результаты этапа: Метилглиоксаль, дикарбонильное производное, являющееся продуктом метаболизма глюкозы и накапливающееся при нарушениях обмена углеводов, наблюдаемых при диабете. Метилглиоксаль обладает высокой реакционной способностью и модифицирует различные белки. Проведено подробное исследование взаимодействия метилглиоксаля с малым белков теплового шока человека, HspB6. Установлено, что метилглиоксаль преимущественно модифицирует остатки аргинина, расположенные в N-концевом домене HspB6.Указанная модификация ингибирует фосфорилирование HspB6 под действием АМР-зависимой протеинкиназы. Модификация метилглиоксалем сопровождается уменьшением доступности HspB6 к трипсину и изменением спектральных свойств белка.Помимо этого, модификация HspB6 может сопровождаться изменением шапероноподобных свойств белка. Изучено взаимодействие различных малых белков теплового шока человека и точечных мутантов малых белков теплового шока с белком легкой цепи нейрофиламентов. Установлено, что все анализируемые малые белки теплового шока (HspB1, HspB5, HspB6, HspB8) препятствуют пучкованию филаментов, образуемых легким компонентом нейрофиламентов. HspB1 и HspB5 уменьшают долю нейрофиламентов,переходящих в осадок при высоко скоростном центрифугировании, влияя либо на гидродинамические свойства, либо на размеры филаментов. Установлено, что при насыщении 1 моль мономеров HspB1 приходится на 2 моля легкого компонента нейрофиламентов. Исследовано влияние точечных мутантов HspB1, экспрессия которых коррелирует с развитием дистальной нейропатии, на процессы сборки нейрофиламентов. Установлено, что анализируемые точечные мутации не влияют на способность HspB1 модулировать полимеризацию легких цепей нейрофиламентов. Установлено, что HspB1 и HspB5 замедляют процесс полимеризации нейрофиламентов, в то время как HspB6 и HspB8 оказывают слабо влияние на процессы перехода тетрамеров нейрофиламентов в зрелые филаменты. Разработаны методы экспрессии и выделения рекомбинантных HspB4 и Hsp5, а также точечных мутантов HspB5, экспрессия которых коррелирует с развитием некоторых форм кардиомиопатий, миофибриллярных миопатий и катаркты. Начаты исследования физико-химических свойств полученных белков.
2 10 января 2017 г.-29 декабря 2017 г. Взаимодействие точечных мутантов малых белков теплового шока с различными белками-партнерами и белками-мишенями
Результаты этапа: Определена структура малого белка теплового шока HspB6. находящегося в комплексе с универсальным адаптерным белком 14-3-3. Исследовано возможное участие малых белков теплового шока в олигомеризации легкой цепи нейрофиламентов. Изучена структура и свойства трех точечных мутантов альфаА-кристаллина, экспрессия которых коррелирует с развитием катаракты и десмин-зависимой миопатии.
3 1 января 2018 г.-15 декабря 2018 г. Особенности строения и свойств точечных мутантов малых белков теплового шока, экспрессия которых коррелирует с некоторыми врожденными заболеваниями человека»
Результаты этапа: Исследованы физико-химические свойства трех точечных мутантов малого белков теплового шока человека HspB1, экспрессия которых коррелирует с развитием болезни Шарко-Мари-Ту. Установлено, что точечные мутации в кристаллиновом домене дестабилизируют четвертичную структуру олигомерных комплексов HspB1. При этом при низкой концентрации такие олигомеры склонны к диссоциации, при высокой концентрации образуют олигомеры размер которых существенной превышает размер олигомеров HspB1 дикого типа. Исследованы свойства точечных мутантов пяти малых белков теплового шока (HspB1, HspB4, HspB5, HspB6, HspB8) с заменой остатка аргинина на аланин в консервативном пентапептиде в N-концевом домене. Установлено, что такая замена влияет на структуру и свойства малых белков теплового шока, относящихся к одной ветви эволюции (HspB1, HspB8) и практически не влияет на свойства малых белков теплового шока, относящихся к другой ветви эволюции (HspB4, HspB5, HspB6).

Карта сайта

Страница не найдена. Возможно, карта сайта Вам поможет.

  • Главная
  • Университет
    • Об университете
      • Контакты
      • Банковские реквизиты
      • Миссия, Видение и Политика в области качества
      • История
      • Гимн и символика
      • Гранты и награды
      • Достижения
      • Виртуальная Доска Почета
      • Почётные доктора и профессоры
      • Известные выпускники
      • Музеи
        • Музей истории УО «Гродненский государственный медицинский университет»
          • Сотрудники
          • Историческая справка
          • Выставка одного экспоната
          • День в истории
          • ЖИЗНЬ ЗАМЕЧАТЕЛЬНЫХ ВРАЧЕЙ (XIX- н.XX в.)
            • Знаменитые офтальмологи Адамюки — наши земляки
            • Наш земляк В.Н. Беклемишев
            • Н.М.Берестнев — видный ученый-бактериолог
            • Доктор А.А. Богданов — революционер, ученый и писатель
            • Наш земляк П.М. Буйко
            • Главврач Гродненского военного госпиталя А.Я. Евдокимов
            • Врач, экономист и историк Н.А. Гурвич
            • Профессор И.В. Заблудовский — основатель классического массажа
            • Доктор Е.Ф. Калитовский (1896-1980) – основатель курортологии в Беларуси
            • Кемарский К.С. — лекарь с «отличием»
            • Коренчевский В.Г. — выдающийся патолог, геронтолог, фармаколог и бактериолог
            • Косицкий В.И. — наш земляк, хирург-ортопед
            • Гродненский «Народный лекарь» и общественный деятель Василий Васильевич Кошелев
            • Пропагандист физических методов лечения и «Герой труда» — наш земляк В.С. Пирусский
            • Профессор Г.А. Полюта — талантливый врач и ветеринар
            • Президент «Общества врачей Гродненской губернии», доктор Александр Федорович Рейпольский
            • Соловьев З.П. — губернский врач-эпидемиолог и основоположник советского здравоохранения
            • Доктор В.Л. Теплиц — главный хирург первого военно-морского госпиталя СССР
            • Терешков Павел Ефимович — главный акушер-гинеколог Гродненской области
            • Доктор Ф.Ф. Ульрих — врач, общественный деятель и благотворитель
            • Врач-терапевт Шапиро Генрих Александрович
            • Профессор И.Ю.Тарасевич, лечивший поэта Андрея Белого
            • Доктор В.Д.Гинденбург, лечащий врач великого композитора М.И.Глинки
            • Офтальмолог И.В. Костенич, вернувший зрение известному ученому Д.И. Менделееву
          • ЖИЗНЬ ЗАМЕЧАТЕЛЬНЫХ ВРАЧЕЙ (период ВОВ и создания вуза)
          • Мероприятия музея истории
          • Виртуальный музей
        • Музей беларускай этнаграфіі
    • Структура
    • Нормативные документы и процедуры
    • Лечебная деятельность
    • Международное сотрудничество
    • Пресс-центр
      • Новости
      • Анонсы
      • События
      • Объявления и поздравления
      • Конференции
      • Фотоальбом
        • Открытый диалог с активом студенческого самоуправления
        • VI межвузовская научно-практическая интернет-конференция «Актуальные вопросы радиационной и экологической медицины, лучевой диагностики и лучевой терапии»
        • Проект StudHUB
        • День открытых дверей-2022
        • Представление нового ректора ГрГМУ
        • Заседание совета университета (март 2022)
        • 79-я годовщина со дня трагедии в Хатыни
        • Распределение-2022
        • Симуляционно-аттестационный центр ГрГМУ
        • Spectra’22
        • Витебск – Молодежная столица Республики Беларусь-2022
        • Финал республиканского конкурса «Студент года-2021»
        • Акция «Мы за жизнь без наркотиков»
        • Торжественные мероприятия к Дню защитника Отечества-2022
        • Досрочное голосование. Референдум по внесению дополнений и изменений в Конституцию Республики Беларусь
        • Чрезвычайный и Полномочный Посол Индии в Республике Беларусь посетил ГрГМУ
        • Предварительное распределение-2022 (часть 2)
        • Предварительное распределение-2022 (часть 1)
        • Отчетное заседание рабочей группы по координации деятельности Центров мониторинга профессиональных рисков и психологической поддержки медицинских работников
        • Студенты ГрГМУ помогают практическому здравоохранению в борьбе с коронавирусом
        • В ГрГМУ прошла расширенная итоговая коллегия главного управления здравоохранения Гродненского облисполкома
        • Расширенное заседание совета университета
        • Студенты ГрГМУ помогают практическому здравоохранению
        • Рабочий визит в Грузию в рамках учебной аккредитации вузов-партнеров
        • Новогодний бал во Дворце Независимости
        • Новогодний бал для талантливой молодежи Гродненщины
        • Финал V Турнира трех вузов по ScienceQuiz
        • Встреча представителей учреждений здравоохранения со студентами-выпускниками вуза
        • Визит профессора Джаниты Абейвикремы Лиянаге, Чрезвычайного и Полномочного Посла Демократической Социалистической Республики Шри-Ланки
        • Областной этап конкурса «Студент года-2021″
        • Республиканская онлайн-конференция, посвященная 60-летию кафедры акушерства и гинекологии
        • Alma Mater-2021 (ПФ, МДФ)
        • В ГрГМУ вручили сертификаты слушателям школы резерва кадров
        • Оториноларингологические чтения
        • Alma Mater-2021 (ЛФ, МПФ)
        • Диалоговая площадка с депутатом Палаты представителей Олегом Сергеевичем Гайдукевичем
        • Визит экспертной группы бизнес-премии «Лидер года»
        • Заместитель премьер-министра Республики Беларусь Игорь Викторович Петришенко встретился со студентами ГрГМУ
        • Делегация Багдадского университета с визитом в ГрГМУ
        • Студенческий фестиваль национальных культур-2021
        • Студент года-2021
        • Занятия в симуляционном центре ГрГМУ, имитирующем «красную зону»
        • Торжественная церемония вручения дипломов о переподготовке
        • Праздничный концерт, посвященный Дню Матери
        • Церемония подписания договора о сотрудничестве вуза и Гродненской православной епархии
        • Диалоговая площадка с председателем Гродненского облисполкома Владимиром Степановичем Караником
        • Выставка-презентация учреждений высшего образования «Образование будущего»
        • Товарищеский турнир по мини-футболу
        • Конференция «Современные проблемы радиационной и экологической медицины, лучевой диагностики и терапии»
        • Посвящение в первокурсники-2021
        • Встреча заместителя министра здравоохранения Д.В. Чередниченко со студентами
        • Открытый диалог, приуроченный к 19-летию БРСМ
        • Группа переподготовки по специальности «Организация здравоохранения»
        • Собрания факультетов для первокурсников-2021
        • День знаний — 2021
        • Совет университета
        • Студенты военной кафедры ГрГМУ приняли присягу
        • День освобождения Гродно-2021
        • Ремонтные и отделочные работы
        • Итоговая практика по военной подготовке
        • День Независимости-2021
        • Студенты военной кафедры ГрГМУ: итоговая практика-2021
        • Выпускной лечебного факультета-2021
        • Выпускной медико-психологического и медико-диагностического факультетов-2021
        • Выпускной педиатрического факультета-2021
        • Выпускной факультета иностранных учащихся-2021
        • Вручение дипломов выпускникам-2021
        • Митинг-реквием, посвященный 80-й годовщине начала Великой Отечественной войны
        • Акция «Память», приуроченная к 80-летию начала Великой Отечественной войны
        • Республиканский легкоатлетический студенческий забег «На старт, молодежь!»
        • Актуальные вопросы гигиены питания
        • Торжественное мероприятие к Дню медицинских работников-2021
        • Совет университета
        • Выездное заседание Республиканского совета ректоров
        • Церемония вручения медалей и аттестатов особого образца выпускникам 2021 года
        • Предупреждение деструктивных проявлений в студенческой среде и влияния агрессивного информационного контента сети интернет
        • Онлайн-выставка «Помнить, чтобы не повторить»
        • Областная межвузовская конференция «Подвиг народа бессмертен»
        • Финал первого Республиканского интеллектуального турнира ScienceQuiz
        • Конференция «Актуальные вопросы коморбидности заболеваний в амбулаторной практике: от профилактики до лечения»
        • День семьи-2021
        • Диалоговая площадка с председателем Гродненского областного Совета депутатов
        • Праздничные городские мероприятия к Дню Победы
        • Областной этап конкурса «Королева студенчества-2021″
        • Праздничный концерт к 9 мая 2021
        • IV Республиканский гражданско-патриотический марафон «Вместе – за сильную и процветающую Беларусь!»
        • Университетский кубок КВН-2021
        • Музыкальная планета студенчества (завершение Дней ФИУ-2021)
        • Молодёжный круглый стол «Мы разные, но мы вместе»
        • Дни ФИУ-2021. Интеллектуальная игра «Что?Где?Когда?»
        • Неделя донорства в ГрГМУ
        • Творческая гостиная. Дни ФИУ-2021
        • Открытие XVIII студенческого фестиваля национальных культур
        • Передвижная мультимедийная выставка «Партизаны Беларуси»
        • Республиканский субботник-2021
        • Семинар «Человек внутри себя»
        • Международный конкурс «Здоровый образ жизни глазами разных поколений»
        • Вручение нагрудного знака «Жена пограничника»
        • Встреча с представителями медуниверситета г. Люблина
        • Королева Студенчества ГрГМУ — 2021
        • День открытых дверей-2021
        • Управление личными финансами (встреча с представителями «БПС-Сбербанк»)
        • Весенний «Мелотрек»
        • Праздничный концерт к 8 Марта
        • Диалоговая площадка с председателем Гродненского облисполкома
        • Расширенное заседание совета университета
        • Гродно — Молодежная столица Республики Беларусь-2021
        • Торжественное собрание, приуроченное к Дню защитника Отечества
        • Вручение свидетельства действительного члена Белорусской торгово-промышленной палаты
        • Новогодний ScienceQuiz
        • Финал IV Турнира трех вузов ScienseQuiz
        • Областной этап конкурса «Студент года-2020″
        • Семинар дистанционного обучения для сотрудников университетов из Беларуси «Обеспечение качества медицинского образования и образования в области общественного здоровья и здравоохранения»
        • Студент года — 2020
        • День Знаний — 2020
        • Церемония награждения лауреатов Премии Правительства в области качества
        • Военная присяга
        • Выпускной лечебного факультета-2020
        • Выпускной медико-психологического факультета-2020
        • Выпускной педиатрического факультета-2020
        • Выпускной факультета иностранных учащихся-2020
        • Распределение — 2020
        • Стоп коронавирус!
        • Навстречу весне — 2020
        • Профориентация — 18-я Международная специализированная выставка «Образование и карьера»
        • Спартакиада среди сотрудников «Здоровье-2020″
        • Конференция «Актуальные проблемы медицины»
        • Открытие общежития №4
        • Встреча Президента Беларуси со студентами и преподавателями медвузов
        • Новогодний утренник в ГрГМУ
        • XIX Республиканская студенческая конференция «Язык. Общество. Медицина»
        • Alma mater – любовь с первого курса
        • Актуальные вопросы коморбидности сердечно-сосудистых и костно-мышечных заболеваний в амбулаторной практике
        • Областной этап «Студент года-2019″
        • Финал Science Qiuz
        • Конференция «Актуальные проблемы психологии личности и социального взаимодействия»
        • Посвящение в студенты ФИУ
        • День Матери
        • День открытых дверей — 2019
        • Визит в Азербайджанский медицинский университет
        • Семинар-тренинг с международным участием «Современные аспекты сестринского образования»
        • Осенний легкоатлетический кросс — 2019
        • 40 лет педиатрическому факультету
        • День Знаний — 2019
        • Посвящение в первокурсники
        • Акция к Всемирному дню предотвращения суицида
        • Турслет-2019
        • Договор о создании филиала кафедры общей хирургии на базе Брестской областной больницы
        • День Независимости
        • Конференция «Современные технологии диагностики, терапии и реабилитации в пульмонологии»
        • Выпускной медико-диагностического, педиатрического факультетов и факультета иностранных учащихся — 2019
        • Выпускной медико-психологического факультета — 2019
        • Выпускной лечебного факультета — 2019
        • В добрый путь, выпускники!
        • Распределение по профилям субординатуры
        • Государственные экзамены
        • Интеллектуальная игра «Что? Где? Когда?»
        • Мистер и Мисс факультета иностранных учащихся-2019
        • День Победы
        • IV Республиканская студенческая военно-научная конференция «Этих дней не смолкнет слава»
        • Республиканский гражданско-патриотический марафон «Вместе — за сильную и процветающую Беларусь!»
        • Литературно-художественный марафон «На хвалях спадчыны маёй»
        • День открытых дверей-2019
        • Их имена останутся в наших сердцах
        • Областной этап конкурса «Королева Весна — 2019″
        • Королева Весна ГрГМУ — 2019
        • Профориентация «Абитуриент – 2019» (г. Барановичи)
        • Мероприятие «Карьера начинается с образования!» (г. Лида)
        • Итоговое распределение выпускников — 2019
        • «Навстречу весне — 2019″
        • Торжественная церемония, посвященная Дню защитника Отечества
        • Торжественное собрание к Дню защитника Отечества — 2019
        • Мистер ГрГМУ — 2019
        • Предварительное распределение выпускников 2019 года
        • Митинг-реквием у памятника воинам-интернационалистам
        • Профориентация «Образование и карьера» (г.Минск)
        • Итоговая коллегия главного управления здравоохранения Гродненского областного исполнительного комитета
        • Спартакиада «Здоровье — 2019»
        • Итоговая научно-практическая конференция «Актуальные проблемы медицины».
        • Расширенное заседание Совета университета.
        • Научно-практическая конференция «Симуляционные технологии обучения в подготовке медицинских работников: актуальность, проблемные вопросы внедрения и перспективы»
        • Конкурс первокурсников «Аlma mater – любовь с первого курса»
        • XVI съезд хирургов Республики Беларусь
        • Итоговая практика
        • Конкурс «Студент года-2018»
        • Совет университета
        • 1-й съезд Евразийской Аритмологической Ассоциации (14.09.2018 г.)
        • 1-й съезд Евразийской Аритмологической Ассоциации (13.09.2018 г.)
        • День знаний
        • День независимости Республики Беларусь
        • Церемония награждения победителей конкурса на соискание Премии СНГ
        • День герба и флага Республики Беларусь
        • «Стань донором – подари возможность жить»
        • VIII Международный межвузовский фестиваль современного танца «Сделай шаг вперед»
        • Конкурс грации и артистического мастерства «Королева Весна ГрГМУ – 2018»
        • Окончательное распределение выпускников 2018 года
        • Митинг-реквием, приуроченный к 75-летию хатынской трагедии
        • Областное совещание «Итоги работы терапевтической и кардиологической служб Гродненской области за 2017 год и задачи на 2018 год»
        • Конкурсное шоу-представление «Мистер ГрГМУ-2018»
        • Предварительное распределение выпускников 2018 года
        • Итоговая научно-практическая конференция «Актуальные проблемы медицины»
        • II Съезд учёных Республики Беларусь
        • Круглый стол факультета иностранных учащихся
        • «Молодежь мира: самобытность, солидарность, сотрудничество»
        • Заседание выездной сессии Гродненского областного Совета депутатов
        • Областной этап республиканского конкурса «Студент года-2017»
        • Встреча с председателем РОО «Белая Русь» Александром Михайловичем Радьковым
        • Конференция «Актуальные вопросы инфекционной патологии», 27.10.2017
        • XIX Всемирный фестиваль студентов и молодежи
        • Республиканская научно-практическая конференция «II Гродненские аритмологические чтения»
        • Областная научно-практическая конференция «V Гродненские гастроэнтерологические чтения»
        • Праздник, посвящённый 889-летию города Гродно
        • Круглый стол на тему «Место и роль РОО «Белая Русь» в политической системе Республики Беларусь» (22.09.2017)
        • ГрГМУ и Университет медицины и фармации (г.Тыргу-Муреш, Румыния) подписали Соглашение о сотрудничестве
        • 1 сентября — День знаний
        • Итоговая практика на кафедре военной и экстремальной медицины
        • Квалификационный экзамен у врачей-интернов
        • Встреча с Комиссией по присуждению Премии Правительства Республики Беларусь
        • Научно-практическая конференция «Амбулаторная терапия и хирургия заболеваний ЛОР-органов и сопряженной патологии других органов и систем»
        • День государственного флага и герба
        • 9 мая
        • Республиканская научно-практическая конференция с международным участием «V белорусско-польская дерматологическая конференция: дерматология без границ»
        • «Стань донором – подари возможность жить»
        • «Круглый стол» Постоянной комиссии Совета Республики Беларусь Национального собрания Республики Беларусь по образованию, науке, культуре и социальному развитию
        • Весенний кубок КВН «Юмор–это наука»
        • Мисс ГрГМУ-2017
        • Распределение 2017 года
        • Общегородской профориентационный день для учащихся гимназий, лицеев и школ
        • Праздничный концерт, посвященный Дню 8 марта
        • Конкурсное шоу-представление «Мистер ГрГМУ–2017»
        • «Масленица-2017»
        • Торжественное собрание и паздничный концерт, посвященный Дню защитника Отечества
        • Лекция профессора, д.м.н. О.О. Руммо
        • Итоговая научно-практическая конференция «Актуальные проблемы медицины»
        • Меморандум о сотрудничестве между областной организацией Белорусского общества Красного Креста и региональной организацией Красного Креста китайской провинции Хэнань
        • Визит делегации МГЭУ им. А.Д. Сахарова БГУ в ГрГМУ
        • «Студент года-2016»
        • Визит Чрезвычайного и Полномочного Посла Королевства Швеция в Республике Беларусь господина Мартина Оберга в ГрГМУ
        • Конкурс первокурсников «Аlma mater – любовь с первого курса»
        • День матери в ГрГМУ
        • Итоговая практика-2016
        • День знаний
        • Визит китайской делегации в ГрГМУ
        • Визит иностранной делегации из Вроцлавского медицинского университета (Республика Польша)
        • Торжественное мероприятие, посвященное профессиональному празднику – Дню медицинского работника
        • Визит ректора ГрГМУ Виктора Александровича Снежицкого в Индию
        • Республиканская университетская суббота-2016
        • Республиканская акция «Беларусь против табака»
        • Встреча с поэтессой Яниной Бокий
        • 9 мая — День Победы
        • Митинг, посвященный Дню Государственного герба и Государственного флага Республики Беларусь
        • Областная межвузовская студенческая научно-практическая конференция «1941 год: трагедия, героизм, память»
        • «Цветы Великой Победы»
        • Концерт народного ансамбля польской песни и танца «Хабры»
        • Суботнiк ў Мураванцы
        • «Мисс ГрГМУ-2016»
        • Визит академика РАМН, профессора Разумова Александра Николаевича в УО «ГрГМУ»
        • Визит иностранной делегации из Медицинского совета Мальдивской Республики
        • «Кубок ректора Гродненского государственного медицинского университета по дзюдо»
        • «Кубок Дружбы-2016» по мини-футболу среди мужских и женских команд медицинских учреждений образования Республики Беларусь
        • Распределение выпускников 2016 года
        • Визит Министра обороны Республики Беларусь на военную кафедру ГрГМУ
        • Визит Первого секретаря Посольства Израиля Анны Кейнан и директора Израильского культурного центра при Посольстве Израиля Рей Кейнан
        • Визит иностранной делегации из провинции Ганьсу Китайской Народной Республики в ГрГМУ
        • Состоялось открытие фотовыставки «По следам Библии»
        • «Кубок декана» медико-диагностического факультета по скалолазанию
        • Мистер ГрГМУ-2016
        • Приём Первого секретаря Посольства Израиля Анны Кейнан в ГрГМУ
        • Спартакиада «Здоровье» УО «ГрГМУ» среди сотрудников 2015-2016 учебного года
        • Визит Посла Республики Индия в УО «ГрГМУ»
        • Торжественное собрание и концерт, посвященный Дню защитника Отечества
        • Митинг-реквием, посвященный Дню памяти воинов-интернационалистов
        • Итоговое заседание коллегии главного управления идеологической работы, культуры и по делам молодежи Гродненского облисполкома
        • Итоговая научно-практическая конференция Гродненского государственного медицинского университета
        • Новогодний концерт
        • Открытие профессорского консультативного центра
        • Концерт-акция «Молодёжь против СПИДа»
        • «Студент года-2015»
        • Открытые лекции профессора, академика НАН Беларуси Островского Юрия Петровича
        • «Аlma mater – любовь с первого курса»
        • Открытая лекция Регионального директора ВОЗ госпожи Жужанны Якаб
        • «Открытый Кубок по велоориентированию РЦФВиС»
        • Совместное заседание Советов университетов г. Гродно
        • Встреча с Министром здравоохранения Республики Беларусь В.И. Жарко
        • День города
        • Дебаты «Врач — выбор жизни»
        • День города
        • Праздничный концерт «Для вас, первокурсники!»
        • Акция «Наш год – наш выбор»
        • День знаний
        • Открытое зачисление абитуриентов в УО «Гродненский государственный медицинский университет»
        • Принятие военной присяги студентами ГрГМУ
        • День Независимости Республики Беларусь
        • Вручение дипломов выпускникам 2015 года
        • Республиканская олимпиада студентов по педиатрии
        • Открытие памятного знака в честь погибших защитников
        • 9 мая
        • «Вторая белорусско-польская дерматологическая конференция: дерматология без границ»
        • Мистер университет
        • Мисс универитет
        • КВН
        • Гродненский государственный медицинский университет
        • Чествование наших ветеранов
        • 1 Мая
        • Cовместный субботник
      • Наши издания
      • Медицинский календарь
      • Университет в СМИ
      • Видео-презентации
    • Общественные объединения
    • Комиссия по противодействию коррупции
    • Образовательная деятельность
  • Абитуриентам
  • Студентам
  • Выпускникам
  • Слайдер
  • Последние обновления
  • Баннеры
  • Иностранному гражданину
  • Научная деятельность
  • Поиск

Семинары Лаборатории биосинтеза белка — ОМРБ ПИЯФ

2 ноября Гарина Алина: «Radiosensitizing effect of boron enhances the effectiveness of proton therapy in vitro»

26 октября Наталья Кутьина: «Разработка технологии производства альтернативного мяса из комбинации микро- и макроводорослей»

19 октября Пичкур Евгений : «Исследование молекулярного механизма действия мадумицина II«

16 сентября Ольга Толичева : «Влияние нового ингибитора трансляции из Actinoplanes sp. 49252 на кинетику реакций элонгации«

20 июля Шуленина Ольга: «Исследование антибактериального механизма действия вещества «984»»

13 июля Михаил Каюмов : «Отчёт по работе за май-июнь 2020«

29 июня Волницкий Андрей: «Исследование GANT61 в качестве потенциального радиосенсибилизатора в комбинированной и комплексной радиотерапии злокачественных глиом»

22 июня Касацкий Павел: «Выделение индивидуальной тРНК»

15 июня Бурдаков Владимир: «Цитотоксическое действие экзосом, нагруженных рибонуклеазами»

8 июня Винградова Дарья: «Инициация — с чего все начинается»

1 июня  Гараева Луиза: «Доставка везикулами растительного происхождения функциональных белков в клетки человека in vitro»

25 мая  Шуленина Ольга: Исследование молекулярного механизма действия антибиотика мадумицина II

18 мая Толичева Ольга: «Скрининг ингибиторов гистоновых деацетилаз среди производных гидроксамовой кислоты»

6 мая Гараева Луиза: «Апробация на биомоделях сенсибилизирующих соединений для повышения эффективности и безопасности лучевой терапии»

27 апреля Пичкур Евгений : «Анализ конформационных перестроек преинициаторного и инициаторного комплексов по данным криоЭМ»

20 апреля Каюмов Михаил: «Роль консервативного гистидина в области switch II трансляционных ГТФаз в гидролизе ГТФ на рибосомах»

Строение и функции белков

Урок изучения нового материала в 10-м классе. Данный материал учащиеся уже изучали в 9 классе, поэтому некоторые понятия им уже известны. Соответственно с ребятами ведется диалог о строении и функциях белков. С помощью учителя учащиеся узнают о классификации ферментов.

Для того, чтобы активизировать деятельность учащихся на уроке, приводятся интересные факты о белках, которые помогают ребятам и нацеливают их на дальнейшее усвоение нового материала. Так же для этих целей предлагается провести лабораторную работу. На данном уроке основная масса изучаемого материала записывается в виде таблиц, схемы, которые учитель строит в ходе урока вместе и учениками. Качество изучаемого материала проверяется в виде фронтального опроса. Урок рассчитан как на детей-аудиалов, так и визуалов.

Цель урока: дать представление о строении и функции белков.

Задачи: продолжить расширение и углубление знаний важнейших органических веществах клетки на основе изучения строения и функции белков, сформировать знания функциях белков и их важнейшей роли в органическом мире, продолжить формирование умения выявлять связи между строением и функциями веществ.

Основные понятия: белки, протеины, протеиды, пептид, пептидная связь, простые и сложные белки, первичная, вторичная, третичная и четвертичная структуры белков денатурация.

Средства обучения: таблицы по общей биологии, иллюстрирующие строение молекул белков; лабораторное оборудование для проведения лабораторной работы “Расщепление пероксида водорода с помощью ферментов, содержащихся в плетках листа элодеи”.

Ход урока

I. Изучение нового материала.

1. Рассказ учителя (или фрагмент лекции) об особенностях строения молекул белков как биополимеров, состоящих из большого количества разных аминокислот, между которыми происходит полимеризация на основе пептидной связи. Зарисовка и запись на доске и в тетрадях учащихся.

2. Самостоятельное изучение учащимися текста учебника (С.42) о классификации белков.

3. Беседа об уровнях организации белковой молекулы и химической основы каждого из четырех уровней (структур) этой молекулы, о денатурации как утрате белковой молекулы своей природной структуры.

Структура белковой молекулы.

Структура белка Характеристика Тип связи Схема (учащиеся рисуют самостоятельно)
Первичная Линейная структура – последовательность аминокислот в полипептидной цепи, которая определяет все другие структуры молекулы, а также свойства и функции белка. Пептидная.
Вторичная Закручивание полипептидной цепи в спираль или складывание в “гармошку”. Водородные связи.
Третичная Глобулярный белок: упаковка вторичной структуры в глобулу;
фибриллярный белок: несколько вторичных структур, уложенных параллельными слоями, или скручивание нескольких вторичных структур наподобие каната в суперспираль.
Ионные, водородные, дисульфидные, гидрофобные.
Четвертичная Встречается редко. Комплекс из нескольких третичных структур органической природы и неорганическое вещество, например, гемоглобин. Ионные, водородные, гидрофобные.

4. Рассказ учителя о многообразии функций белков с краткой записью в тетрадях сущности функций: структурной, ферментативной, транспортной, защитной, регуляторной, энергетической, сигнальной.

5. Лабораторная работа “Расщепление пероксида водорода с помощью ферментов, содержащихся в клетках листа элодеи”.

Ход работы:

а. Приготовьте микропрепарат листа элодеи и рассмотрите его под микроскопом.
б. Капните на микропрепарат немного пероксида водорода и еще раз рассмотрите, в каком состоянии находятся клетки листа элодеи.
в. Объясните, с чем связано выделение пузырьков из теток листа, что это за газ, на какие вещества может расщепиться пероксид водорода, какие ферменты участвуют в этом процессе?
г. Капните каплю пероксида на предметное стекло и, рассмотрев его под микроскопом, опишите наблюдаемую, картину. Сравните состояние пероксида водорода в листе элодеи и на стекле, сделайте выводы.

По завершении лабораторной работы следует провести беседу о биохимических реакциях, протекающих при участии белковых катализаторов-ферментов как основе жизнедеятельности клеток и организмов.

Химические свойства белков обусловлены их различным аминокислотным составом. Существуют белки хорошо растворимые в воде и совершенно нерастворимые, химически активные и устойчивые к действию различных агентов, способные укорачиваться и растягиваться и т. д.

Под влиянием различных факторов – высокой температуры, действия химических веществ, облучения, механического воздействия – может произойти разрушение структур белковой молекулы. Нарушение природной структуры белка называется денатурацией. Если воздействие перечисленных факторов было недолгим и несильным, то белок может вернуть свою природную структуру – обратимая денатурация (ренатурация), если же воздействие было долгим или сильным, то происходит нарушение не только третичной и вторичной структур, но и первичной – необратимая денатурация (рис. 3).

Функции белков.

Функция Характеристика
1. Строительная (структурная). Входят в состав клеточных мембран и органоидов клетки (липопротеиды и гликопротеиды), участвуют в образовании стенок кровеносных сосудов, хрящей, сухожилий (коллаген) и волос (кератин).
2. Двигательная Обеспечивается сократительными белками (актин и миозин), которые обуславливают движение ресничек и жгутиков, сокращение мышц, перемещение хромосом при делении клетки, движение органов растений.
3. Транспортная. Связывают и переносят с током крови многие химические соединения, например, гемоглобин и миоглобин транспортируют кислород, белки сыворотки крови переносят гормоны, липиды и жирные кислоты, различные биологически активные вещества.
4. Защитная. Выработка антител (иммуноглобулинов) в ответ на проникновение в нее чужеродных веществ (антигенов), которые обеспечивают иммунологическую защиту; участие в процессах свертывания крови (фибриноген и протромбин).
5, Сигнальная (рецепторная). Прием сигналов из внешней среды и передача команд в клетку за счет изменения третичной структуры встроенных в мембрану белков в ответ на действие факторов внешней среды. Например, гликопротеины (встроены в гликокал икс), опсин (составная часть светочувствительных пигментов родопсина и йодопсина), фитохром (светочувствительный белок растений).
6. Регуляторная. Белки-гормоны оказывают влияние на обмен веществ, т. е. обеспечивают гомеостаз, регулируют рост, размножение, развитие и другие жизненно важные процессы. Например, инсулин регулирует уровень глюкозы в крови, тироксин – физическое и психическое развитие и т.д.
7. Каталитическая (ферментативная). Белки-ферменты ускоряют биохимические процессы в клетке.
К. Запасающая Резервные белки животных: альбумин (яйца) запасает воду, ферритин – железо в клетках печени, селезенки; миоглобин – кислород в мышечных волокнах, казеин (молоко) и белки семян – источник питания для зародыша.
9. Пищевая (основной источник аминокислот). Белки пищи – основной источник аминокислот (особенно незаменимых) для животных и человека; казеин (белок молока) – основной источник аминокислот для детенышей млекопитающих.
10. Энергетическая. Являются источником энергии – при окислении 1 г белка выделяется 17,6 кДж энергии, но организм использует белки в качестве источника энергии очень редко, например, при длительном голодании.

Ферменты (энзимы) – это специфические белки, которые присутствуют во всех живых организмах и играют роль биологических катализаторов.

Химические реакции в живой клетке протекают при умеренной температуре, нормальном давлении и нейтральной среде. В таких условиях реакции синтеза или распада веществ протекали бы очень медленно, если бы не подвергались воздействию ферментов. Ферменты ускоряют реакцию без изменения ее общего результата за счет снижения энергии активации. Это означает, что в их присутствии требуется значительно меньше энергии для придания реакционной способности молекулам, которые вступают в реакцию. Ферменты отличаются от химических катализаторов высокой степенью специфичности, т. е. фермент катализирует только одну реакцию или действует только на один тип связи. Скорость ферментативных реакций зависит от многих факторов – природы и концентрации фермента и субстрата, температуры, давления, кислотности среды, наличия ингибиторов и т.д.

Классификация ферментов. 

Группа Катализируемые реакции, примеры
Оксидоредуктазы. Окислительно-восстановительные реакции: перенос атомов водорода (Н) и кислорода (О) или электронов от одного вещества к другому, при этом окисляется первый и восстанавливается второй. Участвуют во всех процессах биологического окисления, например, вдыхании: АН + В А ВН (окисленный) или А + О АО (восстановленный).
Трансферазы. Перенос группы атомов (метильной, ацильной, фосфатной или аминогруппы) от одного вещества к другому. Например, перенос остатков фосфорной кислоты от АТФ на глюкозу или фруктозу под действием фототрансфераз:
АТФ + глюкоза глюкозо-6-фосфат + АДФ.
Гидролазы. Реакции расщепления сложных органических соединений на более простые путем присоединения молекул воды в месте разрыва химической связи (гидролиз). Например, амилаза (гидролизирует крахмал), липаза (расщепляет жиры), трипсин (расщепляет белки) и др.:
АВ + Н20 АОН + ВН.
Лиазы Негидролитическое присоединение к субстрату или отщепление от него группы атомов. При этом могут разрываться связи С-С, C-N, С-О, C-S. Например, декарбоксилаза отщепляет карбоксильную группу:
Изомеразы Внутримолекулярные перестройки, превращение одного изомера в другой (изомеризация):
глюкозо-6-фосфат глюкозо-1-фосфат.
Лигазы (синтетазы) Реакции соединения двух молекул с образованием новых связей С–О, С–S, С–N, С–С, с использованием энергии АТФ. Например, фермент валин-тРНК-синтетаза, под действием которого образуется комплекс валин– тРНК:
АТФ + валин + тРНК АДФ + Н3Р04 + валин-тРНК.

Механизм действия фермента представлен на рис. 4. В молекуле каждого фермента имеется активный центр – это один или более участков, в которых происходит катализ за счет тесного контакта между молекулами фермента и специфического вещества (субстрата). Активным центром выступает или функциональная группа (например, ОН-группа), или отдельная аминокислота. Активный центр может формироваться связанными с ферментом ионами металлов, витаминами и другими соединениями небелковой природы – коферментами или кофакторами. Форма и химическое строение активного центра таковы, что с ним могут связываться только определенные субстраты в силу их идеального соответствия (комплементарности) друг другу.

Молекула фермента изменяет глобулярную форму молекулы субстрата. Молекула субстрата, присоединяясь к ферменту, тоже в определенных пределах изменяет свою конфигурацию для увеличения реакционности функциональных групп центра.

На заключительном этапе химической реакции фермент-субстратный комплекс распадается с образованием конечных продуктов и свободного фермента. Освободившийся при этом активный центр может принимать новые молекулы субстрата.

II. Обобщающая беседа об основополагающей роли белков как самых необходимых химических соединений для жизней деятельности всего живого на Земле.

III. Закрепление знаний в процессе беседы с помощью следующих вопросов:

  1. Какие органические вещества клетки можно назвать самыми важными?
  2. Каким образом создается бесконечное разнообразие белков?
  3. Что собой представляют мономеры биополимера белка?
  4. Как формируется пептидная связь?
  5. Что собой представляет первичная структура белка?
  6. Каким образом происходит переход первичной структуры молекул белка во вторичную, а затем– в третичную и четвертичную?
  7. Какие функции могут выполнять белковые молекулы?
  8. Чем обусловлено многообразие функций белковых молекул?
  9. Приведите примеры белков, выполняющих самые разные функции. При ответе можно использовать следующую схему:

Биологические функции белков.

Это интересно.

Многие молекулы очень велики и по длине, и по молекулярной массе. Так, молекулярная масса инсулина – 5700, белка-фермента рибонуклеазы – 127 ООО, яичного альбумина – 36 ООО, гемоглобина – 65 ООО. В состав различных белков входят самые разные аминокислоты. Набор всех двадцати видов аминокислот содержит: казеин молока, миозин мышц и альбумин яйца. В белке-ферменте рибонуклеазе – 19, в инсулине – 18 аминокислот. Коллективу ученых под руководством академика Ю.А. Овчинникова удалось расшифровать сложную структуру белка родопсина, ответственного за процесс зрительного восприятия.

Кровь осьминогов, моллюсков и пауков имеет голубой цвет, потому что переносчиком кислорода у них служит не красный гемоглобин, содержащий атомы железа, а гемоцианин с атомами меди.

Почти половина необходимых нам белков, углеводов, 70–80% витаминов, значительное количество минеральных солей, аминокислот и других питательных элементов содержится в хлебе.

Американские ученые выделили из растения (семейство Пентадипландовых), произрастающего в Западной Африке, белок, который слаще сахара в 2 тыс. раз. Этот шестой известный науке сладкий белок, названный бразеином, содержится в плодах, которые с большой охотой поедают местные обезьяны. Биохимики расшифровали строение молекул сладкого белка, в каждой из них содержится 54 аминокислотных остатка.

IV. Домашнее задание: Изучить § 11, ответить на вопросы на с. 46. Приготовить сообщения или рефераты на темы: “Белки – биополимеры жизни”, “Функции белков – основа жизнедеятельности каждого организма на Земле”, “Денатурация и ренатурация, ее практическое значение”, “Многообразие ферментов, их роль в жизнедеятельности клеток и организмов” и др.

Используемые ресурсы:

  1. Каменский А.А.Общая биология 10–11: учеб.для общеобразоват. учреждений.– М.:Дрофа, 2006.
  2. Козлова Т.А. Тематическое и поурочное планирование по биологии к учебнику А.А.Каменского и др. “Общая биология 10–11”. – М.: Издательство “Экзамен”, 2006.
  3. Биология. Общая биология. 10–11 классы: рабочая тетрадь к учебнику Каменского А.А. и др. “Общая биология 10–11”– М.: Дрофа, 2011.
  4. Кириленко А.А. Молекулярная биология. Сборник заданий для подготовки к ЕГЭ: уровни А,В,С: учебно-методическое пособие. – Ростов н/Д: Легион, 2011.

строение и функции. Свойства белков

Как известно, белки — основа зарождения жизни на нашей планете. По теории Опарина-Холдейна именно коацерватная капля, состоящая из молекул пептидов, стала основой зарождения живого. Это и не вызывает сомнений, ведь анализ внутреннего состава любого представителя биомассы показывает, что эти вещества есть во всем: растениях, животных, микроорганизмах, грибах, вирусах. Причем они очень разнообразны и макромолекулярны по природе.

Названий у этих структур четыре, все они являются синонимами:

  • белки;
  • протеины;
  • полипептиды;
  • пептиды.

Белковые молекулы

Их количество поистине неисчислимо. При этом все белковые молекулы можно разделить на две большие группы:

  • простые — состоят только из аминокислотных последовательностей, соединенных пептидными связями;
  • сложные — строение и структура белка характеризуются дополнительными протолитическими (простетическими) группами, называемыми еще кофакторами.

При этом сложные молекулы также имеют свою классификацию.

Градация сложных пептидов

  1. Гликопротеиды — тесно связанные соединения белка и углевода. В структуру молекулы вплетаются простетические группы мукополисахаридов.
  2. Липопротеиды — комплексное соединение из белка и липида.
  3. Металлопротеиды — в качестве простетической группы выступают ионы металлов (железо, марганец, медь и другие).
  4. Нуклеопротеиды — связь белка и нуклеиновых кислот (ДНК, РНК).
  5. Фосфопротеиды — конформация протеина и остатка ортофосфорной кислоты.
  6. Хромопротеиды — очень схожи с металлопротеидами, однако элемент, входящий в состав простетической группы, представляет собой целый окрашенный комплекс (красный — гемоглобин, зеленый — хлорофилл и так далее).

У каждой рассмотренной группы строение и свойства белков различны. Функции, которые они выполняют, также варьируются в зависимости от типа молекулы.

Химическое строение белков

С данной точки зрения протеины — это длинная, массивная цепь аминокислотных остатков, соединяющихся между собой специфическими связями, называемыми пептидными. От боковых структур кислот отходят ответвления — радикалы. Такое строение молекулы было открыто Э. Фишером в начале XXI века.

Позже более подробно были изучены белки, строение и функции белков. Стало ясно, что аминокислот, образующих структуру пептида, всего 20, но они способны комбинироваться самым разным способом. Отсюда и разнообразие полипептидных структур. Кроме того, в процессе жизнедеятельности и выполнения своих функций белки способны претерпевать ряд химических превращений. В результате они меняют структуру, и появляется уже совсем новый тип соединения.

Чтобы разорвать пептидную связь, то есть нарушить белок, строение цепей, нужно подобрать очень жесткие условия (действие высоких температур, кислот или щелочей, катализатора). Это объясняется высокой прочностью ковалентных связей в молекуле, а именно в пептидной группе.

Обнаружение белковой структуры в условиях лаборатории проводится при помощи биуретовой реакции — воздействия на полипептид свежеосажденным гидроксидом меди (II). Комплекс пептидной группы и иона меди дает ярко-фиолетовую окраску.

Существует четыре основные структурные организации, каждая из которых имеет свои особенности строения белков.

Уровни организации: первичная структура

Как уже упоминалось выше, пептид — это последовательность аминокислотных остатков с включениями, коферментами или же без них. Так вот первичной называют такую структуру молекулы, которая является природной, естественной, представляет собой истинно аминокислоты, соединенные пептидными связями, и больше ничего. То есть полипептид линейного строения. При этом особенности строения белков такого плана — в том, что такое сочетание кислот является определяющим для выполнения функций белковой молекулы. Благодаря наличию данных особенностей возможно не только идентифицировать пептид, но и предсказать свойства и роль совершенно нового, еще не открытого. Примеры пептидов, обладающих природным первичным строением, — инсулин, пепсин, химотрипсин и другие.

Вторичная конформация

Строение и свойства белков этой категории несколько меняются. Такая структура может сформироваться изначально от природы либо при воздействии на первичную жестким гидролизом, температурой или иными условиями.

Данная конформация имеет три разновидности:

  1. Ровные, правильные, стереорегулярные витки, построенные из остатков аминокислот, которые закручиваются вокруг основной оси соединения. Удерживаются вместе только водородными связями, возникающими между кислородом одной пептидной группировки и водородом другой. Причем строение считается правильным из-за того, что витки равномерно повторяются через каждые 4 звена. Такая структура может быть как левозакрученной, так и правозакрученной. Но в большинстве известных белков преобладает правовращающий изомер. Такие конформации принято называть альфа-структурами.
  2. Состав и строение белков следующего типа отличается от предыдущего тем, что водородные связи образуются не между рядом стоящими по одной стороне молекулы остатками, а между значительно удаленными, причем на достаточно большое расстояние. По этой причине вся структура принимает вид нескольких волнообразных, извитых змейкой полипептидных цепочек. Есть одна особенность, которую должен проявлять белок. Строение аминокислот на ответвлениях должно быть максимально коротким, как у глицина или аланина, например. Этот тип вторичной конформации носит название бета-листов за способность будто слипаться при образовании общей структуры.
  3. Относящееся к третьему типу строение белка биология обозначает как сложные, разноразбросанные, неупорядоченные фрагменты, не обладающие стереорегулярностью и способные изменять структуру под воздействием внешних условий.

Примеров белков, имеющих вторичную структуру от природы, не выявлено.

Третичное образование

Это достаточно сложная конформация, имеющая название «глобула». Что собой представляет такой белок? Строение его основывается на вторичной структуре, однако добавляются новые типы взаимодействий между атомами группировок, и вся молекула словно сворачивается, ориентируясь, таким образом, на то, чтобы гидрофильные группировки были направлены внутрь глобулы, а гидрофобные — наружу.

Этим объясняется заряд белковой молекулы в коллоидных растворах воды. Какие же типы взаимодействий здесь присутствуют?

  1. Водородные связи — остаются без изменений между теми же самыми частями, что и во вторичной структуре.
  2. Гидрофобные (гидрофильные) взаимодействия — возникают при растворении полипептида в воде.
  3. Ионные притяжения — образуются между разнозаряженными группами аминокислотных остатков (радикалов).
  4. Ковалентные взаимодействия — способны формироваться между конкретными кислотными участками — молекулами цистеина, вернее, их хвостами.

Таким образом, состав и строение белков, обладающих третичной структурой, можно описать как свернутые в глобулы полипептидные цепи, удерживающие и стабилизирующие свою конформацию за счет разных типов химических взаимодействий. Примеры таких пептидов: фосфоглицераткеназа, тРНК, альфа-кератин, фиброин шелка и другие.

Четвертичная структура

Это одна из самых сложных глобул, которую образуют белки. Строение и функции белков подобного плана очень многогранны и специфичны.

Что собой представляет такая конформация? Это несколько (в некоторых случаях десятки) крупных и мелких полипептидных цепей, которые формируются независимо друг от друга. Но затем за счет тех же взаимодействий, что мы рассматривали для третичной структуры, все эти пептиды скручиваются и переплетаются между собой. Таким образом получаются сложные конформационные глобулы, которые могут содержать и атомы металлов, и липидные группировки, и углеводные. Примеры таких белков: ДНК-полимераза, белковая оболочка табачного вируса, гемоглобин и другие.

Все рассмотренные нами структуры пептидов имеют свои методы идентификации в лабораторных условиях, основанные на современных возможностях использования хроматографии, центрифугирования, электронной и оптической микроскопии и высоких компьютерных технологиях.

Выполняемые функции

Строение и функции белков тесно коррелируют друг с другом. То есть каждый пептид играет определенную роль, уникальную и специфическую. Встречаются и такие, которые способны выполнять в одной живой клетке сразу несколько значительных операций. Однако можно в обобщенном виде выразить основные функции белковых молекул в организмах живых существ:

  1. Обеспечение движения. Одноклеточные организмы, либо органеллы, или некоторые виды клеток способны к передвижениям, сокращениям, перемещениям. Это обеспечивается белками, входящими в состав структуры их двигательного аппарата: ресничек, жгутиков, цитоплазматической мембраны. Если же говорить о неспособных к перемещениям клетках, то белки могут способствовать их сокращению (миозин мышц).
  2. Питательная или резервная функция. Представляет собой накопление белковых молекул в яйцеклетках, зародышах и семенах растений для дальнейшего восполнения недостающих питательных веществ. При расщеплении пептиды дают аминокислоты и биологически активные вещества, которые необходимы для нормального развития живых организмов.
  3. Энергетическая функция. Помимо углеводов, силы организму могут давать и белки. При распаде 1 г пептида высвобождается 17,6 кДж полезной энергии в форме аденозинтрифосфорной кислоты (АТФ), которая расходуется на процессы жизнедеятельности.
  4. Сигнальная и регуляторная функция. Заключается в осуществлении тщательного контроля за происходящими процессами и передачи сигналов от клеток к тканям, от них к органам, от последних к системам и так далее. Типичным примером может служить инсулин, который строго фиксирует количество глюкозы в крови.
  5. Рецепторная функция. Осуществляется путем изменения конформации пептида с одной стороны мембраны и вовлечения в реструктуризацию другого конца. При этом и происходит передача сигнала и необходимой информации. Чаще всего такие белки встраиваются в цитоплазматические мембраны клеток и осуществляют строгий контроль над всеми веществами, проходящими через нее. Также оповещают о химических и физических изменениях окружающей среды.
  6. Транспортная функция пептидов. Ее осуществляют белки-каналы и белки-переносчики. Роль их очевидна — транспортировка необходимых молекул к местам с низкой концентрацией из частей с высокой. Типичным примером служит перенос кислорода и диоксида углерода по органам и тканям белком гемоглобином. Ими же осуществляется доставка соединений с невысокой молекулярной массой через мембрану клетки внутрь.
  7. Структурная функция. Одна из важнейших из тех, которые выполняет белок. Строение всех клеток, их органелл обеспечивается именно пептидами. Они подобно каркасу задают форму и структуру. Кроме того, они же ее поддерживают и видоизменяют в случае необходимости. Поэтому для роста и развития всем живым организмам необходимы белки в рационе питания. К таким пептидам можно отнести эластин, тубулин, коллаген, актин, кератин и другие.
  8. Каталитическая функция. Ее выполняют ферменты. Многочисленные и разнообразные, они ускоряют все химические и биохимические реакции в организме. Без их участия обычное яблоко в желудке смогло бы перевариться только за два дня, с большой вероятностью загнив при этом. Под действием каталазы, пероксидазы и других ферментов этот процесс происходит за два часа. В целом именно благодаря такой роли белков осуществляется анаболизм и катаболизм, то есть пластический и энергетический обмен.

Защитная роль

Существует несколько типов угроз, от которых белки призваны оберегать организм.

Во-первых, химическая атака травмирующих реагентов, газов, молекул, веществ различного спектра действия. Пептиды способны вступать с ними в химическое взаимодействие, переводя в безобидную форму или же просто нейтрализуя.

Во-вторых, физическая угроза со стороны ран — если белок фибриноген вовремя не трансформируется в фибрин на месте травмы, то кровь не свернется, а значит, закупорка не произойдет. Затем, наоборот, понадобится пептид плазмин, способный сгусток рассосать и восстановить проходимость сосуда.

В-третьих, угроза иммунитету. Строение и значение белков, формирующих иммунную защиту, крайне важны. Антитела, иммуноглобулины, интерфероны — все это важные и значимые элементы лимфатической и иммунной системы человека. Любая чужеродная частица, вредоносная молекула, отмершая часть клетки или целая структура подвергается немедленному исследованию со стороны пептидного соединения. Именно поэтому человек может самостоятельно, без помощи лекарственных средств, ежедневно защищать себя от инфекций и несложных вирусов.

Физические свойства

Строение белка клетки весьма специфично и зависит от выполняемой функции. А вот физические свойства всех пептидов схожи и сводятся к следующим характеристикам.

  1. Вес молекулы — до 1000000 Дальтон.
  2. В водном растворе формируют коллоидные системы. Там структура приобретает заряд, способный варьироваться в зависимости от кислотности среды.
  3. При воздействии жестких условий (облучение, кислота или щелочь, температура и так далее) способны переходить на другие уровни конформаций, то есть денатурировать. Данный процесс в 90% случаев необратим. Однако существует и обратный сдвиг — ренатурация.

Это основные свойства физической характеристики пептидов.

Заполните таблицу. Особенности строения белковой молекулы Структура молекулы белка Особенности строения

Особенности строения белковой молекулы
Структура белкововой молекулы — сложная пространственная структура, обладающая первичным, вторичным, третичным и четвертичным уровнями организации. Особенности структурной организации белковой молекулы определяются первичным уровнем ее организации.
Первичная структура белковой молекулы — полипептидная цепь с линейной последовательностью амнокислот, связанных между собой за счет пептидной связи. Первичная структура белка наиболее прочная из всех. В отношений всех свойств, которыми будет обладать белковая молекула, эта структура является определящюей. Все остальные структурные уровни организации образуются в соответствии с особенностями строения первичного уровня по принципу самосборки. Внешние факторы не оказывают влияние на этот процесс.
Вторичная структура белковой молекулы — структура белковой молекулы, образующаяся за счёт скручивания линейной последовательности аминокислот первичной структуры с образованием спирали, многочисленные витки которой связаны между собой водородными связями.
Третичная структура белковой молекулы — структура белковой молекулы, образующаяся за счет наложения одних частей спирали белковой молекулы на другие, формирование между этими частями различного рода связей: водородных ковалентных ионных, дисульфидных (при наличии аминокислоты цистин), гидрофобных. Третичная структура имеет вид глобулы. При третичном уровне организации белковой молекулы возможность принимать участие в химических реакциях, проявлять химическую активность остается только у тех аминокислотных остатков, которые имеют поверхностное расположение.
Четвертичная структура белковой молекулы — структура белковой молекулы, представляющая собой сложную пространственную организацию нескольких полипептидных цепей, связанных между собой за счет различных химических связей. Эти связи аналогичны таковым в третичном уровне организации белковой молекулы. Полипептидные цепи, принимающие участие в образовании четвертичной структы белковой молекулы, могут быть одинаковыми или иметь различное строение.

Анализ структурных особенностей белков Служба

Белки представляют собой макромолекулы или большие биомолекулы, состоящие из одной или нескольких длинных цепочек аминокислотных остатков. Белки выполняют широкий спектр функций внутри организмов, включая репликацию ДНК, реагирование на раздражители, катализ метаболических реакций и транспортировку молекул из одного места в другое. Белки отличаются друг от друга прежде всего последовательностью аминокислот, которая диктуется нуклеотидной последовательностью их генов и обычно приводит к складыванию белка в определенную трехмерную структуру, определяющую его активность.Анализ структурных особенностей белков может дать представление об основных биохимических процессах. Теперь биоинформатики из Creative Proteomics с гордостью сообщают вам, что мы открыты, чтобы помочь вам с услугой «Анализ структурных особенностей белков»!

Структурные особенности белков обычно описываются на четырех уровнях сложности:

  • Первичная структура: линейное расположение аминокислот в данном белке и расположение ковалентных связей, таких как дисульфидные связи между аминокислотами.
  • Вторичная структура: области складчатости или скручивания внутри белковой молекулы, такие как альфа-спирали и складчатые листы.
  • Третичная структура: окончательная трехмерная структура белка, которая является результатом большого количества нековалентных взаимодействий между родственными аминокислотами.
  • Четвертичная структура: нековалентные взаимодействия, которые связывают несколько полипептидов в один более крупный белок. Благодаря ассоциации двух альфа-глобиновых и двух бета-глобиновых полипротеинов гемоглобин имеет четвертичную структуру.

Структурные особенности Услуги белков, предоставляемых творческой протеомикой, включает в себя:

  • Структура классификация
  • Анализ водородных и связей
  • Анализ поверхности
  • боковой анализ цепи
  • трехмерных структурных анализа
  • Структурный анализ множественного выравнивания последовательностей

Как разместить заказ:

*Если вашей организации требуется подписание соглашения о конфиденциальности, свяжитесь с нами по электронной почте

Как к одной из ведущих компаний отрасли omics в мире! Теперь компания Creative Proteomics предлагает услуги по анализу структурных особенностей белков для наших клиентов.Обладая более чем 8-летним опытом работы в области биоинформатики, мы готовы предоставить нашим клиентам лучший сервис! Свяжитесь с нами для получения всей подробной информации!

* Только для исследовательских целей. Не для использования в диагностических процедурах.

Наши представители по обслуживанию клиентов доступны 24 часа в сутки, 7 дней в неделю. Расследование

SCRATCH: сервер прогнозирования структуры и структурных особенностей белков | Исследование нуклеиновых кислот

Аннотация

SCRATCH — это сервер для прогнозирования третичной структуры и структурных особенностей белков.Пакет программного обеспечения SCRATCH включает предикторы вторичной структуры, относительной доступности растворителя, неупорядоченных областей, доменов, дисульфидных мостиков, стабильности одиночных мутаций, контактов остатков по сравнению со средними, контактов отдельных остатков и третичной структуры. Пользователь просто предоставляет аминокислотную последовательность и выбирает нужные прогнозы, а затем отправляет их на сервер. Результаты отправляются пользователю по электронной почте. Сервер доступен по адресу http://www.igb.uci.edu/servers/psss.html.

ВВЕДЕНИЕ

Знание структуры белка позволяет понять, как он может взаимодействовать с другими белками, ДНК/РНК и малыми молекулами.Именно эти взаимодействия определяют функцию и биологическую роль белка в организме. Таким образом, предсказание структуры белка и структурных особенностей является фундаментальной областью вычислительной биологии. Его важность усугубляется большими объемами данных о последовательностях, поступающих из проектов геномики, и тем фактом, что экспериментальное определение белковых структур остается дорогим и трудоемким.

Общедоступные биоинформатические веб-серверы позволяют исследователям со всего мира применять инструменты, разработанные в других лабораториях, к своим собственным данным, а полностью автоматизированные системы обеспечивают основу для высокопроизводительных проектов в области протеомики и белковой инженерии.Мы разработали веб-сервер SCRATCH для прогнозирования третичной структуры и структурных особенностей белка.

МЕТОДЫ

Пакет SCRATCH сочетает в себе методы машинного обучения, эволюционную информацию в виде профилей, библиотеки фрагментов, извлеченные из банка данных белков (PDB) (1), и энергетические функции для прогнозирования структурных особенностей белков и третичных структур. См. Таблицу 1 для сводки конкретных методов, используемых каждым предиктором. В комплект входят следующие основные модули:

  • SSpro ( 2 ): вторичная структура трех классов.

  • SSpro8 ( 2 ): вторичная структура восьмого класса.

  • ACCpro (3): относительная доступность растворителя.

  • CONpro ( 3 ): контакты с другими остатками по сравнению со средним.

  • DOMpro: границы домена.

  • DISpro: неупорядоченные участки.

  • MUpro: влияние мутации одной аминокислоты на стабильность.

  • DIpro ( 4 ): дисульфидные мостики.

  • CMAPpro ( 5 , 6 ): карты контакта остатков-остатков.

  • 3Dpro: третичная структура.

Предикторы структурных признаков

Все предикторы обучаются под наблюдением с использованием проверенных неизбыточных наборов данных, извлеченных из PDB. SSpro, SSpro8, ACCpro, CONpro, DISpro и DOMpro используют ансамбли архитектур одномерных рекурсивных нейронных сетей (1D-RNN) (6). Предикторы CMAPpro и DIpro используют ансамбли архитектур 2D-RNN (5, 6). DIpro также использует машины опорных векторов (SVM) для различения белков с дисульфидными связями от белков без дисульфидных связей и алгоритмы сопоставления графов для сопряжения цистеинов.MUpro использует нейронные сети с прямой связью и SVM.

Эти архитектуры RNN основаны на теории вероятностных графических моделей (байесовских сетей), объединенных с параметризацией нейронной сети для ускорения распространения убеждений и обучения. Эти архитектуры систематически комбинируют стандартную информацию, содержащуюся в локальном окне ввода, с более удаленной контекстной информацией, извлекаемой трансляционно-инвариантными рекурсивными нейронными сетями, которые свернуты по всей длине белка (1D) или контактных карт (2D) со всех возможных направлений. .

Все предикторы, кроме 3Dpro и MUpro, напрямую используют эволюционную информацию в виде входных профилей, полученных с помощью PSI-BLAST (7), чтобы включить все гомологичные белки (8, 9). Кроме того, для SSpro и ACCpro очень высокие уровни локальной гомологии с известными структурами используются либо напрямую, либо в сочетании с выводом прогноза для повышения точности. Когда это возможно и полезно, предикторы используют выходные данные других предикторов (см. рис. 1).

DOMpro производит прогнозирование домена в три этапа.Во-первых, DOMpro предсказывает, принадлежит ли остаток области границы домена или нет. Остатки в пределах 20 аминокислот от фактической границы домена в базе данных CATH (10) считаются частью области границы домена. Во-вторых, статистический подход используется для вывода границы домена из предсказанных состояний (граничных/неграничных) отдельных остатков. Наконец, сегменты последовательности, разделенные границей домена, присваиваются номерам доменов.

В дополнение к стандартным архитектурам 2D-RNN ( 5 , 6 ) для прогнозирования всей карты контактов за один шаг, используется вариантная архитектура для пошагового прогнозирования контактов от разделения с низкой последовательностью до разделения с высокой последовательностью.Предсказанные карты контактов при более низком разделении последовательностей используются в качестве входных данных для предсказания карт контактов при более высоком разделении последовательностей. Необработанные выходные данные CMAPpro представляют собой матрицу вероятностей контакта для всех пар остатков.

Предсказание третичной структуры

Наш подход к предсказанию третичной структуры (3Dpro) сочетает в себе использование предсказанных структурных признаков (2, 3, 5, 6), библиотеки фрагментов (11) и энергетических условий, полученных из статистики PDB.Используемые структурные особенности включают вторичную структуру, относительную доступность для растворителя и карту контакта на уровне остатка при отсечке расстояния 12 Å. Предсказанные структурные особенности используются в функции энергии. Мы используем базу данных белковых фрагментов длины девять, построенную из структур в PDB (11).

Два члена в функции энергии основаны непосредственно на статистике из PDB, один для остаточных сред ( 11 , 12 ), а другой для валентных углов. Чтобы способствовать формированию β-цепей в листы, мы используем простое представление каждой цепи с одним вектором и штрафуем непарные векторы цепей.

Мы включаем энергетический термин контактной карты ( 13 ) на основе бинарной карты, полученной из матрицы вероятностей контактов, предсказанной CMAPpro. Для выбора контактов мы используем переменный порог, зависящий от полосы, который определяется путем оценки общего количества контактов в полосе из суммы всех предсказанных вероятностей контактов в этой полосе.

Конформационное пространство просматривается с использованием варианта имитации отжига, где движения, которые мы используем для модификации наших моделей, представляют собой движения коленчатого вала (13) на одном или нескольких остатках и несколько форм замены фрагментов (11, 12).Эти перемещения применяются к местам последовательности в модели, выбранным случайным образом. Мы также включаем термин, чтобы побудить вторичную структуру моделей соответствовать предсказанной вторичной структуре. При каждом поиске сохраняется модель с наименьшей энергией, а все остальные модели отбрасываются. Многие модели производятся с использованием разных семян случайным образом для каждого поиска. Единственная модель с наименьшим баллом возвращается в качестве прогноза.

Новое в SCRATCH

SCRATCH постоянно обновляется; по мере разработки новых методов существующие методы улучшаются, а предикторы переобучаются на больших наборах данных.Все новые предикторы DOMpro, DISpro, MUpro и 3Dpro. SSpro и ACCpro были улучшены за счет непосредственного включения информации из структурных шаблонов, когда это необходимо. DIpro был улучшен за счет добавления вторичной структуры и относительной доступности растворителя в качестве исходных данных для повышения точности предсказания дисульфидных связей. Кроме того, использование SVM для различения белков, имеющих дисульфидные связи, от белков без дисульфидных связей является новым. Одним из изменений в CMAPpro является вариантная архитектура, обсуждаемая в Методах.

ФОРМАТ ВВОДА И ВЫВОДА

Вход

Ввод данных на сервер осуществляется пользователем через простую HTML-форму. Пользователь должен ввести адрес электронной почты, на который будут отправлены результаты, и однобуквенный код аминокислотной последовательности. Пользователь также может ввести имя для представления. Пользователь может выбрать несколько прогнозов для одной и той же отправки. MUpro является исключением из этого простого формата ввода. Входными данными для MUpro является однобуквенный код аминокислотной последовательности, сайта единственной мутации и нового остатка для замены.Пользователь также может предоставить файл структуры в формате PDB, но это поле является необязательным. Результаты прогноза MUpro отображаются непосредственно в браузере вскоре после отправки.

Выход

Прогнозы возвращаются на адрес электронной почты, указанный пользователем. Выходные данные SSpro, SSpro8, ACCpro, CONpro, DOMpro, DIpro и DISpro приходят в теле письма с темой: «Прогнозы структурных особенностей SCRATCH». Прогнозы CMAPpro включены в виде вложения в электронное письмо.Прогноз 3Dpro возвращается в виде вложения в отдельном электронном письме с темой: «Прогноз третичной структуры SCRATCH». Здесь мы описываем выходные данные отдельных предикторов.

SSpro : спираль H, нить E, прочее C.

SSpro8 : Однобуквенный восьмибуквенный код класса вторичной структуры, определенный DSSP ( 14 ).

ACCpro : «e» открыто, «-» скрыто.

CONpro : «+» больше контактов, чем в среднем, «-» меньше контактов, чем в среднем.

DISpro : «О» упорядочено, «D» неупорядочено.

DOMpro : Первый и последний остаток каждого домена.

DIpro : Два класса предсказания того, имеет ли мишень дисульфидные связи. Прогнозируемое состояние связывания каждого цистеина в белке. Предсказанные цистеиновые пары.

MUpro : Утверждение прогнозируемого повышения или снижения стабильности белка в результате мутации, а также показатель достоверности. Оценка около 0 означает неизменную стабильность.Оценка около -1 означает высокую достоверность снижения стабильности. Оценка около +1 означает высокую уверенность в повышенной стабильности.

CMAPpro : прогнозы карты контактов включены в виде вложения в сообщение электронной почты со структурными элементами. Прогнозы поставляются в виде вложенных необработанных файлов с расширениями contact_map.8a и contact_map.12a для порогов 8 и 12 Å соответственно. Если запрос имеет длину N аминокислот, файлы состоят из N строк, каждая из которых содержит N вещественных чисел, разделенных пробелами.Число j -th в строке i -th представляет расчетную вероятность того, что аминокислоты i и j находятся в контакте (т.е. их C-αs ближе порога).

3Dpro : Прогноз третичной структуры представляет собой файл PDB, отправляемый в отдельном сообщении электронной почты в виде вложения, поскольку его создание занимает значительно больше времени, чем другие прогнозы. Файл PDB содержит только след альфа-углерода. Чтобы получить полностью атомную модель, пользователь может использовать другое программное обеспечение для добавления скелета, например MaxSprout (15), и боковых цепей, например MaxSprout и SCWRL (16).

РЕАЛИЗАЦИЯ СЕРВЕРА И ПРОИЗВОДИТЕЛЬНОСТЬ

Статистика

С марта 2000 года система SCRATCH обработала около 175 000 вакансий, включая заявки из более чем 90 стран.

Реализация

Основной поток данных системы SCRATCH показан на рис. 1 . Пользователь отправляет последовательность белка через форму WWW. Данные формы обрабатываются сценарием Perl, который создает один файл Fasta с дополнительной информацией о выбранных пользователем предикторах.Сценарий Perl также добавляет файл в конец очереди заданий. Диспетчер заданий, работающий на внешнем сервере Sun, обрабатывает одно задание, отправляя его на одну машину в нашем кластере Linux, и запускает другой сценарий для запуска всего необходимого для получения результатов, запрошенных пользователем. Единственным программным обеспечением, разработанным вне нашей лаборатории, которое в настоящее время используется в разработке, являются PSI-BLAST и BLAST (7). PSI-BLAST используется для создания множественного выравнивания последовательностей и согласованной последовательности из целевой последовательности.BLAST используется для идентификации гомологов с высокой идентичностью последовательностей в PDB для улучшения прогнозов SSpro и ACCpro.

Использование по назначению

Предикторы SCRATCH можно применять к любой аминокислотной последовательности; однако с точки зрения эффективности по сравнению с другими методами они наиболее подходят для использования на мишенях без высокого уровня гомологии последовательностей с одной или несколькими решенными структурами. Есть некоторые исключения из этого предостережения. SSpro и ACCpro можно эффективно использовать для любой белковой последовательности, поскольку они используют информацию о структуре шаблона в своих прогнозах, когда это уместно.MUpro и DISpro также подходят для использования с любой белковой последовательностью.

Эффективность прогнозирования структурных элементов

Трехклассовая точность аминокислот (Q3) SSpro составляет ~77% (2). SSpro версии 4.0 прошел всестороннюю оценку на EVA и неизменно считается одним из лучших серверов прогнозирования вторичной структуры (17). Точность ACCpro составляет ~77% при пороге воздействия 25% (3). Точность предсказания основана на мишенях, где гомология шаблона не используется напрямую, и обе системы работают лучше, когда можно применить гомологию шаблона.Точность восьми классов по каждой аминокислоте (Q8) точность SSpro8 составляет ~63% (2). Точность CONpro составляет ~72% (3). DOMpro предсказывает правильное количество доменов примерно в 69% случаев. Точность и отзыв неупорядоченных областей DISpro составляют 75,4 и 38,8% соответственно. Для DIpro точность предсказания состояния связывания цистеина составляет ~87% (4). Средняя точность предсказания дисульфидной связи DIpro составляет 53% (4). Точность предсказания стабильности мутаций составляет ~86%. На тестовом наборе белков длиной <100 CMAPpro предсказал контакты с точностью 49% и отсутствие контактов с точностью 96% (6).

Эффективность предсказания третичной структуры

Наша текущая версия 3Dpro является предсказателем ab initio только. Для мишеней со значительной гомологией с одной или несколькими решенными структурами методы сравнительного моделирования (CM) неизменно дают более надежные модели, чем методы ab initio . 3Dpro лучше всего подходит для целей, не имеющих хороших структурных шаблонов. Методы прогнозирования третичной структуры оцениваются в ходе экспериментов по критической оценке прогнозирования структуры (CASP), которые проводятся каждые два года (18).CASP оценивает прогнозы по трем широким категориям: CM, распознавание кратности (FR) и новая кратность (NF). Самые простые цели для прогнозирования классифицируются как CM-легкие, а самые сложные — как NF. Существует непрерывный спектр сложности, и эти категории размыты по краям, как и методы, которые лучше всего работают на разных типах целей. Мы приняли участие в самом последнем эксперименте CASP6. Полные результаты см. на http://predictioncenter.llnl.gov/. Наш предсказатель третичной структуры «baldi-group-server» хорошо показал себя на жестких целях (в категории NF и более сложных целях в категории FR) по сравнению с другими полностью автоматизированными предикторами.Чтобы просмотреть сводные результаты для групп серверов по жестким целям, перейдите по ссылке на домашней странице SCRATCH.

Расчетное время

Электронная почта с описанием структурных элементов возвращается в течение нескольких минут для большинства последовательностей. Прогноз карты контактов занимает больше всего времени среди прогнозов структурных признаков, и время увеличивается квадратично с длиной последовательности. Если карта контактов запрашивается для более длинных последовательностей, то для отправки сообщения электронной почты о структурных характеристиках потребуется еще несколько минут.Электронная почта с третичной структурой будет возвращена менее чем через 1 час, если последовательность короткая (длина <125). Время предсказания значительно увеличивается по мере увеличения длины последовательности; по этой причине мы принимаем только последовательности длиной до 400 для карты контактов и предсказания третичной структуры через веб-интерфейс. Максимальная длина последовательности для других предикторов составляет 1500. Если пользователь знает домены, то целесообразно представить каждый домен отдельно. Мы можем работать с более длинными последовательностями, а также с высокопроизводительными проектами в автономном режиме.

БУДУЩАЯ РАБОТА

В настоящее время мы разрабатываем новые методы повышения полезности SCRATCH. Одним из важных дополнений в разработке является компонент CM, который мы объединим с 3Dpro, чтобы сделать более полный предсказатель третичной структуры. Еще один новый метод, находящийся в разработке, предсказывает пары β-листов, которые будут использоваться в 3Dpro и будут доступны как автономный предиктор.

Наша группа также работает над улучшением существующих методов. Следующая версия DOMpro будет включать гомологию напрямую, а затем мы будем использовать DOMpro для автоматического разбиения представлений на домены, чтобы 3Dpro мог предсказать независимо, а затем объединить.Мы улучшаем наш предсказатель третичной структуры напрямую, изменяя физическое представление с представления только углеродного альфа на представление всей основной цепи и центроида боковой цепи, а также добавляя энергетические условия для реалистичной упаковки вторичной структуры.

Таблица 1

Сводка методов, используемых в предикторах SCRATCH

+ 9 0268
. Тренировочный набор PDB . Профиль PSI-BLAST . Подача вперед NN . 1Д РНН . 2D РНН . СВМ . Сопоставление графиков . Прямая гомология . Фрагмент базы данных .
SSPro D D D D
SSpro8 D D D
ACCpro D D D
ConPro D D D
DOMpro D D D
DISpro D D D  
MÜPRO D D D
DIPRO D D D D D
CMApro D D Я D
3Dpro Я Я I I I D
4 . Тренировочный набор PDB . Профиль PSI-BLAST . Подача вперед NN . 1Д РНН . 2D РНН . СВМ . Сопоставление графиков . Прямая гомология . Фрагмент базы данных . SSPro D D D D + SSpro8 D D D ACCpro D D D ConPro D D D DOMpro D D D DISpro D D D   9 0268 MÜPRO D D D DIPRO D D D D D 90 264 CMApro D D Я D 90 264 3Dpro Я Я I I I D Таблица 1

Сводка методов, используемых в Prentictors stricle

+ 9 0268
. Тренировочный набор PDB . Профиль PSI-BLAST . Подача вперед NN . 1Д РНН . 2D РНН . СВМ . Сопоставление графиков . Прямая гомология . Фрагмент базы данных .
SSPro D D D D
SSpro8 D D D
ACCpro D D D
ConPro D D D
DOMpro D D D
DISpro D D D  
MÜPRO D D D
DIPRO D D D D D
CMApro D D Я D
3Dpro Я Я I I I D
4 . Тренировочный набор PDB . Профиль PSI-BLAST . Подача вперед NN . 1Д РНН . 2D РНН . СВМ . Сопоставление графиков . Прямая гомология . Фрагмент базы данных . SSPro D D D D + SSpro8 D D D ACCpro D D D ConPro D D D DOMpro D D D DISpro D D D   9 0268 MÜPRO D D D DIPRO D D D D D + CMApro D D Я D + 3Dpro Я Я I I I D

Рисунок 1

Блок-схема сервера SCRATCH.DISpro, DOMpro, CONpro и DIpro сгруппированы вместе, потому что они имеют одни и те же входные данные, а их выходные данные не используются другими предикторами; однако они являются автономными программами.

Рисунок 1

Блок-схема сервера SCRATCH. DISpro, DOMpro, CONpro и DIpro сгруппированы вместе, потому что они имеют одни и те же входные данные, а их выходные данные не используются другими предикторами; однако они являются автономными программами.

Работа поддержана премией факультета инноваций Лорела Уилкенинга, грантом NIH на обучение биомедицинской информатике (LM-07443-01), грантом NSF по МРТ (EIA-0321390), премией Sun Microsystems, грантом Калифорнийского университета в области общесистемной биотехнологии. Исследовательская и образовательная программа, а также Институт геномики и биоинформатики UCI.Финансирование для оплаты стоимости публикации в открытом доступе для этой статьи было предоставлено грантом NIH Biomedical Informatics Training (LM-07443-01).

Заявление о конфликте интересов . Ни один не заявил.

ССЫЛКИ

1

Берман Х.М., Уэстбрук Дж., Фэн З., Гиллиланд Г., Бхат Т.Н., Вайсиг Х., Шиндялов И.Н., Борн П.Е.

2000

Банк данных о белках

Рез. нуклеиновых кислот.

28

235

–242 2

Полластри Г., Пшибыльский Д., Рост Б., Бальди П.

2002

Улучшение предсказания вторичной структуры белка в трех и восьми классах с использованием рекуррентных нейронных сетей и профилей

Белки

47

228

–235 3

Полластри, Г., Бальди П., Фариселли П., Касадио Р.

2002

Прогнозирование координационного числа и относительной доступности растворителя в белках

Белки

47

142

–153 4

Бальди П., Ченг Дж., Вулло А.

2004

Крупномасштабное предсказание связности дисульфидных связей

Доп.Нейронная инф. Процесс Сист.

17

97

–104 5

Полластри Г. и Бальди П.

2002

Прогнозирование контактных карт с помощью GIOHMM и рекуррентных нейронных сетей с использованием бокового распространения от всех четырех сторон света

Биоинформатика

18

Доп. 1,

С62

–S70 6

Бальди, П.Ф. и Полластри, Г.

2003

Принципиальный дизайн крупномасштабных архитектур рекурсивных нейронных сетей — DAG-RNN и проблема прогнозирования структуры белка

Дж. Маха. Учить. Рез.

4

575

–602 7

Альтшул С.Ф., Мэдден Т.Л., Шаффер А.А., Чжан Дж., Чжан З., Миллер В., Липман Д.Дж.

1997

Gapped BLAST и PSI-BLAST: новое поколение программ поиска белков в базе данных

Рез. нуклеиновых кислот.

25

3389

–3402 8

Пембертон, С.Г. и Джонс, Б.

1999

Технологии плейстоценового образования железных берегов, остров Большой Кайман, Британская Вест-Индия.

Дж. Палеонтол.

62

495

9

Пшибыльский Д. и Рост Б.

2002

Выравнивания растут, предсказание вторичной структуры улучшается

Белки

46

197

–205 10

Перл, Ф.М., Ли Д., Брей Дж. Э., Силлитоу И., Тодд А. Э., Харрисон А. П., Торнтон Дж. М., Оренго К. А.

2000

Присвоение геномных последовательностей CATH

Рез. нуклеиновых кислот.

28

277

–282 11

Саймонс, К.Т., Куперберг, К., Хуанг, Э., Бейкер, Д.

1997

Сборка третичных структур белков из фрагментов с похожими локальными последовательностями с использованием моделируемого отжига и функций байесовской оценки

Дж.Мол. биол.

268

209

–225 12

Саймонс, К.Т., Ручинский, И., Куперберг, К., Фокс, Б.А., Быстрофф, К., Бейкер, Д.

1999

Улучшенное распознавание нативных белковых структур с использованием комбинации зависимых от последовательности и независимых от последовательности характеристик белков.

Белки

34

82

–95 13

Вендрусколо, М., Кассел Э., Домани Э.

1997

Восстановление структуры белка по картам контактов

Сложить арт.

2

295

–306 14

Кабш, В. и Сандер, К.

1983

Словарь вторичной структуры белков: распознавание образов водородных связей и геометрических особенностей

Биополимеры

22

2577

–2637 15

Холм, Л.и Сандер, С.

1991

Алгоритм базы данных для генерации координат белковой цепи и боковой цепи из приложения C-альфа-трассировки для построения модели и обнаружения ошибок координат

Дж. Мол. биол.

218

183

–194 16

Канутеску А.А., Шеленков А.А., Данбрэк Р.Л., мл.

2003

Алгоритм теории графов для быстрого предсказания боковой цепи белка

Науки о белках.

12

2001

–2014 17

Эйрих В.А., Марти-Реном М.А., Пшибыльский Д., Мадхусудхан М.С., Фисер А., Пазос Ф., Валенсия А., Сали А., Рост Б.

2001

EVA: непрерывная автоматическая оценка серверов предсказания структуры белка

Биоинформатика

17

1242

–1243 18

Молт, Дж., Фиделис К., Земля А., Хаббард Т.

2003

Критическая оценка методов предсказания структуры белка (CASP) — раунд V

Белки

53

Доп. 6,

334

–339 © The Author 2005. Опубликовано Oxford University Press. Все права защищены Онлайн-версия этой статьи была опубликована по модели открытого доступа.Пользователи имеют право использовать, воспроизводить, распространять или отображать версию этой статьи в открытом доступе в некоммерческих целях при условии, что: оригинальное авторство правильно и полностью указано; Журнал и Издательство Оксфордского университета указаны как исходное место публикации с правильными данными цитирования; если статья впоследствии воспроизводится или распространяется не полностью, а только частично или как производное произведение, это должно быть четко указано. Для коммерческого повторного использования, пожалуйста, свяжитесь с журналами.разрешения@oupjournals.org

Извлечение физико-химических характеристик для прогнозирования вторичной структуры белка

Мы предлагаем метод прогнозирования вторичной структуры белка, основанный на профилях позиционно-специфической оценочной матрицы (PSSM) и четырех физико-химических характеристиках, включая параметры конформации, суммарные заряды, гидрофобность и массу боковой цепи. Сначала находится SVM с оптимальным размером окна и оптимальными параметрами функции ядра. Затем мы обучаем SVM, используя профили PSSM, сгенерированные из PSI-BLAST, и физико-химические характеристики, извлеченные из набора данных CB513.Наконец, мы используем фильтр для уточнения прогнозируемых результатов обученной SVM. Для всех показателей эффективности нашего метода достигает 79,52, SOV94 достигает 86,10 и SOV99 достигает 74,60; все показатели выше, чем у методов SVMpsi и SVMfreq. Это подтверждает, что учет этих физико-химических особенностей при прогнозировании вторичной структуры белка будет демонстрировать лучшие результаты.

1. Введение

В последние десятилетия были решены многие вопросы молекулярной биологии, включая генетику, структурную биологию и разработку лекарств.Первичная последовательность белка состоит из аминокислот; как мы знаем, всего в белковых последовательностях можно найти 20 различных видов аминокислот. В этой статье мы будем исследовать вторичные структуры белка на основе белковых последовательностей.

Вторичная структура белковой последовательности возникает из-за различной укладки аминокислот из-за различий в размерах их боковых цепей, форме, реакционной способности и способности образовывать водородные связи. Кроме того, из-за различий в размерах боковых цепей, количестве электрических зарядов в сочетании со сродством к воде третичные структуры белковых последовательностей не одинаковы.Таким образом, исследование молекулярных структур белковых последовательностей делится на вторичные, третичные и даже четвертичные структуры. Учитывая первичную последовательность белка, его соответствующую вторичную структуру можно выявить следующим образом:   Первичная последовательность:   MFKVYGYDSNIHKCVYCDNAKRLLTVKKQPFEFINIMPEKGV   Вторичная структура:   CEEEEECCCCCCCCHHHHHHHHHHHCCCCEEEEECCCCTTC.

Белковая последовательность влияет на структуру и функцию; иными словами, последовательность белка определяет его структуру, а структура определяет функции.Если аминокислоты в белковой последовательности расположены в другом порядке в скелетной ветви R-группы боковой цепи, то природа белка выявит специфические функции. Даже для разных видов белков, если бы они имели сходную структуру, их функции также были бы сходными. Следовательно, предсказание структуры белка имеет решающее значение для функционального анализа. Кроме того, вторичная структура относится к относительному положению пространства между атомами определенного остова. Традиционное определение структуры белка проводилось с помощью рентгеновской кристаллографии белка или ядерного магнитного резонанса (ЯМР).Однако весь экспериментальный анализ требует много времени. Чтобы сократить время на помощь биологам, компьютерное предсказание структуры белка облегчает достижение этой цели.

Предсказание вторичной структуры белков изучается на протяжении десятилетий. Ранее статистический анализ вторичной структуры проводился для одной аминокислоты. Наиболее представительным является метод Чоу и Фасмана [1], точность которого составляет всего 50 %. Далее был проведен статистический анализ аминокислотных сегментов.Длина сегмента обычно составляет от 9 до 21 аминокислоты. На основе аминокислотного сегмента предсказание структуры центральных остатков позволяет повысить точность. Наиболее представительным является метод ГФ [2], точность которого увеличивается более чем на 10 % (около 63 %). В настоящее время методы прогнозирования вторичной структуры белка превратились в использование программы PSI-BLAST [3] для поиска информации о гомологии белка на основе профилей PSSM (матрицы оценки положения). Точность использования PSSM для предсказания вторичной структуры достигла 70–80 % [4–7].Тем не менее, мы считаем, что все еще существуют значительные улучшения в предсказании вторичной структуры белка.

Остальная часть этого документа организована следующим образом. В разделе 2 сначала вводятся основные понятия, используемые в предлагаемых методах. В разделе 3 мы предлагаем методы и соответствующие функции для предсказания вторичной структуры белковой последовательности. Затем мы используем размеры окна и параметры настройки в экспериментах в разделе 4, чтобы получить лучшие экспериментальные результаты. Наконец, мы делаем вывод в разделе 5.

2. Основные понятия
2.1. Вторичная структура белка

Вторичная структура белка, полученная из экспериментально определенной трехмерной структуры, была определена с использованием DSSP (Словарь вторичных структур белков) [8], STRIDE (STRuctural IDentification) [9] и DEFINE (DEFINE_structure) [10]. DSSP выбран здесь, чтобы наш метод можно было сравнить с большинством существующих методов, основанных на том же определении вторичной структуры белка. Там было определено восемь классов вторичной структуры, а именно: H( α -спираль), G(310-спираль), I( π -спираль), E( β -цепь), B(изолированная β -мост), T(поворот), S(изгиб) и -(отдых).Восемь классов структуры обычно сводятся к трем классам спирали (H), листа (E) и катушки (C). Пять редукций могут быть выполнены следующим образом: (1) H, G и I в H; от Е до Е; остальные до C(2)H, G до H; Е, В до Е; остальные до C(3)H, G до H; от Е до Е; остальное до С(4)Н до Н; Е, В до Е; остальное до С(5)Н до Н; от Е до Е; остальные до C.

Первая редукция была использована в методе PHD (Profile network от HeiDelberg) [7], который является ранним методом прогнозирования вторичной структуры с использованием множественного выравнивания последовательностей белков, гомологичных запрашиваемой последовательности белка.Мы также используем первое сокращение, чтобы обеспечить справедливое сравнение с другими методами прогнозирования.

2.2. SVM (Машина опорных векторов)

SVM впервые был исследован Boser et al. в 1992 г. [11]. Он решает линейно неразделимые задачи, нелинейно отображая вектор в пространстве низкой размерности в пространстве признаков более высокой размерности и строит оптимальную гиперплоскость в пространстве более высокой размерности. Таким образом, SVM имеет высокую производительность при классификации данных. Задача классификации обычно связана с данными обучения и тестирования, которые состоят из нескольких экземпляров данных.Каждый экземпляр в обучающем наборе содержит одно «целевое значение» (т. е. метку класса) и несколько «атрибутов» (т. е. признаков). Цель SVM — создать модель, которая может предсказать целевое значение экземпляров данных в тестовом наборе с помощью атрибутов.

3. Методы и особенности
3.1. Архитектура системы

Архитектура системы прогнозирования вторичной структуры белка разделена на три этапа, как показано на рис. 1. Первый этап заключается в определении/извлечении соответствующих признаков в/из белковых последовательностей.Затем, на втором этапе, мы передаем функции в SVM соответственно на этапах обучения и тестирования. Наконец, мы используем метод фильтра для уточнения прогнозируемых результатов обученной SVM. На этапе обучения SVM мы не только обучаем SVM с использованием обучающих данных, но и заранее находим оптимальный размер скользящего окна, а также параметры стоимости и гаммы функции ядра SVM, используя весь набор данных. Подробная информация о каждом модуле в архитектуре системы представлена ​​в следующих подразделах.


3.2. Извлечение признаков

Пять соответствующих типов признаков извлекаются из белковых последовательностей для прогнозирования вторичной структуры белка, то есть параметров конформации, профилей позиционно-специфичной оценочной матрицы (PSSM), суммарного заряда, гидрофобности и массы боковой цепи. Процесс выделения признаков показан на рисунке 2.


3.2.1. Извлечение последовательностей

Сначала мы извлекаем аминокислотные последовательности и последовательности вторичной структуры с веб-сайта PDB (http://www.rcsb.org/pdb/home/home.do), используя коды PDB CB513 [12]. Затем мы можем дополнительно извлечь пять различных признаков из последовательностей аминокислот следующим образом.

3.2.2. Параметры конформации

Параметры конформации — это пропорции, в которых остатки (или аминокислоты) стремятся к вторичной структуре. В целом, вторичная структура белка делится на три типа: α — спираль (H), β — лист (E) и спираль (C), так что для каждой аминокислоты имеется три значения.При извлечении признаков все параметры конформации рассчитываются из набора данных. Параметры конформации для каждой аминокислоты определяются следующим образом: В этой формуле указывает 20 аминокислот и указывает на 3 типа вторичной структуры: H, E и C. Здесь — количество й аминокислоты в наборе данных, тогда как количество й аминокислот с вторичная структура. Параметры конформации для каждой аминокислоты в наборе данных показаны в таблице 1.Причина использования параметров конформации в качестве признаков заключается в том, что свертывание каждого остатка имеет некоторую корреляцию с формированием определенной структуры.


аминокислот Н Е С

0,49 0,16 0,35
R 0,42 0,19 0,39
С 0.27 0,13 0,6
D 0,31 0,11 0,58
С 0,26 0,29 0,45
Е 0,49 0,15 0,36
Q 0,46 0.16 0.16 0,38
G 0.16 0.14 0,7
H 0.3 0.22 0,48
Я 0,35 0,37 0,28
л 0,45 0,24 0,31
К 0,4 0,17 0,43
M 0.24 0.23 0.23 0.33
F 0.35 0.3 0.35
P 0,18 0.09 0.74
S 0,28 0,19 0,54
Т 0,25 0,27 0,48
Вт 0,37 0,29 0,35
Да 0.34 0.3 0.39 0.36
V 0.3 0,21 0.29 0.29

3.2.3. Профили PSSM

Профили PSSM генерируются программой PSI-BLAST (Инструмент поиска базового итеративного локального выравнивания для конкретной позиции). Поскольку профили PSSM связаны с биологической эволюцией, мы рассматриваем их как особенности в нашей работе. Профиль PSSM имеет L × 20 элементов, где L — длина последовательности запроса. Затем эти профили используются в качестве входных данных для SVM с использованием метода скользящего окна.

PSI-BLAST основан на BLAST, опубликованном Altschul et al.в 1997 г. [3]. Поскольку программа PSI-BLAST более чувствительна, чем другие методы, мы можем найти множество последовательностей с низким сходством и функции сходства структуры белковых последовательностей. Сначала выбирается база данных, содержащая все известные последовательности (или неизбыточная база данных). Затем из базы данных nr удаляются регионы низкой сложности. Наконец, программа PSI-BLAST используется для запроса каждой последовательности в CB513 и генерирует профили PSSM после трех итераций. Здесь в этом процессе используются множественное выравнивание последовательностей (MSA) и матрица BLOSUM62 [13].

Целью использования метода скользящего окна является получение дополнительной информации об остатках. Мы рассматриваем скользящее окно размером 7~19, в котором прогнозируемый остаток центрируется для извлечения входных признаков. Оптимальный размер окна, обеспечивающий благоприятные прогностические характеристики, может быть получен экспериментально. Для th остатка с центром в скользящем окне размера 7 мы можем получить 7 × 20 признаков, где находится в диапазоне 3, 3 и является столбцом PSSM от 1 до 20.

3.2.4. Net Charges

Есть пять аминокислот с зарядами, то есть R, D, E, H и K.Поскольку остатки с одинаковым электрическим зарядом отталкиваются друг от друга и прерывают водородную связь основной цепи, они препятствуют образованию α -спирали. Кроме того, непрерывные остатки листа β не могут быть с аналогичными зарядами. Эта информация облегчает предсказание вторичной структуры. Суммарный заряд аминокислот можно взять из базы данных Amino Acid index (или AAindex) [14–18], как показано в таблице 2. Знак «плюс» представляет собой положительный заряд, а знак «минус» представляет собой отрицательный заряд.

90 268 аминокислоты Масса 9026 4


0
R +1
Н 0
d -1 -1 -1 C 0
E -1 Q 0
г 0
H +1
Я 0
л 0
К +1
М 0
F 0
Р 0
S 0
T 0
W 0
Y 0
В 0

3.2.5. Гидрофобный

При сворачивании белка полярные остатки предпочитают оставаться вне белка, чтобы предотвратить воздействие на неполярные (гидрофобные) остатки полярного растворителя, такого как вода. Следовательно, периодически возникающие гидрофобные остатки можно использовать для предсказания вторичной структуры белка. Обычно остатки в структуре спирали α состоят из одного гидрофобного сегмента и одного гидрофильного сегмента. Однако на структуру листа β обычно влияет окружающая среда, поэтому это явление неочевидно.Другими словами, гидрофобность влияет на стабильность вторичной структуры. Гидрофобные значения аминокислот также могут быть получены из базы данных Amino Acid index (или AAindex) [14–18], как показано в таблице 3. Чем больше положительных значений, тем более гидрофобны.


Mass 1 Mass

A 1.8
R -4.5
Н -3,5
D -3,5
С 2,5
Е -3,5
Q -3,5
G -0.4 -0,4
H -3.2 -3.2
I 45
L 3.8
K -3.9 1 м 1.9
F 2.8
Р -1,6
S -0,8
Т -0,7
Вт -0,9
Да −1,3
В 4,2

8 914,6 Масса боковой цепи

Хотя базовая структура, показанная на рис. 3, одинакова для 20 аминокислот, размер группы R боковой цепи по-прежнему влияет на сворачивание структуры.Здесь мы объясняем влияние следующим образом. Во-первых, группа R боковой цепи распределена снаружи основной цепи α -спиральной структуры, но непрерывные большие группы R могут сделать структуру α -спирали нестабильной, тем самым препятствуя образованию аминокислот α — спиральная структура. Далее, группе R с кольцевой структурой, подобной пролину (P), нелегко образовать структуру α -спирали. Пролин состоит из 5 атомов в кольце, которое нелегко обратить вспять, а также нелегко создать водородную связь.Наконец, мы наблюдаем, что группа R β -листовой структуры меньше, чем группы других структур в целом. Поэтому мы включаем массу боковой цепи как функцию, как показано в таблице 4.

9264 91.1323 9164

аминокислоты MASS

A 15.0347
R 100.1431
N 58.0597
D 59.0445
С 47,0947
Е 73,0713
В 72,0865
G 1,0079
Н 81,0969
Я 57,1151
L L 57.1151
K 72.1297
M 75.1483
F 91.1323
P 41.0725
S 31,0341
Т 45,0609
Вт 130,1689
Y 107,1317
V 43.0883


3.3. SVM (нахождение оптимального размера окна и параметров)

SVM, используемый в экспериментах, представляет собой классификатор для предсказания вторичной структуры H, E и C.Для набора данных CB513 используется тройная перекрестная проверка, чтобы найти оптимальный размер окна в диапазоне [7, 19] и оптимальные параметры функции ядра, такие как стоимость C и гамма γ . Здесь функция ядра, используемая в SVM, — это RBF (т. е. функция радиального базиса). Для решения проблемы мультикласса, с которой столкнулись в работе, мы используем подход «один против одного». Для 3 классов нам нужно 3 бинарных классификатора и установить метки вторичной структуры (H, E, C) на (−1, +1, +2).Затем мы используем стратегию голосования max-wins для определения класса; другими словами, каждый бинарный классификатор подает голос, и класс-победитель получает наибольшее количество голосов. В экспериментах для реализации программы будет использоваться набор инструментов LIBSVM, предложенный Chang и Lin [19]. После того, как будут найдены оптимальный размер окна и параметры, мы будем использовать SVM для обучения и тестирования.

3.4. Фильтр

Отдельный осадок в его естественном состоянии не может быть свернут отдельно в спираль α или в лист β .Таким образом, установка пороговых значений длины вторичной структуры консенсуса может использоваться для фильтрации неверных предсказанных результатов. Например, по меньшей мере три смежных остатка относятся к α -спирали и по меньшей мере два смежных остатка относятся к β -слою. Для текущего окна сканирования (, , + 1) в прогнозируемой вторичной структуре в позиции могут возникнуть две возможные структуры: Случай H: если str() и str() равны H, то str() не изменяется; в противном случае расширьте проверяемый сегмент до (, , , , , , ) и замените str() структурой большинства в проверяемом сегменте.Случай E: если str() или str() равно E, то str() не изменяется; в противном случае расширьте проверяемый сегмент до (, , , , , , ) и замените str() мажоритарной структурой в проверяемом сегменте. Для примера, показанного на рисунке 4, после фильтрации значение 9INSb улучшается с 76,7 до 80. и SOV99 улучшен с 77,8 до 93,3, где и SOV99 будет описан в разделе 4.2.


4. Эксперименты
4.1. Набор данных

В предыдущей работе для предсказания вторичной структуры белка часто использовались некоторые типичные наборы данных, такие как RS126 [7], CB513 [12], CASP [20] и EVA [21].Здесь мы считаем, что выбранный набор данных должен иметь низкое сходство; то есть последовательности белков в наборе данных не похожи друг на друга. Таким образом, разработанное нами предсказание вторичной структуры белка позволит более точно предсказать неизвестную последовательность белка.

В нашей работе набор данных, который мы выбрали, представляет собой негомологичный набор данных CB513, построенный Каффом и Бартоном и содержащий 513 белковых цепей. Почти все последовательности в наборе данных RS126 также включены в набор данных CB513.Набор данных CB513 содержит 16 цепей из ≤30 остатков. Хотя очень короткие цепочки несколько снижают точность жесткого определения вторичных структур, мы все же включаем их в набор для всестороннего изучения. Мы получаем набор данных CB513 с веб-сайта: http://paraschopra.com/projects/evoca_prot/index.php, который содержит 84 093 остатка, из которых 34,59 % остатков приходится на спираль, 21,35 % на лист и 44,06 % на спираль. , как показано в таблице 5.


Структуры H Е C Итого

остаточным количествам 29090 17950 37053 84093

4.2. Показатели эффективности

Два вида показателей эффективности часто используются для предсказания вторичной структуры белка; то есть или точность (общая точность по остатку с тремя состояниями) и SOV99 [22] (или SOV94 [23]) (мера перекрытия сегментов). представляет собой основанную на остатках меру общего процента правильно классифицированных остатков по трем структурам, которую можно представить как где — общее количество предсказанных остатков, H до — правильно классифицированная вторичная структура для спирали, E до для листа и C до для катушки.

SOV99 — это основанная на сегментах мера трех структур, значение которой находится в диапазоне от 0 до 100, как показано в формуле (3). SOV99 отличается от модуля предсказания тем, что SOV99 наказывает за неправильные предсказания; например, предсказание одиночной спирали как многократно расщепленной спирали является нереалистичным предсказанием. где и обозначают сегменты вторичной структуры (H, E или C), и оба находятся в структуре, — значение нормализации, (, ) — длина фактического перекрытия и , , ) — длина общей протяженности для и , и (, ) можно представить в виде Определение и значение нормализации N различаются для SOV99 и SOV94.

4.3. Оптимальные параметры и размеры окна

Как было представлено в разделе 2.2, мы принимаем хорошо известную LIBSVM, разработанную Чангом и Лином [19], в качестве классификатора SVM. Используемая здесь функция ядра — RBF (Radial Basis Function), поскольку она более точна и эффективна, чем другие функции ядра. Параметры и определяются оптимальной производительностью комбинаций 6 × 6 между и для каждого размера окна. Более того, вектор признаков нормирован в диапазоне 0, 1 и количество признаков в большем размере окна стало бы больше.Оптимальные параметры и точность классификации оцениваются в трехкратной кросс-подтверждении, как показано в таблице 6.

76,3203 11 77,4464 78,0029

Размеры окна Особенности Лучшие Лучшие γ Точность ( %)

7 146 2 0 2 -3
9 186 2 1 2 — 4 76.7935
226 2 0 2 -4
13 266 2 1 2 -4
15 306 2 2 2 -4 2 9 77.7806
17 346 2 1 2 -5 77.6549
19 386 386 2 1 2 9 7749996

Согласно экспериментальным результатам, мы нашли оптимальные параметры и окна size = 2 1 , = 2 −4 , WS = 13. Затем мы используем эти параметры и размер окна для проведения дальнейших экспериментов.

4.4. Экспериментальные результаты

В этом разделе мы сравниваем экспериментальные результаты без фильтрации и с фильтрацией.Для результатов классификации используется матрица путаницы для представления правильных и ложных прогнозов на основе точности и полноты, как показано в таблицах 7 и 8. Точность и полнота выражаются следующим образом:

+

Фактический Прогнозируемая
Н Е С Напомним (%)

Н 22976 931 5183 78.98
Е +1044 11569 5337 64,45
С 3451 3059 30543 82,43
Точность (%) 83,64 74,36 74,38 77,40


Фактический Прогнозируемая
Н Е С Напомним (%)

Н 22372 818 5900 76.91
Е 432 11776 5742 65,60
С 1514 2819 32720 88,31
Точность (%) 92,00 76,40 73,76 79,52

Очевидно, что точность классификации с фильтрацией (т.е. 79,52%) выше, чем без фильтрации.э., 77,40%). Точность и полнота для особенно улучшены с 83,64 до 92,00 (с фильтрацией) и с 82,43 до 88,31 (с фильтрацией) соответственно. Следовательно, правила фильтрации необходимы для повышения точности предсказания вторичной структуры белка.

4.5. Сравнение с другими методами

Здесь мы сравниваем наши методы с другими четырьмя методами; то есть PHD, SVMfreq, PMSVM и SVMpsi, как показано в таблице 9. Оба метода PHD и SVMfreq основаны на частотных профилях с множественным выравниванием последовательностей; однако классификатор, используемый в методе PHD, представляет собой нейронную сеть (или NN), тогда как классификатор, используемый в методе SVMfreq, представляет собой машину опорных векторов (или SVM).Точно так же методы PMSVM и SVMpsi основаны на профилях PSSM, созданных с помощью PSI-BLAST. Хотя они используют однотипный классификатор (или SVM), первый принимает классификатор один против одного (т. е., , , ), а второй принимает классификатор один против остальных (т. е. /~, /~, /~ ).


Методы SUV94 SUG99 R (H) R (E) R (C)

Phd ( RS126) [7] 70.8 73,5 72,0 66,0 72,0
SVMfreq (RS126) [5] 71,2 74,6 73,0 58,0 73,0
SVMfreq (CB513) [5] 73.5 76.2 75.0 75,0 79.0 79.0 99.0 9
PMSVM (CB513) [4] 75.2 80269 80.4 71,5 72,8
SVMpsi (RS126) [6] 76,1 79,6 72,0 77,2 63,9 81,5
SVMpsi (CB513) [6] 76,6 80.1 73.1 73.5 78.1 65.6 81.1 81.1 91.1
77.40 90.20 71.10 78.98 64.45 82.43
Наши с фильтрацией (CB513) 79,52 86,10 74,60 76,91 65,60 88.31

Как показано в таблице 9, мы обнаружили, что все показатели производительности нашего метода (т. е. версии с фильтрацией), включая , SOV94 и SOV99, выше, чем у других четырех методов, независимо от использования наборов данных CB513 или RS126. для версии с фильтрацией (или без фильтрации) улучшен на 2.92 (или 0,8), SOV94 для версии с фильтрацией (или без фильтрации) улучшается на 6 (или 10,1), а SOV99 для версии с фильтрацией улучшается на 1,1 по сравнению с результатами метода SVMpsi для CB513 (т.е. , следующий лучший).

Однако наш метод (т.е. версия с фильтрацией) имеет более низкое значение R(H), чем метод SVMpsi (т.е. 76,91 против 78,1). Одна из возможных причин заключается в том, что в фильтре установлен порог длины консенсусной вторичной структуры (т. е. не менее трех последовательных остатков для H).Хотя отзыв для H уменьшается, предсказанные структуры имеют более структурное значение. Кроме того, мы обнаружили, что две меры SOV в SVMpsi и наши методы сильно различаются. Хотя SOV94 уменьшился (т. е. с 90,20 до 86,10) после применения фильтра в нашем методе, последнее определение (т. е. SOV99) по-прежнему является самым высоким.

5. Выводы

В этой статье мы предлагаем метод прогнозирования вторичной структуры белка с использованием профилей PSSM и четырех физико-химических характеристик, включая параметры конформации, суммарные заряды, гидрофобность и массу боковой цепи.В экспериментах сначала находится SVM с оптимальным размером окна и оптимальными параметрами функции ядра. Затем мы обучаем SVM, используя профили PSSM и физико-химические характеристики, извлеченные из набора данных CB513. Наконец, мы используем фильтр для уточнения прогнозируемых результатов обученной SVM. Для экспериментальных результатов , SOV94, SOV99 и полнота нашего метода выше, чем у метода SVMpsi на основе профилей PSI-BLAST, а также метода SVMfreq на основе частотных профилей с множественным выравниванием последовательностей для набора данных CB513. .Таким образом, рассмотрение этих физико-химических особенностей при прогнозировании вторичной структуры белка дает более высокие результаты.

Благодарность

Эта работа была поддержана Национальным научным советом Тайваня в рамках гранта NSC100-2218-E-224-011-MY3.

Прогнозирование структурных классов белков с помощью различных выражений признаков на основе шумоподавления и слияния двумерных вейвлетов | BMC Bioinformatics

Выбор параметров λ и

r

В этой статье для извлечения векторов признаков используются два типа псевдоаминокислотных композиций, а разные параметры λ и r приведут к несогласованности содержащейся информации о признаках. в извлеченных векторах признаков, тем самым влияя на окончательные результаты прогнозирования.Следовательно, необходимо выбрать оптимальное значение λ и r , а диапазон λ и r составляет от 1 до 9, поэтому в этом разделе выбирается оптимальный параметр λ или r между 1 и 9. В этой статье с использованием 25PDB в качестве объекта исследования обсуждается достоверность этих векторов признаков, извлеченных из двух разных типов псевдоаминокислот, соответственно. Базисная функция вейвлета для двумерного шумоподавления равна db4, масштаб вейвлет-разложения равен 3, а значение K классификатора KNN установлено равным 3.Экспериментальные результаты общей точности прогнозирования структурных классов белков и точности прогнозирования каждого класса показаны в Таблице 3 и Таблице 4.

Таблица 3 Результаты прогнозирования PseAAC типа 1 по различным значениям λ на 25PDB Таблица 4 Результаты прогнозирования PseAAC типа 2 по различным значениям r на 25PDB

Из таблиц 3 и 4 можно сделать вывод, что разные значения λ 1 и λ 2 действительно влияют на прогноз Результаты.Когда λ и r равны 2, общая точность предсказания является самой высокой, 87,98 и 76,99% соответственно. Следовательно, оптимальные λ и r для обоих типов псевдоаминокислотных композиций равны 2.

Выбор вейвлет-функции и масштаба разложения

состав, приняты в этой статье, которая все еще содержит значительную избыточную информацию.Чтобы получить более эффективную информацию, двумерное вейвлетное шумоподавление используется для обработки векторов признаков, извлеченных двумя методами выражения признаков по отдельности, удаляя из них избыточную информацию.

Однако выбор вейвлет-функции и масштаба разложения будет определять эффект шумоподавления моделей, а затем дополнительно влиять на окончательную общую точность прогноза. Чтобы дополнительно получить эффективную информацию о структурных белках, мы выбрали различные вейвлет-функции и разные масштабы разложения для изучения влияния на модели предсказания, включая db2, db4, db6, sym2, sym4, sym6, coif1, coif3, bior2.2 и bior2.4, а также шкалу разложения от 2 до 5. Мы обсудили оптимальные параметры шумоподавления векторов признаков, извлеченных PseAAC типа 1 и PseAAC типа 2.

В качестве образца для поиска оптимальных параметров выбран 25PDB. В Таблице 5 и Таблице 6 показано, что два связанных фактора вейвлет-функции и масштаба разложения действительно влияют на эффект шумоподавления, тем самым влияя на общую точность прогнозирования метода. Когда масштаб разложения равен 5 и используется вейвлет-функция db6, эффект вейвлет-шумоподавления оптимален в таблице 5; когда масштаб разложения равен 5 и используется вейвлет-функция sym4, эффект вейвлет-шумоподавления оптимален в таблице 6.Следовательно, чтобы получить хорошие результаты прогнозирования, мы выбираем 5 в качестве масштаба разложения и вейвлет db4 в качестве функции вейвлета для шумоподавления векторов признаков, извлеченных псевдоаминокислотной композицией типа 1; мы выбираем 5 в качестве шкалы разложения и вейвлет sym4 в качестве функции вейвлета для шумоподавления векторов признаков, извлеченных с помощью псевдоаминокислотной композиции типа 2. Кроме того, в Таблице 5 и Таблице 6 показано, что когда масштаб разложения равен 2, независимо от типа выбранной базисной функции вейвлета, общая точность предсказания ниже, чем при других масштабах.С увеличением масштаба декомпозиции общая точность предсказания имеет тенденцию к росту. Чтобы описать эту тенденцию более интуитивно, мы нарисовали линейные графики общей точности предсказания при различных базисных функциях вейвлета и масштабах разложения, как показано на рис. 3 и 4.

Таблица 5 Результаты прогнозирования для 25PDB с помощью различных вейвлет-функций и различных масштабов вейвлет-разложения с использованием типа 1 PseAAC Таблица 6 Результаты прогнозирования для 25PDB с помощью различных вейвлет-функций и различных масштабов вейвлет-разложения с использованием PseAAC типа 2 Рис.3

Результаты прогнозирования по типу 1 PseAAC на различных масштабах декомпозиции и вейвлет-базисных функциях на 25PDB

Рис. 4

Результаты прогнозирования по типу 2 PseAAC на различных масштабах декомпозиции и вейвлет-базисных функциях на 25PDB

Как показано на рис. 3 и 4, с увеличением масштаба разложения общая точность предсказания, полученная экспериментально, улучшается при различных условиях базисных функций вейвлета. Когда масштабы разложения равны 4 и 5, общая точность предсказания, полученная в результате эксперимента, заметно близка, что указывает на то, что с увеличением масштаба общая точность предсказания будет иметь тенденцию к стабильности, не будет продолжать увеличиваться или даже может отклонить.Более того, из рис. 3 и 4 видно, что хотя выбор масштаба разложения и базисной функции вейвлета будет влиять на общую точность предсказания эксперимента, влияние масштаба разложения больше, чем влияние базисной функции вейвлета.

Сравнение с одномерным вейвлет-шумоподавлением

Чтобы убедиться в превосходстве двумерного (2-D) вейвлет-метода шумоподавления, мы сравнили его с одномерным (1-D) вейвлет-методом шумоподавления. Последовательность структурного белка 1A1W в 25PDB была выбрана в качестве экспериментального образца для сравнения эффекта шумоподавления.Масштаб разложения равен 5, а в качестве базисной функции вейвлета выбран вейвлет sym4. Значение K в классификаторе KNN по-прежнему равно 3. Мы используем 24-мерные векторы числовых признаков, извлеченные из последовательности белка 1A1W посредством псевдоаминокислотного состава типа 2, в качестве исходного сигнала. чтобы интуитивно показать сравнение двух эффектов шумоподавления, мы выбираем форму графика для отображения. Результаты сравнения одномерного вейвлет-шумоподавления и двумерного вейвлет-шумоподавления показаны на рис.5.

Рис. 5

Сравнение одномерного шумоподавления и двумерного шумоподавления на 25PDB

Как видно из рис. колебаться. После одномерного вейвлет-шумоподавления, хотя сигнал и изменился, эффект шумоподавления невелик. После двумерного вейвлет-шумоподавления сигнал явно отличается от исходного сигнала, становясь более плавным и стабильным, что указывает на то, что эффект шумоподавления особенно хорош.Этот вывод наблюдается в нашем исследовании. Мы используем дисперсию, чтобы точно описать разницу в сигнале. Дисперсия исходного сигнала составляет 30,526. После одномерного вейвлет-шумоподавления дисперсия сигнала составляет 14,274. После двумерного вейвлет-шумоподавления дисперсия сигнала становится равной 6,189. Таким образом, эффект шумоподавления двумерного вейвлета лучше, чем эффект одномерного вейвлета.

Подводя итог, можно сказать, что двумерное вейвлет-шумоподавление лучше, чем одномерное вейвлет-шумоподавление, и этот метод двумерного вейвлет-шумоподавления можно использовать не только в структурных классах, но и в других типах моделей классификации белков.

Выбор значения K в классификаторе K-ближайших соседей

Классификатор K-ближайших соседей, который основан на сходстве точек выборки для выбора первых K точек выборки для классификации голосования. Однако это значение K часто неизвестно, и выбор других значений K приведет к различным результатам прогнозирования. Поэтому для получения лучших результатов прогнозирования необходимо выбрать оптимальное значение К. В этом разделе оптимальное значение K выбирается от 1 до 9.При разных значениях K точность предсказания каждого класса и общая точность предсказания последовательности классов структуры белка показаны в таблице 7. При разных значениях K точность предсказания каждого класса и общая точность предсказания последовательности классов структуры белка представлены в таблице 7.

Таблица 7 Результаты прогнозирования путем выбора различных значений K в 25PDB

Как показано в Таблице 7, различные значения K оказывают определенное влияние на результаты прогнозирования.В модели 1 с увеличением значений K общая точность прогноза снижается. Когда K равно 1, общая точность прогнозирования является самой высокой, 97,91%, а когда K равно 9, общая точность прогнозирования является самой низкой, 91,33%. Чтобы визуализировать общую точность прогнозирования при различных условиях K, мы используем линейную диаграмму для ее описания, как показано на рис. 6. Из рис. 6 видно, что разные значения K будут влиять на результаты прогнозирования эксперимента, и с увеличением значений K общая точность предсказания имеет тенденцию к снижению.

Рис. 6

Результаты прогнозирования путем выбора различных значений K на 25PDB

Сравнение различных стратегий

В этой статье предлагается модель слияния признаков, основанная на параллельном двумерном шумоподавлении. Чтобы лучше продемонстрировать повышение точности предсказания моделей, в этом разделе проводится сравнение с другими стратегиями.

Сравните различные стратегии на 25PDB. В таблице стратегия 1 относится к использованию только композиции псевдоаминокислот типа 1; стратегия 2 относится к использованию только псевдоаминокислотной композиции типа 2; стратегия 3 относится к комбинации псевдоаминокислотной композиции типа 1 и двумерного шумоподавления вейвлета; стратегия 4 относится к комбинации псевдоаминокислотной композиции типа 2 с двумерным вейвлет-шумоподавлением; и стратегия 5 относится к первой комбинации признаков, извлеченных из композиции псевдоаминокислот типа 1 и типа 2.Затем слияние векторов признаков сочетается с двумерным вейвлет-шумоподавлением; стратегия 6 относится к модели, предложенной в этой статье. Среди этих стратегий параметры λ и r в двух типах псевдоаминокислотного состава равны 2. В классификаторе значение K в KNN находится в диапазоне от 1 до 9, и параметры двумерного вейвлет-шумоподавления также равны 2. наилучшая базисная функция вейвлета для шумоподавления и шкала разложения. Результаты эксперимента представлены в таблице 8 и на рис.7.

Таблица 8 Сравнение различных стратегий на 25PDB Рис. 7

Сравнение различных стратегий на 25PDB

Из табл. 8 и рис. 7 видно, что общая точность предсказания модели 1, предложенной в данной работе, достигает наивысшего уровня, 98,09%, и может Из таблицы видно, что идея параллельного двумерного шумоподавления, предложенная в этой главе, эффективна. По сравнению со стратегией 5, сначала объединяющей векторы признаков, а затем удаляющей шум, общая точность предсказания повышается на 1.08%, а применение двумерного вейвлет-шумоподавления повышает точность предсказания на 1,08%. Результаты измерений имеют большое значение. Стратегия 1 и Стратегия 2 не используют двухмерное вейвлетное шумоподавление, и точность их предсказания далека от точности других стратегий. В заключение, идея синтеза, предложенная в этой модели, очень эффективна.

Влияние различных классификаторов на результаты прогнозирования

Три классификатора: наивный байесовский, KNN и SVM используются для изучения влияния различных классификаторов на результаты прогнозирования.Параметры двух типов псевдоаминокислотной композиции равны 2. Параметры шумоподавления двумерного вейвлета шумоподавления для выделенных векторов признаков псевдоаминокислотной композиции типа 1: базисная функция вейвлета — вейвлет db4, масштаб разложения — 5, параметры шумоподавления двумерного вейвлета шумоподавления для извлеченных векторов признаков псевдоаминокислотного состава типа 2: базисная функция вейвлета — sym4, а масштаб разложения — 5. Значение K для KNN — наилучшее 1.Для SVM в качестве функции ядра используется радиальная базисная функция, а для выбора параметров C и G используется стратегия поиска по сетке. Диапазоны поиска обоих составляют от 2 − 10 до 2 10 . Метод складного ножа использовался для проверки влияния трех классификаторов на результаты прогнозирования в 25PDB. Экспериментальные результаты представлены в таблице 9 и на рис. 8.

Таблица 9 Влияние различных классификаторов на результаты прогнозирования в 25PDB Рис. 8

Влияние различных классификаторов на результаты прогнозирования в 25PDB

Как показано в таблице 9 и на рис.8, когда в качестве классификатора используется KNN, общая точность предсказания является самой высокой, 98,09%. Точность предсказания каждой категории является самой высокой, и только точность предсказания класса α + β является самой высокой параллельно с другими категориями. Когда в качестве классификатора используется Наивный Байес, общая точность предсказания составляет 82,90%, что значительно меньше, чем у KNN. Этот вывод показывает, что наивный байесовский метод не так эффективен, как KNN в этих экспериментальных условиях. Когда SVM используется в качестве классификатора, общая точность предсказания составляет 97.85%. Возможная причина этого вывода заключается в том, что диапазон поиска параметров не подходит, что приводит к тому, что производительность SVM не так хороша, как у KNN. Кроме того, SVM требует значительно больше времени для поиска параметров, чем KNN; поэтому, рассматривая классификаторы всесторонне, классификатор этой модели выбирает KNN.

Прогнозирование эффективности нашего метода

Эффективность метода определяет, может ли он применяться всеми. Поэтому, поскольку наше исследование не является исключением, традиционные методы оценки эффективности используются для проверки эффективности наших методов.В модели 1, основанной на двух типах методов псевдоаминокислотного состава и параллельном двумерном вейвлетном шумоподавлении, предлагается модель прогнозирования машинного обучения со слиянием двух признаков, которая называется PWD-FU-PseAAC. Во-первых, информация об особенностях белковых последовательностей извлекается по псевдоаминокислотному составу типа 1 и псевдоаминокислотному составу типа 2; другими словами, первичные белковые последовательности преобразуются в числовые векторы размерности 20 + λ и 20 + 2 r соответственно.Во-вторых, метод двумерного вейвлет-шумоподавления используется для отдельного шумоподавления двух векторов признаков и устранения их избыточности. Затем два вектора признаков после шумоподавления объединяются, что означает объединение первого и последнего векторов двух частей для формирования 40 + λ + 2 r векторов признаков. Наконец, оптимальные векторы признаков вводятся в классификатор KNN для прогнозирования, а результаты проверяются складным ножом. Оптимальные параметры модели предсказания могут быть получены из предыдущего экспериментального анализа.Значения λ и r в обоих типах PseAAC равны 2. Вейвлет db4 используется в качестве вейвлет-функции, а 5 выбрано в качестве масштаба разложения для удаления шума из векторов признаков, извлеченных PseAAC типа 1; Sym4 выбран в качестве вейвлет-функции, а 5 выбран в качестве масштаба разложения для устранения шума векторов признаков, извлеченных с помощью PseAAC типа 2. Значение K в классификаторе установлено равным 1. Производительность модели оценивается на 25PDB, 1189PDB и 640PDB. Экспериментальные результаты показаны в таблице 10.

Таблица 10. Эффективность прогнозирования модели 1 на основе трех эталонных наборов данных. на 25PDB, 1189PDB и 640PDB соответственно. Общая точность, полученная на трех наборах данных, была весьма удовлетворительной. Более того, коэффициент корреляции Мэтьюса (MCC) белков класса α + β ниже, чем у других классов для трех наборов данных.Следовательно, существует много проблем с идентификацией белковых последовательностей класса α + β с высокой эффективностью.

Сравнение с существующими методами

Чтобы объективно сравнить наш метод с ранее описанными методами, мы провели эксперименты в тех же условиях, что и предыдущие методы. Среди этих методов метод MEDP [58] основан на эволюционной информации, и предлагается новый метод выражения признаков. Метод SCPRED [22] основан на предсказании вторичной структуры для построения новых векторов признаков.Метод PKS-PPSC [59] основан на прогнозирующей вторичной структуре для построения векторов признаков, но он использует хаотическое игровое представление и информационную энтропию для построения векторов признаков. Метод, описанный Zhang et al. [23] основан на прогнозирующей информации о вторичной структуре, на основе этой информации предлагается матричное представление функции TPM. Метод PSSS-PSSM [25] объединяет предсказанные признаки вторичной структуры с матрицей PSSM. Метод PSSS-PsePSSM [60] сочетает предсказанные признаки вторичной структуры с улучшенной матрицей PSSM и предлагает новое выражение признаков слияния.Метод WD-PseAAC [53] извлекает векторы признаков на основе SVM, используя метод выражения одного признака, а затем удаляет из них шум с помощью вейвлет-шумоподавления. Наш метод состоит в том, чтобы удалить шум из извлеченных векторов признаков, а затем объединить их.

Экспериментальные результаты обобщены в таблице 11 и на рис. 9, 10, 11. Судя по экспериментальным результатам, представленным в таблице 11 и на рис. 9, общая точность прогнозирования 98,1 % достигается при использовании 25PDB, что является самым высоким показателем и на 5,0–23,3 % выше, чем у других методов.Кроме того, из экспериментальных результатов в Таблице 11 и Рис. 10 общая точность прогнозирования 97,3 % также получена для 1189PDB, что является самым высоким показателем и на 6,5–21,5 % выше, чем у других методов. Более того, из экспериментальных результатов в таблице 11 и на рис. 11 результаты прогнозирования также являются удовлетворительными для 640PDB. Точность предсказания четырех классов самая высокая, а общая точность предсказания самая высокая, 95,0%. В то же время есть и другие существенные изменения, заслуживающие нашего внимания.Например, общая точность предсказания нашего метода может достигать таких хороших результатов на трех наборах данных, потому что мы значительно повысили скорость предсказания белков класса α/β и белков класса α + β, в то время как скорость предсказания других методов для α/β белки класса и белки класса α + β заметно низки. Одна из причин того, что общая точность предсказания структурных классов белков была относительно низкой, заключается в том, что трудно предсказать белки α/β и α + β.

Таблица 11. Сравнение с другими методами по трем эталонным наборам данных Рис.9

Сравнение с другими методами на 25PDB

Рис. 10

Сравнение с другими методами на 1189PDB

Рис. 11

Сравнение с другими методами на 640PDB

Таким образом, на основании анализа приведенных выше экспериментальных результатов мы можем сделать вывод, что наши модели могут эффективно прогнозировать структурные классы белковых последовательностей даже на наборах данных с низким сходством . Причина, по которой наш метод лучше других, заключается в том, что хотя традиционный метод используется для извлечения векторов признаков, используемый нами метод выделения признаков может быть не так хорош, как другие.Однако после извлечения признаков мы используем двухмерное вейвлетное шумоподавление, чтобы удалить шум из избыточной информации в векторе признаков, что делает его более узнаваемым. Кроме того, другие исследователи также используют метод вейвлет-шумоподавления, но в этой статье предлагается новая стратегия слияния, основанная на вейвлет-шумоподавлении.

Вторичная структура белка — обзор

Предсказание вторичной структуры было выполнено для определения структурной значимости целевых последовательностей с использованием PSIPRED, основанного на словаре вторичной структуры белка (Kabsch and Sander, 1983).Компания MODELLER построила трехмерные модели пептида RIPL, чтобы выбрать лучшую модель с наивысшим показателем достоверности. Доступ к этим инструментам осуществлялся через локальный сервер метапотоков (http://zhanglab.ccmb.med.umich.edu/LOMETS/) (Wu and Zhang, 2007). Структура пептида RIPL и комплекса Hpn была предсказана и описана с помощью ZDOCK, алгоритма стыковки белков (http://zlab.umassmed.edu/zdock/) (Pierce et al., 2011).

Вторичная и третичная структуры пептида RIPL были проверены с использованием соответствующих программ.Новый CPHP несет два основных домена IPL для направленного действия и R8 для проникающего действия в клетку. Аналоги IPL были выбраны случайным образом с помощью фагового дисплея в клетках PC3, трансфицированных Hpn, на основании их общей гомологии во вторичной структуре белковых последовательностей (Kelly et al., 2008). Чтобы исследовать структурное сходство между пептидом RIPL и аналогами IPL, мы предсказали вторичную структуру пептида RIPL, используя метод PSIPRED, в котором вторичная структура обозначена как C (виток), E (цепь) и H (спираль).Последовательность аналогов IPL содержит общую структуру связанной катушки и нити (CCEE) (таблица 5.3). В пептиде RIPL С-конец пептида IPL был соединен с пептидом R8. Несмотря на связь pArg, эта общая вторичная структура была сохранена, чтобы гарантировать, что свойства нацеливания Hpn не будут затруднены. Мы обнаружили, что RIPL-пептид с флуоресцентной меткой (RIPL-FITC) демонстрировал большее клеточное поглощение клетками Hpn(+), чем поглощение при использовании только FITC-декстрана, что указывает на то, что аффинность Hpn сохранялась независимо от связи R8.Предлагаемые третичные структуры пептида RIPL и Hpn показаны на рис. 5.2.

Таблица 5.3. Вторичная структура пептидов Прогнозируемая по методу PSIPRED

CCEEEECC RIPL пептид
пептидной последовательности Вторичная структура
IPL аналоги
IPLVVPL CCEECCC
IPLWVPL CCEECCC
IPLVLVPL
IPLVVPLGGSCK CCEEEECCCCCC
IPLVVPLRRRRRRRRC CCEEEHHHHHHHHCCC

Перепечатывается из Kang, M.H., Park, MJ, Yoo, HJ, Kwon, YH, Lee, SG, Kim, SR, Yeom, DW, Kang, MJ, Choi, YW, 2014. Липосомы, конъюгированные с пептидом RIPL (IPLVVPLRRRRRRRRC) для улучшенной внутриклеточной доставки лекарств к экспрессирующим хепсин раковым клеткам. Евро. Дж. Фарм. Биофарм. 87, 489–499, с разрешения Elsevier.

Рисунок 5.2. Предлагаемые третичные структуры пептида RIPL и Hpn

W., 2014. Липосомы, конъюгированные с пептидом RIPL (IPLVVPLRRRRRRRRRRC), для усиленной внутриклеточной доставки лекарств к раковым клеткам, экспрессирующим хепсин. Евро. Дж. Фарм. Биофарм. 87, 489–499, с разрешения Elsevier.

Страница не найдена

К сожалению, страница, которую вы искали на веб-сайте AAAI, не находится по URL-адресу, который вы щелкнули или ввели:

https://www.aaai.org/papers/hunter/04-holbrook.pdf

Если URL-адрес, указанный выше, заканчивается на «.html», попробуйте заменить «.html: с «.php» и посмотрите, решит ли это проблему.

Если вы ищете конкретную тему, воспользуйтесь следующими ссылками или введите тему в поле поиска на этой странице:

  • Выберите AI Topics, чтобы узнать больше об искусственном интеллекте.
  • Чтобы присоединиться или узнать больше о членстве в AAAI, выберите «Членство».
  • Выберите «Публикации», чтобы узнать больше об AAAI Press и журналах AAAI.
  • Для рефератов (а иногда и полных текстов) технических статей по ИИ выберите библиотеку
  • .
  • Выберите журнал AI, чтобы узнать больше о главном издании AAAI.
  • Чтобы узнать больше о конференциях и встречах AAAI, выберите «Конференции»
  • .
  • Для ссылок на Симпозиумы AAAI выберите Симпозиумы.
  • Чтобы получить информацию об организации AAAI, включая ее должностных лиц и сотрудников, выберите «Организация».

Помогите исправить страницу, вызывающую проблему

Веб-страница

, который направил вас сюда, должен быть обновлен, чтобы он больше не указывал на эту страницу. Вы поможете нам удалить старые ссылки? Пожалуйста, напишите веб-мастеру ссылающейся страницы или используйте их форму для сообщения о неработающих ссылках.Это может не помочь вам найти нужную страницу, но, по крайней мере, вы избавите других людей от проблем. У большинства поисковых систем и каталогов есть простой способ сообщить о битых ссылках.

Если это покажется уместным, мы будем признательны, если вы свяжетесь с веб-мастером AAAI, указав, как вы сюда попали (например, URL-адрес страницы, которую вы искали, и URL-адрес перехода, если он доступен). Спасибо!

Контент сайта

Доступ к основным разделам этого сайта (и некоторым популярным страницам) можно получить по ссылкам на этой странице.Если вы хотите узнать больше об искусственном интеллекте, посетите страницу AI Topics. Чтобы присоединиться или узнать больше о членстве в AAAI, выберите «Членство». Выберите «Публикации», чтобы узнать больше о AAAI Press, AI Magazine, и журналах AAAI. Чтобы получить доступ к цифровой библиотеке AAAI, содержащей более 10 000 технических документов по искусственному интеллекту, выберите «Библиотека». Выберите «Награды», чтобы узнать больше о наградах, наградах и программах стипендий AAAI. Чтобы узнать больше о конференциях и встречах AAAI, выберите «Встречи». Чтобы получить ссылки на программные документы, обращения президента и сторонние ресурсы ИИ, выберите «Ресурсы».Для получения информации об организации AAAI, в том числе о ее должностных лицах и персонале, выберите «О нас» (также «Организация»). Окно поиска, созданное Google, будет возвращать результаты, ограниченные сайтом AAAI.

Прогноз структурных особенностей белка на основе данных о последовательности на основе энтропии Шеннона и сложности Колмогорова ПЛОС ОДИН 10(4): e0119306.https://doi.org/10.1371/journal.pone.0119306

Академический редактор: Jose M. Sanchez-Ruiz, Universidad de Granada, ИСПАНИЯ

Поступила в редакцию: 22 декабря 2013 г.; Принято: 29 января 2015 г.; Опубликовано: 9 апреля 2015 г.

Copyright: © 2015 Роберт Пол Байуотер. Это статья в открытом доступе, распространяемая в соответствии с лицензией Creative Commons Attribution License, которая разрешает неограниченное использование, распространение и воспроизведение на любом носителе при условии указания автора и источника

Финансирование: Авторы не имеют поддержки или финансирование для отчета.

Конкурирующие интересы: Автор заявил об отсутствии конкурирующих интересов.

Введение

Для выполнения своей миссии белки выполняют множество функций, включая, в первую очередь, необходимость правильного фолдинга. «Правильно сворачиваться» не означает и не должен означать, как на языке большей части литературы по исследованию белков, принятие «нативной структуры», потому что этот термин не только не имеет строгого и общепризнанного определения, но и всегда упоминается. в единственном числе.Вместо этого я буду определять правильно свернутые структуры как «биологически значимые структуры», и для данного белка будет по крайней мере две из них: одна активная, а другая неактивная или в состоянии покоя [1–3]. В общем, активное состояние (А) будет иметь некоторый связанный лиганд «малой молекулы» (ММ) и поэтому часто будет иметь более «закрытую» и компактную структуру, в то время как покоящееся или неактивное состояние (I) часто будет иметь более открытую структуру. . Таким образом, двумя основными функциями белка являются способность складываться в то или иное из этих двух конформационных состояний и переходить из одного состояния в другое.Прогнозы фолдинга белков должны это учитывать. Другие основные функции: потребность в том, чтобы белок попал в правильное место внутри или снаружи клетки, или внутри клеточной мембраны (все они требуют сайтов узнавания на поверхности либо для других белков, либо для нуклеиновых кислот, либо для липидов — указание на требуемое место назначения, во многом похожее на почтовую «адресную этикетку» или «штрих-код»), распознавание и связывание лигандов СМ (субстратов в случае ферментов, агонистов в случае рецепторов), катализа (в случае ферментов), сайты связывания ионов металлов (критические для многих каталитических функций в ферментах и ​​регуляторных функций в рецепторах, связанных с G-белками, например), вторичные сайты связывания SM для кофакторов или аллостерических лигандов.Многие из этих функций зависят от посттрансляционных модификаций, которые, в свою очередь, требуют какого-то сайта узнавания на поверхности, чтобы это произошло. Таким образом, любой данный белок имеет множество функций, и все они закодированы в гене этого белка. Остатки в белковой цепи по отдельности ответственны за эти различные функции белка, но в непересекающейся манере, как своего рода мультиплексная и апериодическая версия секретных кодов σκυτάλη древней Спарты. Было высказано предположение, что для самого фолдинга белка необходимы только несколько ключевых остатков [4-9], и настоящая работа проливает свет на то, где они могут быть расположены в тщательно отобранном репрезентативном наборе белковых структур.Основное внимание здесь уделяется складыванию в указанные биологически значимые структуры и способности переключаться между ними в условиях окружающей среды («окружающая среда» определяется здесь как: соответствующая метаболическому или эндокринологическому статусу клетки и подчиненная любым ограничениям, налагаемым эпигенетическими факторами). императивы). Работа ведется на трех уровнях: вторичные структуры склонностей, трехмерные структуры и переключение между этими структурами. Наконец, рассматриваются контакты между остатками, необходимые для сохранения целостности трехмерных структур.

Меры разнообразия последовательностей

Изменчивость, энтропия Шеннона и колмогоровская сложность

Критическое значение для понимания этой работы имеет понятие изменчивости последовательности в данном положении остатка при множественных выравниваниях последовательностей и соответствующие понятия информационного содержания или сложности в этом сайте. Для последнего здесь используются два альтернативных подхода: энтропия последовательности, определяемая как нормализованная энтропия Шеннона частоты типов остатков, заселяющих данное положение в первичной последовательности [10,11] и введенная здесь впервые в фолдинге белков. исследования, колмогоровская сложность [12] массива типов вычетов в этой позиции.

Изменчивость последовательности и энтропия ранее были описаны и использовались в нескольких глубоких исследованиях структуры и функции белков. Авторы этих исследований [10,11] различают их следующим утверждением: «Энтропия последовательности является мерой информации, присутствующей в выравнивании, тогда как вариабельность последовательности представляет собой мутационную гибкость в этом положении». Другой способ выразить это состоит в том, чтобы заявить: энтропия измеряет то, что требуется в данном месте, изменчивость измеряет то, что можно допустить в этом месте [3].В основополагающих статьях [10,11] было показано, как вариабельность (VAR) и энтропия (ENT) систематически изменяются в зависимости от местоположения в структуре белка. Сайты с самым низким ENT и VAR, как правило, плотно сгруппированы в активных сайтах ферментов или сайтах связывания эндогенных агонистов рецепторов, связанных с G-белком, что согласуется с представлением о том, что эти сайты не допускают введения типов остатков, которые не являются способный сохранить требуемую функцию на этом сайте. Другие положения в белке могут допускать больший приток различных типов остатков в зависимости от того, как они влияют на выполнение назначенной функции для этого сайта, и всегда, конечно, ограничены давлением эволюционного отбора на эту функцию и на соответствующие положения остатков.

Существует больше способов количественной оценки информации, чем, например, энтропия Шеннона. Одним из методов, который все чаще используется в физике, химии, эконометрике [12] и биоинформатике [13,14,15], является понятие колмогоровской сложности (КОЛ). В биоинформатике он в основном использовался в контексте системной биологии и мер подобия без выравнивания [13,14,15], но его использование в области укладки белков, как описано здесь, является новым. Колмогоровская сложность может быть определена [16] как K(x) , наиболее компактное сжатие x , определяемое как K(x) = min|p|:U(p) = x , где U равно универсальная машина Тьюринга.Простая практическая реализация: K(x) = min|p|:L(p) = x , где L — подходящий алгоритм сжатия, такой как bzip2 , широко используемый инструмент для сжатия файлов, который был используется для другой цели в другом месте на страницах этого журнала [12]. В настоящей работе входные данные были получены с помощью программы PredictProtein [17], которая обеспечивает множественное выравнивание последовательностей, в котором каждая строка представляет одну позицию остатка. Каждая полная строка этого множественного выравнивания, охватывающая все ортологи в выравнивании, считывалась в уникальный файл, и файл сжимался с помощью bzip2, как описано в Методах . Размер результирующего файла теперь равен желаемому K(x) для этой строки. Здесь использовался относительный размер (отношение К(х) к х ); эта нормализация была использована для того, чтобы можно было сравнить значения в различных положениях остатков. Полученные оценки сложности KOL использовались в последующих анализах наряду с VAR и ENT.

Первой задачей было выяснить, в какой степени VAR, ENT и KOL коррелируют со вторичной структурой. PredictProtein предоставляет не только множественные выравнивания последовательностей, упомянутые выше, но и вторичную структуру и другую структурную информацию, как экспериментальную, так и предсказанную нейронными сетями, а также значения VAR и ENT, используемые в этой работе.KOL рассчитывали для всего выравнивания в каждой позиции для каждого белка с использованием алгоритма bzip2 , как описано в Methods .

Расположение участков вторичного строения

Алгоритмы прогнозирования вторичной структуры становятся все более изощренными, а последние лучшие «показатели» все еще колеблются на уровне 80% [18]. Однако, как указывалось ранее [3], вероятно, маловероятно, что этот порог когда-либо будет превышен до тех пор, пока нейронные сети не будут отдельно обучены на структурах A и I, поскольку A и I в большинстве случаев будут иметь немного разные образцы вторичной структуры.Этот вопрос планируется рассмотреть в следующей статье, здесь используется единый набор значений вторичной структуры для каждой пары белков, как описано непосредственно ниже и в разделе Methods .

Общепризнано, что смещение кодона

играет роль в оптимизации эффективности трансляции [19]. Вопрос о том, влияет ли использование синонимичных кодонов на 2D- или 3D-структуру белка, до сих пор не решен, но в одном исследовании [20] было установлено, что синонимичные кодоны несут гораздо меньше структурной информации у прокариот, чем у эукариот.Более поздняя работа [21] поддерживает утверждение о том, что «медленные кодоны» склонны накапливаться на границах SSE, хотя и не на границах доменов. Эти исследования противоречат более ранним выводам [22], где не было обнаружено корреляции между расположением редких кодонов и расположением SSE, а скорее было обнаружено сходство кодонов, кодирующих очень распространенные аминокислотные остатки на N- и C-концах спиралей и слоев. . Здесь явно стоит проблема, которая вызвала первый из вопросов, заданных в этой статье: существуют ли сигналы, которые отмечают начало и конец СЭС? Есть два взаимодополняющих способа, априорно , чтобы исследовать это: исследовать последовательности на уровне ДНК, что уже было сделано [19–22], или, как здесь, исследовать, как генетический дрейф повлиял на паттерны аминокислотных последовательностей, которые выжили.Здесь я сообщаю об исследованиях того, в какой степени, если таковые имеются, VAR, ENT и KOL коррелируют с границами SSE.

Результаты можно увидеть на рис. 1 (и рисунках A, D, G, J, M, P, S, V, Y в файле S1), где SSE схематически изображены с использованием модели HST(C) [23] в зависимости от номер остатка. Присвоения HST(C) были выполнены с использованием программы WHAT IF [24], и для целей построения S было присвоено номинальное значение 1, H = 2, спираль 3 10 (не член исходной модели HST, но включенная в версии ЧТО ЕСЛИ) = 3, T = 4 и C = 5).Чтобы упростить идентификацию «концов SSE», данные HST были преобразованы в новый набор данных HST (D) (что означает «дифференцированный HST»). Это приняло форму присвоения новых значений начальным и конечным остаткам отрезков S и H: 0 для S и 0,5 для H. Таким образом, графики теперь опускаются ниже графиков HST на этих остатках, образуя легко идентифицируемые «антишипы» ( «анти», потому что более низкие значения связаны с большей сохранностью). Можно сделать следующие общие замечания:

  • На концах SSE явно преобладают низкозначные сигналы KOL (также VAR, ENT, не показаны на рисунках), что подтверждает необходимость высокой степени сохранения.
  • Эту тенденцию легче выявить на рис. 1 и рисунках A, D, G, J, M, P, S, V, Y в файле S1, где «антипики» HST(D) показаны рядом с HST. оригиналы.
  • В пределах SSE значения KOL обычно ниже (также VAR, ENT, не показано на рисунке), что также означает большую сохранность.
  • Области поворота обычно отмечены гораздо более высокими значениями KOL (то же самое для VAR, ENT, не показано на рисунке), а области катушки отмечены еще более высокими пиками.
  • Небольшое исключение из приведенного выше можно увидеть на рисунках J, K и L в файле S1.Концы выбраны не очень хорошо, но SSE есть. Этот белок очень неупорядочен на N-конце (поскольку он связывается с ДНК, которой не было в кристаллической структуре), и KOL предсказывает это расстройство (точнее, то, что беспорядок будет, если ДНК отсутствует). Это обсуждается ниже.

Рис. 1. Данные для белков: 2auha и 2b4sb.

По оси абсцисс отложен номер остатка в первичной последовательности, а по оси ординат — оценка различных параметров KOL, HST(D) и AREA.Они определены в тексте и обозначены ключом в правом верхнем углу каждого рисунка.

https://doi.org/10.1371/journal.pone.0119306.g001

Хотя эти корреляции четко видны, нет простого способа количественно измерить эту корреляцию, поскольку вторичная структура не может быть выражена в простых скалярных терминах.

Но есть параметр, который можно использовать для определения основных вариаций геометрии скелета вдоль полипептидной цепи.Соседние атомы СА всегда находятся на постоянном расстоянии 3,81 Å друг от друга, но расстояния между i th и (i+2) th атомами СА не являются постоянными, а тесным образом зависят от геометрии основной цепи ( двугранные углы ϕ и ψ). Влияние вторичной структуры усиливается при образовании треугольника между i th и (i+2) th КА-атомами и глобальным центром тяжести (ЦТ) белка, как это было показано ранее [25].Эта область действует как заместитель для SSE и имеет дополнительное преимущество, заключающееся в том, что ее можно рассматривать как переменную вдоль полипептидной цепи, а не просто как классификатор. Площади треугольников нанесены на график в зависимости от остаточного числа. Алгоритм, используемый для выполнения этих расчетов, приведен в Приложении, которое предоставляется в качестве вспомогательной информации в файле S1. Результаты представлены на рис. 1 для рецептора инсулина (и на рисунках A, D, G, J, M, P, S, V, Y в файле S1 для других белков). Площади этих треугольников вдоль белковой цепи очень чувствительны к вторичной структуре.Опять же, VAR, ENT и KOL предвосхищают поведение треугольных областей с высокой точностью: небольшие области (низкие значения по ординате) коррелируют с компактными SSE, такими как спирали, большие области с областями поворота и катушки. Кривая площади следует «меандру», который синхронизирован со значениями KOL (VAR и ENT не показаны, но последние два похожи). Соответствующие коэффициенты корреляции для VAR, ENT и KOL с площадями треугольников («AREA») перечислены в таблице 1. Примечание: имеется небольшое смещение или смещение вправо, поскольку AREA вычисляется для остатков i и i+2 для каждого i ( это приведет к тому, что корреляции будут выглядеть «слабее»).

Вывод из этих двух исследований заключается в том, что VAR, ENT и KOL коррелируют с паттернами SSE и геометрией позвоночника, что предлагает способы их использования для прогнозирования вторичных структур. Использование KOL, в частности, на уровне ДНК, несомненно, представляет интерес, и эта работа уже начата.

Прогноз трехмерных структур

Переходя к рассмотрению трехмерной структуры, аналогичное поведение наблюдается для KOL (аналогично для VAR и ENT, но не показано графически) в синхронии с доступностью растворителя (рассчитанной из координат кристаллической структуры с использованием WHAT IF) и B-значениями (экспериментальные ) для этих белков.Они (OACA/OACI и BVLA/BVLI соответственно) нанесены отдельно для структур A и I на рис. 2 для рецептора инсулина (и рис. B, E, H, K, N, Q, T, W, Z в файле S1). для других белков) с OACA/OACI, обозначающими доступность для A и I соответственно, и BVLA/BVLI аналогично для значений B. Более высокие значения B возникают, что не является неожиданным, когда и изменчивость, и энтропия выше, но то же самое верно и для доступности, отражая представление о том, что поверхностные остатки более подвижны с меньшим количеством внутримолекулярных контактов и, следовательно, легче мутируют, чем остатки в хорошо упакованном ядре. .Насколько такие корреляции могут быть использованы для прогнозирования структуры, еще предстоит исследовать, но вместе с прогнозами контактов, обсуждаемыми ниже, есть все основания для включения этих данных в работу по прогнозированию. Члены пар OACA/OACI и BVLA/BVLI коррелируют с KOL, но немного по-разному. Опять же, это требует более глубокого исследования.

Рис. 2. Данные для белков: 2auha и 2b4sb.

По оси абсцисс отложен номер остатка в первичной последовательности, а по оси ординат — оценка различных параметров KOL, OACA, OACI, BVLA и BVLI.Они определены в тексте и обозначены ключом в правом верхнем углу каждого рисунка.

https://doi.org/10.1371/journal.pone.0119306.g002

Предыдущие цифры четко указывали на то, что существуют различия в том, как структуры A и I запрограммированы генетической последовательностью, поэтому казалось уместным спросить не только в какой степени существовала какая-либо корреляция между доступностью и B-значениями для этих структур, но и в какой степени на само различие влияли геномные данные.При рассмотрении различий обнаруживается четкая корреляция не только между различиями доступности (OACC = abs(OACA—OACI)) и B-значениями (BVLC = abs(BVLA—BVLI)), но также и с относительными атомными смещениями в Å между родственные атомы CA в структурах A и I (DISP). Они показаны на рис. 3 для рецептора инсулина (и рисунки C, F, I, L, O, R, U, X, Ø в файле S1 для других белков). Наличие корреляции между этими различиями объясняет, почему попытки определить линейные корреляции между VAR, ENT и KOL и различными параметрами структуры белка не всегда давали четкую картину (табл. 1).Очевидно (из графика) существует значительная корреляция, но, поскольку мы имеем дело с многомерной системой, отдельные парные корреляции обязательно будут ниже. Важно отметить, что значения DISP представляют собой разницу между 3D-координатами для двух родственных структур, поэтому их корреляции с VAR, ENT или KOL также могут быть и иногда являются антикорреляциями. Критерием, по которому следует судить об этих сравнениях, является темп, если использовать музыкальную аналогию, изменений вдоль оси последовательности, а не смысл смещения (другими словами, абсолютная величина).

Рис. 3. Данные для белков: 2auha и 2b4sb.

По оси абсцисс отложен номер остатка в первичной последовательности, а по оси ординат — количество баллов для различных параметров KOL, DISP, OACC и BVLC. Они определены в тексте и указаны в ключе в правом верхнем углу каждого рисунка.

https://doi.org/10.1371/journal.pone.0119306.g003

Корреляционные данные для двух предыдущих исследований можно найти графически на рис. 4 (для пары белков 2auha и 2b4sb) и в табличной форме для всех пары белков в таблице 1.

Рис. 4. Корреляционные диаграммы из программы R, показывающие корреляции между переменными для пары белков 2auha и 2b4sb.

Соответствующие цифры для других членов набора можно получить у автора. На рис. 4А показаны корреляции между VAR, ENT, KOL и AREA (на диаграмме обозначены как qarea). На рис. 4B показаны корреляции между VAR, ENT, KOL и другими переменными, отмеченными метками.

https://doi.org/10.1371/journal.pone.0119306.g004

Последний набор исследований был больше сосредоточен на трехмерном предсказании кратности как таковом.Для целей данной работы, в соответствии с установившейся практикой, как и в ранее опубликованных исследованиях с использованием подхода коррелированных мутаций [26–32], было сочтено адекватным вычисление 2-мерных карт контактов, в которых прогнозы, полученные с помощью VAR/ENT или KOL можно сравнить с экспериментально определенной картой контактов пар остатков. В принципе, трехмерную структуру белка всегда можно реконструировать по таким картам контактов с помощью дистанционной геометрии [33–35], и в этом случае имеется значительная дополнительная информация (в частности, предсказания вторичной структуры и доступности), которая добавила бы дополнительную информацию. уверенность в результатах попыток расчета трехмерной структуры (запланированное дальнейшее расширение этой работы).В целях сравнения карты контактов в любом случае представляют значительную ценность, поскольку они инвариантны по отношению к тому, как 3D-координаты встраиваются в 3D-пространство. Расчеты VAR и ENT были выполнены путем ограничения значений VAR, ENT таким образом, чтобы они находились в пределах «поля 1:2», идентифицированного [10,11] как область, которая наиболее сильно соответствует остаткам сохранения складки, т. е. остаткам в подмножество непересекающегося множества всех упомянутых выше остатков. Примененный фильтр ограничивал значение VAR значением от 0.5 и 1,5, а ENT между 50 и 60. Для случая KOL, KOL был построен против самого себя, и был применен фильтр (значения по умолчанию) 1,5 (нижняя граница) и 3,5 (верхняя граница).

Результаты представлены в графическом виде только для одного случая (для рецептора инсулина, рис. 5) в качестве примера, поскольку данные более полно и строго представлены количественно, в табличной форме (табл. 2), где число истинных положительные (TP), ложноположительные (FP), ложноотрицательные (FN) и истинно отрицательные (TN) даны для всех 20 белков вместе с соответствующими коэффициентами корреляции Мэтью (MCC), определенными [36,37] как

Что наиболее заметно, так это то, что KOL работает намного лучше, чем VAR/ENT для каждого отдельного белка в списке.Паттерн, отображаемый «контактами», предсказанный KOL, кажется, лучше отражает экспериментальную структуру, чем VAR/ENT, например, массив совпадений вдоль верхней горизонтальной оси, которые полностью отсутствуют в VAR/ENT. В частности, для трехмерного прогнозирования KOL становится предпочтительным методом.

Заключительные замечания

Уже из прочтения представленных здесь данных становится очевидным, что VAR, ENT и особенно KOL обнаруживают важные особенности, связанные со структурой, функцией и динамикой белка.В частности, это начало и конец SSE, сами SSE, ключевые сайты для динамического переключения между состояниями белка и все остальные, которые необходимо идентифицировать и отделить от лежащих в их основе данных о последовательности. VAR, ENT и KOL получены только из геномных данных, но они предвосхищают многие свойства этих белков. Теперь у вас есть прочная основа для перехода от предвидения к предсказанию. Используемый здесь метод является новым, и он раскрывает больше, чем просто путь к «сворачиванию белков», учитывая, что большинство белков складываются более чем в одну структуру [1-3].Двойственность этих путей сворачивания выявляется KOL (а также VAR и ENT).

Есть много случаев, когда белки частично или даже в основном «неструктурированы» [38], но KOL может справиться даже с этим. Например, кажущееся странным поведение первых 40 остатков гистоновых белков (показанных на рисунках J, K и L в файле S1) безошибочно предсказано Колмогоровым и может быть объяснено, если понять, что эта кажущаяся «неструктурированной» часть белка участвует в установлении контактов с ДНК в хромосоме, но в кристалле ДНК отсутствует.Таким образом, можно предсказать даже «неструктурированность».

Что касается выбора метода, VAR и ENT или KOL: последний явно лучше подходит для 3D-прогнозирования (данные карты контактов приведены в таблице 2). Статистика по другим параметрам структуры несколько различается, в одних случаях KOL превосходит VAR/ENT, а в других наоборот (табл. 1). Слишком пристальное внимание к этим корреляциям может ввести в заблуждение, поскольку нет уверенности в том, что эти корреляции действительно линейны. Анализ корреляционных диаграмм ( рис. 4 ) показывает, что данные KOL во всех случаях гораздо менее зашумлены, с меньшим количеством выбросов, чем VAR и ENT.Это может указывать на большую точность, присущую данным KOL, независимо от значения корреляции.

Что касается вопроса о «значении корреляции», из таблицы 1, конечно же, видно, что коэффициенты корреляции кажутся «низкими» по сравнению с некоторыми современными достижениями в этой области [39]. Но важно знать, что коэффициенты корреляции в таких многомерных системах, как эта, никогда не достигнут уровней, которые имеют место при статистических расчетах корреляций между отдельными парами переменных, как в [39].Ни VAR, ни ENT, ни KOL нельзя назвать «индивидуальными» в этом смысле. Все дело в том, что они нуждаются и начинают разделяться, чтобы можно было установить их отношение к различным интересующим нас структурным параметрам. VAR, ENT или KOL получены исключительно из эволюционной информации, и эволюция, по своему собственному определению, имеет задачу удовлетворения всех этих «структурных параметров». Теперь задача состоит в том, чтобы распутать эту информацию («разделить», если использовать правильный математический глагол), чтобы мы могли начать предсказывать отдельные параметры только на основе данных генома.Это равносильно криптографической проблеме — см. Приложение в качестве вспомогательной информации.

В недавнем обзоре [19] говорится, что прогресс в интеграции геномной и протеомной информации имеет важное значение. В этой статье было намерение попытаться сделать успехи такого рода, и прогресс в этом направлении был достигнут, как ясно показано на рисунках. В представленных здесь данных содержится огромное количество информации, которую можно использовать в дальнейшем при разработке алгоритмов прогнозирования, и метод может быть применен практически к любому семейству белков, где доступны точные множественные выравнивания последовательностей достаточного размера.Ведется работа над несколькими такими семействами, включая рецепторы, связанные с G-белком, и семейство цитохрома Р450. Предварительные результаты показывают, что эти крупные белки работают лучше, чем более мелкие белки при таком типе анализа. Это контрастирует со всеми другими известными методами сворачивания белков, при которых можно работать с небольшими белками, но нельзя с большими. Ожидается, что «ожидания», которые раскрываются в этих данных, приведут к убедительным и полезным предсказаниям. В недавних публикациях упоминается все более широко распространенное мнение о том, что проблема фолдинга белков более или менее «решена» [31,32].В этом есть доля правды, но ее недостаточно. Начнем с того, что проблема «более чем одной структуры на белок» до сих пор не была должным образом решена (эта статья), хотя она кратко упоминалась [32], а основы хорошо документированы в базе данных DynDom [1, 3]. Методы, которые совершенствуются по мере изучения больших белковых доменов, всегда будут полезны. Наконец, новое понимание часто достигается, когда новая методология внедряется и успешно применяется.

Методы

Основным требованием для всей работы такого рода является неизбыточный набор кристаллических структур высокого разрешения.Особым требованием для данной работы было наличие пар кристаллических структур с конформациями, связанными механизмом переключения, упомянутым выше и определяемым, например, программой Dyndom [1], определяющей доменные границы и шарнирные области (http:// fizz.cmp.uea.ac.uk/dyndom/). Такой набор с высоким разрешением (R < 2,0 Å) и низкими значениями B (< 50,0) и с идентичностью последовательностей между парами 95% или выше был извлечен из базы данных Dyndom из более раннего и довольно другого исследования [3].В него вошли 20 пар, отвечающих вышеуказанным критериям. Для этой работы было применено дополнительное ограничение, а именно 100% идентичность последовательностей между членами пары. Использовались следующие пары белков (четырехбуквенный идентификатор PDB с добавленным идентификатором цепи): 2auha/2b4sb, 1ybia/1ybib, 1ye3a/1n8ka, 1ulka/1ulkb, 1kx5e/1kx5a, 5tim_/1tpda, 1ftja/1fw0a, 1ewka/1ewkb, 1bpya/1bpxa и 1xckn/1aong. Данные для первой пары (рецептор инсулина) показаны в печатной версии документа, а остальные можно найти в файле вспомогательной информации S1.

Программа WHAT IF [24] использовалась для моделирования белков и определения вторичной структуры (HST), доступности и площади поверхности. В этой статье использовались значения HST только для одного из членов каждой пары белков, чтобы не загромождать рисунки. (Два набора значений HST в любом случае довольно близки, хотя и различны, и специальное исследование этих попарных различий планируется для отдельной публикации.)

Программа PredictProtein [17] использовалась для получения множественных выравниваний последовательностей и предсказаний вторичной структуры, доступности поверхности и кристаллографических значений B.Кроме того, эта программа создает данные VAR и ENT, их можно легко извлечь из текстовой версии выходных данных. Это было сделано с использованием набора шелл-скриптов awk, linux и подпрограмм на фортране, написанных для этой цели. Получение данных KOL немного сложнее. Чтобы учесть многие тысячи ортологов в заданном выравнивании, PredictProtein разбивает их на блоки шириной 70 выровненных последовательностей с порядковым номером, VAR и ENT и другими данными, представленными в вертикальных столбцах (т.е. вдоль «оси последовательности»). Чтобы вычислить KOL, необходим полный набор данных выровненного остатка в каждой позиции последовательности, то есть для всех ортологов, чтобы можно было восстановить полный набор данных выравнивания для каждой позиции. Это приводит к необходимости развернуть выравнивание для каждой позиции, что должно быть сделано полувручную (комбинация awkscripts и «вырезать и вставить»). Затем выравнивание по каждому положению остатка было записано в уникальный файл, который был сжат с использованием bzip2 , что обеспечило показатель сжимаемости (сложность по Колмогорову), как определено выше для каждого положения остатка.

Статистический пакет R [40] использовался для статистических расчетов и для построения рис. 4.

.

Ответить

Ваш адрес email не будет опубликован.