+7 (495) 720-06-54
Пн-пт: с 9:00 до 21:00, сб-вс: 10:00-18:00
Мы принимаем он-лайн заказы 24 часа*
 

Ауц s7: Учебный центр Part-147 – S7 Technics

0

Учебный центр Part-147 – S7 Technics

Индустрия технического обслуживания воздушных судов – это постоянно развивающаяся отрасль, с динамичными технологиями и постоянной тягой к оптимизации и улучшению. Именно поэтому, вопрос постоянного профессионального роста и совершенствования знаний инженерно-технического персонала всегда актуален.

Авиационный учебный центр S7 Technics – это место, где можно усовершенствовать свои технические навыки и получить новые знания.

Преподаватели авиационного учебного центра готовы повысить квалификацию Ваших технических специалистов по обслуживанию Airbus A320 Family всех модификаций, Boeing 737 CL&NG, RRJ-95, EMBRAER-170 series,а также расширить знания авиационного и бизнес английского.

Квалификационные отметки:

Типы ВС:

  • Airbus A319/A320neo/A321
  • Boeing 737-300/400/500/600/700/800/900
  • Boeing 737 MAX
  • Sukhoi RRJ-95
  • Embraer ERJ-170 Series

Спец. курсы:

  • Бизнес-английский
  • Технический английский
  • Специализированные курсы по ТОиР компонентов ВС

Методика обучения в авиационном учебном центре S7 Technics основана на сочетании классических методов и современных международных методик, что приносит легкую усвояемость новых знаний.

Помимо образовательных услуг, эксперты центра готовы провести консультации по проблемам человеческого фактора в техническом обслуживании и вопросах авиационного законодательства и других специализированных курсов.

Учебный центр S7 Technics имеет сертификаты Европейских (EASA PART-147), Российских (ФАП-289) авиационных властей и Лицензию Министерства образования и науки РФ на обучение, повышение квалификации и переподготовку ИТП.

Авиационный Учебный Центр объявляет о наборе внештатных инструкторов.
В их обязанности будет входить:
– проведение курсов по обучению на тип воздушного судна (Type Training),
– практическое обучение на тип (Type Training),
– проведение дополнительных курсов по PART-145.

Информацию о себе можно отправлять на электронный адрес: [email protected] или напрямую обращаться в кабинет №220 (БЦ “Воламир”, мкр. Авиационный, ул. Ильюшина 2A).

Будем рады видеть Вас в нашем Центре!

Контакты авиационного учебного центра S7 Technics:
Телефон: +7 (495) 363 2767
E-mail: [email protected]

Московская база S7 Technics готова к обслуживанию новейших Boeing 737 MAX

Провайдер услуг по техническому обслуживанию (ТО) авиатехники — S7 Technics подготовил свою производственную базу в московском аэропорту Домодедово для технического обслужи-вания самолетов нового поколения — Boeing 737 MAX.

Производственная база S7 Technics в Домодедово допущена Европейским агентством по без-опасности авиаперевозок (EASA) к проведению ТО самолетов Boeing 737-7/8/9 MAX с двигате-лями LEAP-1B (производитель CFM International) в рамках собственного сертификата EASA Part 145 с конца ноября 2018 года.

15 специалистов московской площадки готовы к работе с самыми современными узкофюзеляж-ными самолетами производства Boeing, прошли необходимую подготовку и обладают квалифи-кацией для выполнения форм линейного и базового ТО (на данный момент не включая C-check).

Теоретическое обучение специалисты прошли на базе авиационного учебного центра (АУЦ) S7 Technics, а практическую стажировку — на базе завода Boeing в городе Сиэтле, США. АУЦ расширил собственный сертификат EASA Part 147 для подготовки специалистов на Boeing 737 MAX в феврале 2018 года. Первая группа специалистов категорий B1+B2 прошла обучение весной.

На фоне роста спроса на подготовку персонала для техобслуживания самолетов иностранного производства площади АУЦ S7 Technics во второй половине 2018 года были расширены. Те-перь кроме классов в ангарном комплексе аэропорта Домодедово и трех помещений на базе компании S7 Training (городской округ Домодедово, село Битягово, 10 км от аэропорта Домоде-дово) у авиационного учебного центра появились четыре дополнительных класса и офисных помещения в деловом центре «Воламир» (4 км от аэропорта Домодедово). Кроме того, АУЦ S7 Technics проводит обучение специалистов на выезде — например, недавно курсы по программе Boeing 737 MAX прошли в Уфе.

«Создание нашего центра десять лет назад позволило обеспечивать подготовку кадров, в первую очередь холдинга S7 Technics, на европейском уровне, а также сократить расходы на обучение персонала в зарубежных учебных заведениях. Мы активно помогаем готовить техни-ческих специалистов для многих российских провайдеров и авиакомпаний, при этом покрывая собственные потребности холдинга в подготовке высококвалифицированного персонала», — прокомментировал директор АУЦ S7 Technics Игорь Ивановский.

По прогнозам специалистов S7 Technics, через пять-семь лет в парках российских авиакомпа-ний будет около 100 самолетов Boeing 737 MAX, поэтому рынок техобслуживания воздушных судов этого типа будет расти.

«Воздушные суда Boeing 737 MAX наряду с Airbus A320neo будут постепенно заменять узкофю-зеляжные самолеты предыдущего поколения. Если сегодня в России, как и во всем мире, более половины рынка технического обслуживания составляют услуги для Boeing 737NG и Airbus A320ceo, то к 2029 году эту нишу займут MAX и neo. Другими словами, рынок технического об-служивания Boeing 737 MAX видится нам перспективным, — отметил Игорь Паньшин, замести-тель генерального директора S7 Technics по планированию и продажам. — Мы уже предлагаем поддержку эксплуатантам Boeing 737 MAX в части оперативного техобслуживания на наших линейных станциях. К работе с данным типом авиатехники наши специалисты подготовлены, поэтому растущий спрос на техобслуживание Boeing 737 MAX мы будем готовы удовлетво-рить».

Ранее к работе с Boeing 737 MAX приступили специалисты новосибирского провайдера Сибирь Техник (также входит в Холдинг S7 Technics и базируется в аэропорту Толмачево). Таким обра-зом, операторы Boeing 737 MAX могут обслужить свои самолеты на площадках S7 Technics как в Сибири, так и Европейской России.

Холдинг S7 Technics — ведущий провайдер ТО на российском рынке; выполняет работы по базовому и оперативному техническому обслуживанию ВС производства Boeing, Airbus, Em-braer и ГСС, по ремонту, инжинирингу и производству компонентов для ряда основных типов ВС, а также работы по ремонту авиационных двигателей CFM56.

В состав Холдинга входят компании-провайдеры ТО — ООО «С 7 ИНЖИНИРИНГ» и ООО «Сибирь Техник», обслуживающие ВС в аэропортах Москвы (DME), Новосибирска (OVB) и Минеральных Вод (MRV), а также на нескольких линейных станциях в России. Производ-ственные базы Холдинга S7 Technics сертифицированы согласно требованиям EASA, авиа-ционных властей Бермуд, России и ряда других стран на выполнение ТО воздушных судов Boeing, Airbus, Sukhoi Superjet 100, Embraer и Cessna.

Перечень работ, выполняемых компанией, включает периодические формы ТО (D-сheck включительно), линейное обслуживание, структурные ремонты, инжиниринг (в т. ч. разработку модификаций в соответствии с требованиями EASA Part 21J и производство элементов интерьера в соответствии с требованиями EASA Part 21G).

Также Холдинг выполняет ремонт компонентов, покраску ВС и обучение персонала (в соответствии с требованиями EASA Part 147 и ФАП-289). Компания нацелена на постоянное развитие своих продуктов, в том числе через кооперацию с производителями оборудования (OEM).

Холдинг S7 Technics обслуживает авиакомпании России (группа компаний S7, группа «Аэрофлот», «ЮТэйр», «Уральские авиалинии» и др.), стран Европы, Азии и Ближнего Востока, выполняя для своих клиентов более 100 тяжелых базовых форм ТО и свыше 1000 легких базо-вых форм ТО ежегодно.

Для получения дополнительной информации о Холдинге и его услугах приглашаем посетить сайт www.s7technics.ru

Пресс-служба «S7 Technics»

Как доехать до аэропорт Домодедово, Центр деловой авиации в Домодедово на автобусе, поезде, метро или маршрутке?

Общественный транспорт до аэропорт Домодедово, Центр деловой авиации в Домодедово

Не знаете, как доехать до аэропорт Домодедово, Центр деловой авиации в Домодедово, Россия? Moovit поможет вам найти лучший способ добраться до аэропорт Домодедово, Центр деловой авиации от ближайшей остановки общественного транспорта, используя пошаговые инструкции.

Moovit предлагает бесплатные карты и навигацию в режиме реального времени, чтобы помочь вам сориентироваться в городе. Открывайте расписания, поездки, часы работы, и узнайте, сколько займет дорога до аэропорт Домодедово, Центр деловой авиации с учетом данных Реального Времени.

Ищете остановку или станцию около аэропорт Домодедово, Центр деловой авиации? Проверьте список ближайших остановок к пункту назначения: Аэропорт Домодедово; Гостиница; Космос.

Вы можете доехать до аэропорт Домодедово, Центр деловой авиации на автобусе, поезде, метро или маршрутке. У этих линий и маршрутов есть остановки поблизости: (Автобус) 308 (Поезд) АЭРОПОРТ ДОМОДЕДОВО — МОСКВА ПАВЕЛЕЦКАЯ (DOMODEDOVO AIRPORT — PAVELETSKY STATION), ПАВЕЛЕЦКОЕ НАПРАВЛЕНИЕ

Хотите проверить, нет ли другого пути, который поможет вам добраться быстрее? Moovit помогает найти альтернативные варианты маршрутов и времени. Получите инструкции, как легко доехать до или от аэропорт Домодедово, Центр деловой авиации с помощью приложения или сайте Moovit.

С нами добраться до аэропорт Домодедово, Центр деловой авиации проще простого, именно поэтому более 930 млн. пользователей доверяют Moovit как лучшему транспортному приложению. Включая жителей Домодедово! Не нужно устанавливать отдельное приложение для автобуса и отдельное приложение для метро, Moovit — ваше универсальное транспортное приложение, которое поможет вам найти самые обновленные расписания автобусов и метро.

Май. Хорошая погода. S7 Training Centre (тренажеры)

Мы уже рассказывали не раз про тренажеры , на которых тренируются пилоты S7. Свежий репортаж из учебного центра в Подмосковье — от лица самого пилота-инструктора Boeing 737.

Всем привет!

Забросил я свой ЖЖ. Вроде и мыслей много, да лень что-то излагать. Работы тоже много, правда, хотелось бы полетов побольше, а явок в «офис» поменьше. Значительная радость — наконец-то я занимаюсь значимым делом (и любимым) — вводом в КВС весьма толкового парня. 24 года. Изумительная техника пилотирования и завидное старание. (ттт) Умница! Когда-то в 27 я был самым молодым КВС в компании, с тех пор рекорд был побит неоднократно 🙂 Я только «за» — за талантливую, незашоренную молодежь.

Ну а между полетами, в один прекрасный денек довелось мне побывать в нашем учебном центре,проводил тренажерную сессию. Кто не в теме — АУЦ «С7 Тренинг» расположен недалеко от г.Домодедово, в достаточной дали от города и в локальной близости лесного массива, что не может не сказаться на экологии и, как следствие — настроение. Сейчас, весной, лесные и цветочные ароматы кружат голову, а яркое солнце и синее небо добавляют хорошего настроения!

Ну чем не Шишкин «Лес»?:)

Когда-то давно, в 2004м, когда я впервые побывал здесь (эстафетным рейсом из Барнаула), впечатление было весьма тягостным — сначала ждали час разбитый ПАЗик, который пару раз глох, пытаясь нас доставить из аэропорта в АУЦ (по совместительству еще и гостиничный комплекс), столовая могла быть образцом фольклорного советского общепита, со всеми его прелестями. Тогда не думалось, что в этом живописном месте появятся тренажерные комплексы Боингов и Аэробусов (вкупе с тренажерами по аварийно-спасательной подготовке), а сам АУЦ выйдет в лидеры «этой страны». Точнее, не то, что «не думалось». Даже не представлялось.

Прошло несколько лет, пазики сменились «фордами», появились «автобусы-крейсеры», перевозящие пассажиров с задержанных рейсов (норильчанам привет), столовая теперь стала реальным местом, где можно не просто поесть и не отравиться, но и наесться «до пуза» разнообразным меню.

В наличие тренажеры В737СL, NG, А320 (2 штуки), Ан-148, процедурные тренажеры этих ВС, оборудованные классы (никогда не простаивающие). Реально, есть чем гордиться — особенно, если знать, как это было в начале.

В тот день приехал пораньше, прогулялся — увидел, что построили футбольное поле с искусственной травой (С7 любит футбол)

Коты все такие же рядовые местные жители (на довольствии, видимо), как и 9 лет назад

Ну и центральное здание, в котором расположены тренажеры В737, Ан148 и один А320. Плюс учебные классы.

Ну что ж, привет, обучаемые. Сегодня у нас первая сессия по подготовке очередного КВС. Парень когда-то работал у нас (начинал вторым в одном время (!) со мной), затем судьба покидала его по разным авиакомпаниям и вот, круг замкнулся. Брифинг. Рассказываю, чем будем заниматься, вносим ясность в то, как должен работать КВС, как происходит подготовка ВС к полету, повторяем стандартные процедуры. Час пролетел в бодром темпе. Через 10 минут в тренажер… Что ж, есть время повредить своему здоровью (попить кофе/покурить — кому что)… Вперед!

Краткий инструктаж на тему аварийного покидания тренажера, и поехали тренировать рутинные процедуры. Сейчас в компании (наконец-то) программа ввода в КВС на тренажере составляет 5 сессий (!), когда-то я достаточно упорно это предлагал. Двух сессий (как это принято в большинстве компаний) — реально мало. Тем более, что эти две сессии носят характер «мочилова», или как сегодня выразился мой коллега, «бенчмарка» — отказ за отказом и ни о каком комфортном, постепенном переходе справа налево речи не идет.

Ну а у нас до «мочилова» есть три сессии. Наша первая, поэтому мы полноценно выполняем предполетные проверки, подготовки, процедуры, включая проверку связи в салон и брифинг с проводницей (это я сегодня — как и диспетчер, как и наземный персонал). Ну а после всего этого ребятам предстоит в удовольствие поманеврировать в районе виртуального Картино, с кренами 30/45/60, выполнить выводы из сложных пространственных положений, вывод из сваливания и визуальный заход. После этого — тренировка заходов по ИЛС без использования автопилота, FD и автомата тяги при боковом ветре. Задача обучаемого — освоиться в левом кресле (а это бывает не всегда просто — видеть кабину с другой стороны), почувствовать самолет «левой рукой». Не каждый второй пилот в первых полетах демонстрирует хорошие показатели. Особенно сложно — подгонять кресло и управлять МСР. Руки путаются 🙂

Кто-то хотел посмотреть фотографии тренажерных полетов? Их есть у меня 🙂

Пульт инструктора (старенький, с Ан-148 не сравнить 🙂 )

Буксировка хвостом вперед (с 10 мая — «выталкивание»). Там реально есть буксир — но его на фото не видно

Предварительный ВПП 32Л

Исполнительный

Маневрирование

Всем спасибо! 🙂

Fly Safe!

Объём работ S7 Technics в 2018 году вырос на 7% » Авиация России

Провайдер услуг по техническому обслуживанию авиатехники S7 Technics фиксирует рост объема работ на своих базах и повышение спроса на ТО в регионе Россия и СНГ, сообщает пресс-служба компании. По итогам прошлого года технические специалисты подразделения выработали 2,153 млн нормо-часов, что на 7,7 % выше показателей предыдущего года.

S7 Technics выполнила 83 тяжелые формы технического обслуживания самолетов, из которых 32 (почти 40%) пришлись на долю тяжелых форм периодического ТО и передаточные формы ТО, сопряженные с большим объемом работ. Увеличение спроса на выполнение тяжелых и передаточных форм на базах S7 Technics отражает тенденции авиационного рынка, связанные с пиком поставок ВС в Россию после 2008 года. Рост спроса сохраняется, на базах провайдера продолжаются работы по проектам возврата ВС для двух ведущих мировых лизингодателей, которые должны завершиться в 2019 году.

На трех производственных базах S7 Technics в аэропортах Домодедово (Москва), Минеральные Воды и Толмачево (Новосибирск) в 2018 году было обслужено 28,6 тыс. компонентов (рост на 27 %), выработано 97,6 тыс. нормо-часов (рост на 34 %).

В 2018 году новые возможности появились у слушателей авиационно-учебного центра (АУЦ) S7 Technics. Главным достижением для команды АУЦ стало освоение нового типа авиатехники для гражданской авиации России – самолетов Boeing 737 MAX с двигателями CFM LEAP-1B. Для этого инструкторы АУЦ прошли обучение в учебном центре американского авиапроизводителя в Сиэтле. В итоге AУЦ S7 Technics допустили к теоретическому и практическому обучению на новый тип ВС – первый в России курс теоретической подготовки на Boeing 737 MAX уже проведен.

Была также увеличена площадь авиационного учебного центра S7 Technics, а количество его сотрудников возросло до 16 специалистов. В прошлом году центр, обладающий собственным сертификатом EASA Part 147, успешно прошел плановые проверки и аудиты со стороны европейский авиационных властей.

S7 Technics продолжает внедрять в производственную деятельность инструменты бережливого производства (Lean Production). С привлечением внешних консультантов в компании сформирован учебный курс первичной подготовки Lean Basic. В ходе его проведения, более половины персонала S7 Technics прослушали около 90 тренингов.

Также в аэропорту Домодедово для сокращения временных затрат при проведении линейного технического обслуживания реализован проект Kit Car. Несколько автомобилей, переоборудованные в мобильный склад, оперативно доставляют к местам стоянки самолетов запасные части, расходные материалы, инструменты и оборудование.

Среди основных задач S7 Technics на текущий год – завершение внедрения информационной системы AMOS, расширение сотрудничества с лизинговыми компаниями и дальнейшее совершенствование клиентских сервисов.

Холдинг S7 Technics — ведущий провайдер ТО на российском рынке; выполняет работы по базовому и оперативному техническому обслуживанию ВС производства Boeing, Airbus, Embraer и ГСС по ремонту, инжинирингу и производству компонентов для ряда основных типов ВС, а также работы по ремонту авиационных двигателей CFM56.

В состав Холдинга входят компании-провайдеры ТО — ООО «С 7 ИНЖИНИРИНГ» и ООО «Сибирь Техник», обслуживающие ВС в аэропортах Москвы (DME), Новосибирска (OVB) и Минеральных Вод (MRV), а также на нескольких линейных станциях в России. Производственные базы Холдинга S7 Technics сертифицированы согласно требованиям EASA, авиационных властей Бермуд, России и ряда других стран на выполнение ТО воздушных судов Boeing, Airbus, Sukhoi Superjet 100, Embraer и Cessna.

Перечень работ, выполняемых компанией, включает периодические формы ТО (D-сheck включительно), линейное обслуживание, структурные ремонты, инжиниринг (в т. ч. разработку модификаций в соответствии с требованиями EASA Part 21J и производство элементов интерьера в соответствии с требованиями EASA Part 21G).

База S7 Technics в Москве (DME) стала первой базой по техническому обслуживанию самолетов в РФ и СНГ, сертифицированной в соответствии с требованиями новой версии международного стандарта EN 9110:2016.

Также Холдинг выполняет ремонт компонентов, покраску ВС и обучение персонала (в cоответствии с требованиями EASA Part 147 и ФАП-289). Компания нацелена на постоянное развитие своих продуктов, в том числе через кооперацию с производителями оборудования (OEM).

Холдинг S7 Technics обслуживает авиакомпании России (группа компаний S7, группа «Аэрофлот», «Россия» и др.), стран Европы, Азии и Ближнего Востока, выполняя для своих клиентов порядка 100 тяжелых форм ТО и свыше 1000 легких форм ТО ежегодно.

Загрузка…

Авиационный учебный центр «Пермских моторов» подтверждает высокое качество образовательных услуг — Пермский информационный портал

 В конце декабря Авиационный учебный центр АО «ОДК-Пермские моторы» получил сертификат соответствия требованиям федеральных авиационных правил. В России такими сертификатами обладает пока только несколько организаций (в том числе «S7 Тренинг», Авиационный комплекс им С.В. Ильюшина, авиакомпания «BИМ-АВИА»).

 

Необходимость получения сертификата появилась летом прошлого года после вступления в силу новых Федеральных авиационных правил ФАП-289 («Требования к образовательным организациям и организациям, осуществляющим обучение специалистов соответствующего уровня согласно перечням специалистов авиационного персонала»).

Изначально планировалось, что такой сертификат учебный центр «Пермских моторов» получит в 2019 году, поскольку для этого требовалось выполнить большой объем работы, в частности, переработать документацию центра с учетом новых требований. Тем не менее, благодаря ответственной работе специалистов центра, удалось подготовить все необходимые материалы в очень сжатые сроки.

Авиационный учебный центр «ОДК-Пермские моторы» обеспечивает подготовку и повышение квалификации персонала эксплуатирующих организаций. Среди них – СЛО «Россия», Министерство обороны РФ, «Газпром», «Туполев», РСК «МИГ», а/к «Кубана де Авиасьон» и другие. Ежегодно порядка 30 групп изучают конструкцию двигателей семейства ПС-90А и Д-30 и вопросы их эксплуатации.

В связи с началом серийного производства нового двигателя ПД-14 потребуется обучение не только летных и технических служб авиакомпаний, но и специалистов эксплуатации предприятий ОДК, а также Корпорации «Иркут» – разработчика и производителя самолета МС-21.

Сегодня в учебном авиационном центре реализуется около 150 учебных программ.

 

Ольга Красавина, директор по персоналу АО «ОДК-Пермские моторы»:

 

— От качества обучения технических специалистов зависит бесперебойная эксплуатация двигателей – как в полете, так и на земле, безопасность в гражданской авиации, энергетической и газовой промышленности. Авиационный учебный центр несет ответственность за подготовку каждого специалиста. И этот сертификат – гарантия для наших эксплуатантов, что их специалисты, проходящие у нас обучение, будут подготовлены на самом высоком уровне.

Полеты Ил-2 в Торбеево 13 июня 2020 года.

Прошлые выходные прошли у нас под знаком интенсивных полетов в Торбеево на Ил-2 и Тексане. Ил-2 облетывали для СЛГ, а на Тексане проверяли его качества во взаимодействии с Ил-2….

Суббота 13 июня 2020 года началась для нас с Максимом Сергеевичем Савельевым в Мячково. Тексан это как маленький Ан-2, все, что вам требуется сделать для подготовки Ан-2 к полету, почти также требуется для подготовки и Тексана. Ну может только масло из выхлопного коллектора сливать не нужно:-))) Так или иначе, но масло долили, гидрашку проверили, топливо слили…. И вот подав план, мы выдвигаемся в Торбеево. Лететь минут 20… Но вопрос с погодой…

Теперь в Мячково есть вот такие ангары. Не знаю сколько стоит базировка в них, но думаю не дешево…

Взлетели, делаем круг и дальше отходим на маршрут: UUBM-Ponik-Bolak-UUCT…

По маршруту осадки и небольшие провисания…

А мне из задней кабины нормально все кажется:-)))

И вот мы уже вошли в круг у Торбеево, частота 129,7. Все дороги на подходах к Торбеево сплошная пробка из-за страшной аварии: две фуры столкнулись лоб в лоб и загорелись.

На четвертом развороте.

И вот Тексан уже на земле, на влажном асфальте.

Максим Сергеевич все осмотрев и закрыв, идет к ангару…

Дмитрий Прошин и Максим Савельев. Ждем постановки задачи.

Ил-2 на улице… Его выкатили заранее для гонки двигателя.

Фото 13.

Олег Николаевич Алхимов трудится над Ил-2…

Михаил Юрьевич Лебедев, руководитель АУЦ S7, привез детей показать Ил-2 и его полеты.

Пока нечего делать, рассматриваем Вильгу-2000.

Стойки те же самые, но другие обтекатели…

А мы посмотрим поподробнее…

Пока есть возможность, теоретически изучаем процедуры запуска двигателя Ил-2… Тренаж в кабине..

Около заправки стоит Л-29, но он похоже никогда летать уже не будет?

Общий вид Вильга-2000. В S7 было два таких самолета, один из них вернулся на завод производитель и возможно именно он стал основой для легендарного Draco, который не так давно был разрушен.

Владимир Евгеньевич Барсук решил немного покататься на Тексане.

Небо мрачновато…

Но и солнышко есть…

На предварительный.

Прокатились и на стоянку.

Зато вовсю готовят Ил-2 к облету на СЛГ.

Фото 28.

Свое место занимает летчик-испытатель Максим Морозов.

Олег Николаевич серьезен…

Дмитрий Прошин

Двигатель запущен…

Рулить надо аккуратнее: всюду канавы под ночной старт от Дмитрия Шаповалова.

Равнодушных нет.

Все кто что имел из средств фото-видео фиксации, все достали…

На исполнительный…

Фото 37.

В профиль.

Роман Николаевич Седых с Максимом Сергеевичем Савельевым обсуждают полеты.

Разворот на исполнительном. Взлет с курсом 040 в горку на лес.

Разбег.

В силу предельной задней центровки и прочих радостей, Ил-2 взлетает почти всегда с трех точек. ..

Сейчас немного разгонится и…

Уберет шасси.

А зачем такие флажки на грунтовой полосе?

Проход.

Фото 50.

Фото 51.

И снова Роман Николаевич Седых и Максим Сергеевич Савельев. Ждут когда надо будет лететь.

Проход Ил-2 над полосой.

Крупнее

Еще крупнее.

Фото 56.

В задней кабине видим Максима Морозова.

Фото 58.

Тексан на фоне здания АТБ.

А кто это там вдали облетает Торбеево?

Фото 61.

И снова проход за проходом…

Фото 63.

Фото 64.

Борис Леонидович Осятинский делится удачными кадрами с сыном Дмитрием.

Фото 66.

Очередной проход.

Фото 68.

Крупнее

Фото 70.

Но выпустили шасси, будут проверять возможность посадки.

На заходе.

Над торцом.

Фото 74.

И уход на второй круг.

Фото 76.

Шасси не убирают…

Пристрелявшись, теперь уже точный заход…

Над торцом.

Выравнивание.

Касание.

Красиво, с дымами…

Фото 83.

И теперь устойчиво на земле.

Крупнее

Владимир Евгеньевич Барсук в кабине Ил-2.

Еще

И на стоянку…

Максим морозов готов отстреливаться.

Инженеры сразу набежали, каждый хочет узнать о работе своих систем….

Владимир Евгеньевич Барсук рассказывает Олегу Николаевичу Алхимову о недостатках и их отсутствии…

Полет прошел успешно.

И теперь в полет отправляется Тексан с экипажем в составе Максима Сергеевича Савельева и Бориса Леонидовича Осятинского.

Слева Михаил Юрьевич Лебедев

Максим Морозов

Фото 97.

Тексан на предварительном. борис Леонидович хочет посмотреть на возможности фотографирования из задней кабины самолета.

Исполнительный

Фото 100.

Разбег…

И взлет…

Фото 104.

Уборка шасси. Борис Леонидович еще не открыл заднюю часть фонаря.

А теперь открыл.

Дмитрий снимает все на видео.

Проход Тексана.

Очень удачно сложилось с ветром: он строго по полосе, но достаточно сильный и порывистый. Это иногда дает серьезную просадку на заходе с курсом 040.

Вжик…

Крупнее

Еще

Теперь проход с обратным курсом.

Фото 114.

И отход…

Фото 116.

Подсвеченный солнышком….

И после этого заход на посадку.

Над торцом.

Касание. Очень часто борт касается именно так двумя стойками…

На земле.

Все прошло удачно…

Борис леонидович доволен, но к следующему полету попросил снять заднюю часть фонаря полностью и обеспечить неполное открытие основного фонаря задней кабины. Но это уже увидим в следующей части рассказа о 14 июня 2020 года….

Сетевая инфраструктура LTE и элементы

1. Введение

Следующий отрывок из [1] дает очень хорошее представление об общей сетевой инфраструктуре и элементах LTE. На рисунке ниже описана общая сетевая архитектура LTE и UMTS, включая не только усовершенствованное пакетное ядро ​​(EPC) и усовершенствованную сеть наземного доступа UMTS (E-UTRAN), но и другие компоненты, чтобы показать взаимосвязь между ними.Для упрощения на рисунке показаны только интерфейсы сигнализации. В некоторых случаях и пользовательские данные, и сигнализация поддерживаются интерфейсом (например, интерфейсы S1, S2 или 3G PS Gi), но в некоторых других случаях интерфейсы предназначены для плоскости управления и поддерживают только сигнализацию (например, S6 и S7-интерфейсы).


Новые блоки, характерные для эволюции Evolved UMTS, также известной как Evolved Packet System (EPS), — это Evolved Packet Core (или EPC) и Evolved UTRAN (или E-UTRAN).Также отображаются другие блоки из классической архитектуры UMTS, такие как UTRAN (сеть доступа UMTS), базовые сети PS и CS, соответственно, подключенные к общедоступным (или любым частным) IP и телефонным сетям. IMS (IP Multimedia Subsystem) расположена поверх блоков Packet Core и обеспечивает доступ как к общедоступным, так и к частным IP-сетям, а также к общедоступной телефонной сети через объекты сети Media Gateway. HSS, управляющий информацией о подписке пользователей, показан как центральный узел, предоставляющий услуги всем блокам базовой сети 3G и развитой архитектуре 3G.

Примечание: На рисунке не представлены узлы, участвующие в поддержке функции зарядки.

Ниже рассматриваются отдельные подкомпоненты:

2. E-UTRAN и eNode Bs

2.1. История от UMTS

Начиная с первых выпусков стандарта UMTS, архитектура UTRAN изначально была в значительной степени согласована с концепциями сетей доступа 2G / GSM. Общая архитектура соответствует старой доброй «звездной» модели 2G / GSM, а это означает, что один контроллер (RNC) может управлять большим количеством базовых радиостанций (обычно в коммерческих сетях — несколько сотен) (узел B). ) через интерфейс Iub.Кроме того, был определен интерфейс Iur между RNC, чтобы разрешить привязку вызовов UTRAN на уровне RNC и макроразнесение между разными узлами B, управляемыми разными RNC. Макроразнесение было следствием физических уровней UTRAN на основе CDMA как средства уменьшения радиопомех и сохранения пропускной способности сети. Первоначальная архитектура UTRAN привела к упрощенной реализации узла B и относительно сложной, чувствительной, высокопроизводительной и многофункциональной конструкции RNC. В этой модели RNC должен был поддерживать функции управления ресурсами и трафиком, а также значительную часть радиопротоколов.

2.2 eNode Bs: одиночный узел E-UTRAN

По сравнению с UTRAN структура E-UTRAN на основе OFDM довольно проста. Он состоит только из одного сетевого элемента: eNodeB (для развитого узла B.). 3G RNC (контроллер радиосети), унаследованный от 2G BSC (контроллер базовой станции), исчез из E-UTRAN, а eNodeB напрямую подключен к базовой сети с помощью интерфейса S1. Как следствие, функции, поддерживаемые RNC, были распределены между eNodeB, MME базовой сети или объектами обслуживающего шлюза.

2.3 Интерфейс X2

Между eNodeB был определен новый интерфейс (X2), работающий в виде ячеистой сети (это означает, что все узлы B могут быть связаны вместе). Основная цель этого интерфейса — минимизировать потерю пакетов из-за мобильности пользователя. Когда терминал перемещается по сети доступа, неотправленные или неподтвержденные пакеты, хранящиеся в старых очередях eNodeB, могут быть перенаправлены или туннелированы в новый eNodeB благодаря интерфейсу X2. С точки зрения высокого уровня, новая архитектура E-UTRAN фактически движется к сетевым структурам WLAN и базовым станциям Wi-Fi или WiMAX.

2.4 Функциональные возможности eNode B

Функциональное определение eNodeB как точки доступа WLAN — поддерживают все функции уровня 1 и уровня 2, связанные с физическим интерфейсом E-UTRAN OFDM, и напрямую подключаются к сетевым маршрутизаторам. Больше нет промежуточного управляющего узла (как были 2G / BSC или 3G / RNC). Это имеет преимущество более простой сетевой архитектуры (меньшее количество узлов разных типов, что означает упрощенную работу сети) и обеспечивает лучшую производительность по радиоинтерфейсу.Как описано в главе 4, завершение протоколов уровня 2 в eNodeB, а не в RNC, помогает уменьшить задержку передачи данных за счет сохранения задержки, вызванной передачей повторений пакетов через интерфейс Iub. С функциональной точки зрения eNodeB поддерживает набор унаследованных функций, связанных с процедурами физического уровня для передачи и приема через радиоинтерфейс:

· Модуляция и демодуляция.

· Канальное кодирование и декодирование.

Кроме того, eNodeB включает дополнительные функции, связанные с тем, что в архитектуре E-UTRAN больше нет контроллеров базовых станций. Эти функции, которые подробно описаны в главе 4, включают следующее:

· Управление радиоресурсами: это относится к распределению, модификации и высвобождению ресурсов для передачи

по радиоинтерфейсу между пользовательским терминалом и eNodeB.

· Управление радиомобильностью: это относится к обработке измерений и решению о передаче обслуживания.

· · Полный протокол уровня 2 радиоинтерфейса: в режиме «Data Link» OSI цель уровня 2 — обеспечить передачу данных

между объектами сети. Это подразумевает обнаружение и, возможно, исправление ошибок, которые могут возникнуть на физическом уровне.

3. Развитое пакетное ядро ​​(EPC) и его компоненты

EPC (Evolved Packet Core) состоит из нескольких функциональных объектов:

· MME (объект управления мобильностью)

· HSS (домашний абонентский сервер)

· Обслуживающий шлюз.

· Шлюз PDN (сеть пакетной передачи данных).

· Сервер PCRF (функция политик и правил начисления платы).

В следующих подразделах подробно обсуждается каждый из них:

3.1 MME (объект управления мобильностью)

MME отвечает за все функции уровня управления, связанные с управлением абонентами и сеансами. С этой точки зрения MME поддерживает следующее:

· Процедуры безопасности — это относится к аутентификации конечного пользователя, а также к инициированию и согласованию алгоритмов шифрования и защиты целостности.

· Обработка сеансов связи между терминалами — это относится ко всем процедурам сигнализации, используемым для установки контекста пакетных данных и согласования связанных параметров, таких как качество обслуживания.

· Управление местоположением незанятого терминала — это относится к процессу обновления области отслеживания, используемому для того, чтобы сеть могла подключаться к терминалам в случае входящих сеансов.

MME связан через интерфейс S6 с HSS, который поддерживает базу данных, содержащую всю информацию о подписке пользователя.

3.2 HSS (домашний абонентский сервер)

HSS (домашний абонентский сервер) представляет собой конкатенацию HLR (домашнего регистра местоположения) и AuC (центра аутентификации) — две функции уже присутствуют в сетях 2G / GSM и 3G / UMTS до IMS. Часть HLR HSS отвечает за хранение и обновление, при необходимости, базы данных, содержащей всю информацию о подписке пользователей, включая (список не является исчерпывающим):

· Идентификация и адресация пользователя — соответствует IMSI (международный идентификатор мобильного абонента) и MSISDN (номер ISDN мобильного абонента) или номеру мобильного телефона.

· Информация о профиле пользователя — сюда входят состояния подписки на услуги и информация о качестве обслуживания, на которую подписан пользователь (например, максимально допустимая скорость передачи данных или разрешенный класс трафика).

Часть AuC HSS отвечает за создание информации безопасности из ключей идентификации пользователя. Эта информация о безопасности предоставляется HLR и далее передается другим объектам в сети. Информация о безопасности в основном используется для:

· Взаимная аутентификация терминала сети.

· Шифрование радиотракта и защита целостности, чтобы гарантировать, что данные и сигнализация, передаваемые между сетью и терминалом, не перехватываются и не изменяются.

3.3 Обслуживающий GW (обслуживающий шлюз)

С функциональной точки зрения обслуживающий GW является конечной точкой интерфейса пакетных данных в направлении E-UTRAN. Когда терминалы перемещаются через eNodeB в E-UTRAN, обслуживающий GW служит в качестве локального якоря мобильности, что означает, что пакеты маршрутизируются через эту точку для мобильности внутри E-UTRAN и мобильности с другими технологиями 3GPP, такими как 2G / GSM и 3G / UMTS. .

3.4 PDN GW (шлюз сети пакетной передачи данных)

Подобно обслуживающему GW, шлюз PDN является конечной точкой интерфейса пакетных данных по направлению к сети пакетных данных. В качестве точки привязки для сеансов с внешними сетями пакетной передачи данных PDN GW также поддерживает функции применения политик (которые применяют определенные оператором правила для выделения и использования ресурсов), а также фильтрацию пакетов (например, глубокую проверку пакетов для обнаружения сигнатур вирусов) и развитая поддержка тарификации (например, тарификация по URL-адресу).

3.5 Сервер PCRF (функция политик и правил начисления платы)

Сервер PCRF управляет политикой обслуживания и отправляет информацию о настройке QoS для каждого сеанса пользователя и информацию о правилах учета. Сервер PCRF сочетает в себе функции следующих двух узлов UMTS:

· Функция принятия политических решений (PDF)

· Функция правил начисления платы (CRF)

PDF — это сетевой объект, в котором принимаются стратегические решения. Во время установки сеанса IMS между терминалом и P-CSCF происходит обмен сигнализацией SIP, содержащей требования к среде передачи. В какой-то момент в процессе установления сеанса PDF получает эти требования от P-CSCF и принимает решения на основе правил сетевого оператора, например:

· Разрешение или отклонение медиа-запроса.

· Использование нового или существующего контекста PDP для входящего медиа-запроса.

· Проверка распределения новых ресурсов относительно максимального разрешенного

Роль CRF заключается в предоставлении определяемых оператором правил тарификации, применимых к каждому потоку служебных данных.CRF выбирает соответствующие правила тарификации на основе информации, предоставленной P-CSCF, такой как идентификатор приложения, тип потока (аудио, видео и т. Д.), Скорость передачи данных приложения и т. Д.

Список литературы

[1] П. Лескуайер и Т. Люсидарм, «Развитая пакетная система (EPS): LTE и эволюция SAE для 3G UMTS», John Wiley & Sons Ltd.

Внешние ссылки

[1] Контракты на мировую инфраструктуру сотовой сети и доля рынка в третьем квартале 2011 г . :

http: // www.marketresearch.com/Signals-and-Systems-Telecom-v3882/Worldwide-Cellular-Network-Infrastructure-Contracts-6564818/

http://www.researchandmarkets.com/research/4a851c/worldwide_cellular

[2] Мировой обзор рынка LTE и прогнозы подписок на 3 квартал 2011 г. (включает список контрактов на инфраструктуру LTE):

http://www.marketresearch.com/Signals-and-Systems-Telecom-v3882/Worldwide-LTE-Update-Subscription-Forecasts-6564973/

http: //www.researchandmarkets.com / research / 3187a2 / world_lte_mark

Индекс, взвешенный по растворимости: быстрое и точное предсказание растворимости белка | Биоинформатика

Мы оптимизировали эти B -факторы и получили новый набор значений для оценки растворимости, который дополнительно повышает точность прогнозов. Мы называем этот новый предсказатель «индексом, взвешенным по растворимости» (SWI). Важно отметить, что SWI превосходит многие существующие инструменты прогнозирования растворимости белков. Кроме того, мы разработали «SoDoPE» (растворимый домен для экспрессии белка), веб-интерфейс, который позволяет пользователям выбирать интересующую область белка для прогнозирования и максимизации как экспрессии белка, так и растворимости.

rcsb.org/metrics/). Эти неудачи затрудняют исследования белков, что особенно важно для структурных, функциональных и фармацевтических исследований, требующих растворимых и концентрированных белковых растворов (Hou et al., 2018; Kramer et al. , 2012). Таким образом, прогнозирование растворимости и белковая инженерия для повышения растворимости являются активной областью исследований. Известные подходы к белковой инженерии включают мутагенез, усечение (то есть экспрессию частичных белковых последовательностей) или слияние с тегом, повышающим растворимость (Chan et al. , 2010; Costa et al. , 2014; Esposito and Chatterjee, 2006; Kramer и др., , 2012; Тревино, и др., , 2007; Waldo, 2003).

Растворимость белка частично зависит от внешних факторов, таких как ионная сила, температура и pH, а также от внутренних факторов — физико-химических свойств последовательности и структуры белка, включая молекулярную массу, аминокислотный состав, гидрофобность, ароматичность, изоэлектрические свойства. точки, структурные склонности и полярность поверхностных остатков (Chiti et al. , 2003; Diaz et al. , 2010; Tartaglia et al. , 2004; Wilkinson and Harrison, 1991).Многие инструменты прогнозирования растворимости были разработаны на основе этих функций с использованием статистических моделей (например, линейной и логистической регрессии) или других моделей машинного обучения (например, поддерживающих векторных машин и нейронных сетей) (Habibi et al. , 2014; Hebditch et al. , 2017; Heckmann et al. , 2018; Hirose and Noguchi, 2013; Sormanni et al. , 2017; Wu et al. , 2019; Yang et al. , 2019).

В этом исследовании мы исследовали экспериментальные результаты 12 216 рекомбинантных белков, экспрессируемых в Escherichia coli в рамках проекта «Protein Structure Initiative: Biology» (PSI: Biology) (Acton et al., 2005; Чен и др. , 2004). Мы показали, что структурная гибкость белков более точна, чем свойства других белковых последовательностей при прогнозировании растворимости (Craveur et al. , 2015; Vihinen et al. , 1994). Гибкость — это стандартная особенность, которая, по-видимому, упускалась из виду в предыдущих попытках прогнозирования растворимости. На основе этого мы получили набор из 20 значений для стандартных аминокислотных остатков и использовали их для прогнозирования растворимости. Мы называем этот новый предсказатель «индексом, взвешенным по растворимости» (SWI).SWI является мощным предсказателем растворимости и хорошим показателем глобальной структурной гибкости. Кроме того, SWI превосходит многие существующие инструменты прогнозирования растворимости белка de novo .

«> 2 Материалы и методы

coli с использованием экспрессионных векторов pET21_NESG или pET15_NESG ( N = 8780 и 3436 соответственно). Для проверки мы использовали данные о растворимости белков E.coli из eSOL ( N = 3198; http://www.tanpaku.org/tp-esol/index.php?lang=en) (Niwa et al. др. , 2009 г.). См. Также дополнительный рисунок S1 и таблицу S1A.

Кроме того, мы загрузили данные о «липкости» 397 белков E.coli , чтобы изучить влияние поверхностных аминокислотных остатков (http: // www.weizmann.ac.il/Structural_Biology/faculty_pages/ELevyintDef/interface_def.html) (Леви и др. , 2012).

«> 2.2 Свойства белковой последовательности

Свойства стандартной белковой последовательности были рассчитаны с использованием модуля Bio.SeqUtils.ProtParam программы Biopython v1.73 (Cock et al. , 2009). Все свойства различных белковых последовательностей были рассчитаны с использованием пакета R package protr v1. 6-2 (Xiao et al. , 2015).

Оценка композиции последовательности с использованием набора из 20 значений аминокислотных остатков, полученных из Smith et al. нормализованный фактор B . Обучено и протестировано с использованием набора данных PSI: Biology, подготовленного DNASU (Seiler et al. , 2014). Доступно на https://tisigner.com/sodope и https://github.com/Gardner-BinfLab/SoDoPE_paper_2020. 1 0,00 ± 0,00 0,71 ± 0,01 0,50 (2,51 × 10 −205 ) Protein-Sol Линейная модель (Hebditch , 2017) . Обучено и протестировано с использованием набора данных eSOL (Niwa et al., 2009). Доступно на https://protein-sol.manchester.ac.uk/. 10 1,16 ± 0,75 0,68 ± 0,02 0,54 (2,37 × 10 -240 ) Гибкость Скользящее окно из девяти аминокислотных остатков с использованием Vihinen et al. нормализованный фактор B . Доступно на https://github.com/biopython/biopython. 1 0,38 ± 0,04 0,67 ± 0,02 0.37 (7,73 × 10 −106 ) DeepSol S2 Модели нейронных сетей (Khurana и др. , 2018) c . Обучено и протестировано с использованием набора данных PSI: Biology, подготовленного ccSOL omics (Agostini et al. , 2014). Доступно по адресу https://github.com/sameerkhurana10/DSOL_rv0.2. 57 (11 типов) 2069,77 ± 1613,63 0,67 ± 0,02 0,23 (5,82 × 10 −41 ) DeepSol S3 2075.93 ± 1613,80 0,66 ± 0,02 0,35 (7,48 × 10 −91 ) DeepSol S1 2081,93 ± 1612,71 0,64 ± 0,03 0,3300 0,64 ± 0,03 0,33 Внутренний веб-сервер CamSol Модели линейной и логистической регрессии (Сорманни и др. , 2015, 2017). Обучено и протестировано с использованием ранее опубликованных наборов данных (Família et al. , 2015). Доступно по адресу http: // www-vendruscolo.ch.cam.ac.uk/camsolmethod.html. 4 NA 0,66 ± 0,01 0,44 (4,53 × 10 −148 ) PaRSnIP Модель машины для повышения градиента (Rawi et al. , 2018). Обучено и протестировано с использованием набора данных PSI: Biology, подготовленного ccSOL omics (Agostini et al. , 2014). Доступно на https://github.com/RedaRawi/PaRSnIP. 8477 (14 типов) 2055,50 ± 1621,11 0,61 ± 0.02 0,29 (3,57 × 10 −65 ) Модель Уилкинсона – Харрисона Линейная модель с использованием среднего заряда и доли остатков, образующих чередование (Wilkinson and Harrison, 1991; Davis et al. , 1999; Харрисон, 2000). Доступно по адресу https://github.com/brunoV/bio-tools-solubility-wilkinson. 2 0,09 ± 0,00 0,55 ± 0,03 –0,06 (1,16 × 10 −4 ) Веб-сервер ccSOL omics Поддержка векторной модели машины (Agostini et al., 2014). Обучено и протестировано с использованием набора данных PSI: Biology, курируемого внутри компании. Доступно по адресу http://s.tartaglialab.com/new_submission/ccsol_omics_file. 5 NA 0,51 ± 0,01 –0,02 (0,18)
. подходов . Характеристики . Время стены (с на последовательность) a . PSI: Биология (AUC) b . eSOL [ R s ( P -значение)] .
SWI Среднее арифметическое (данное исследование). Оценка композиции последовательности с использованием набора из 20 значений аминокислотных остатков, полученных из Smith et al. нормализованный фактор B . Обучено и протестировано с использованием набора данных PSI: Biology, подготовленного DNASU (Seiler et al. , 2014). Доступно на https://tisigner.com/sodope и https: // github.ru / Gardner-BinfLab / SoDoPE_paper_2020. 1 0,00 ± 0,00 0,71 ± 0,01 0,50 (2,51 × 10 −205 )
Protein-Sol Линейная модель (Hebditch , 2017) . Обучено и протестировано с использованием набора данных eSOL (Niwa et al. , 2009). Доступно на https://protein-sol.manchester.ac.uk/. 10 1,16 ± 0,75 0,68 ± 0,02 0.54 (2,37 × 10 -240 )
Гибкость Скользящее окно из девяти аминокислотных остатков с использованием Vihinen et al. нормализованный фактор B . Доступно на https://github.com/biopython/biopython. 1 0,38 ± 0,04 0,67 ± 0,02 0,37 (7,73 × 10 −106 )
DeepSol S2 Модели нейронных сетей (Khurana et al. c, , 2018).Обучено и протестировано с использованием набора данных PSI: Biology, подготовленного ccSOL omics (Agostini et al. , 2014). Доступно по адресу https://github.com/sameerkhurana10/DSOL_rv0.2. 57 (11 типов) 2069,77 ± 1613,63 0,67 ± 0,02 0,23 (5,82 × 10 −41 )
DeepSol S3 2075.93 ± 1613.80 (7,48 × 10 −91 )
DeepSol S1 2081.93 ± 1612,71 0,64 ± 0,03 0,39 (9,52 × 10 −116 )
Внутренний веб-сервер CamSol Модели линейной и логистической регрессии (Sormanni et al. , 2015, 2017). Обучено и протестировано с использованием ранее опубликованных наборов данных (Família et al. , 2015). Доступно на http://www-vendruscolo.ch.cam.ac.uk/camsolmethod.html. 4 NA 0,66 ± 0,01 0,44 (4,53 × 10 −148 )
PaRSnIP Модель машины для повышения градиента (Rawi et al. , 2018). Обучено и протестировано с использованием набора данных PSI: Biology, подготовленного ccSOL omics (Agostini et al. , 2014). Доступно на https://github.com/RedaRawi/PaRSnIP. 8477 (14 типов) 2055,50 ± 1621,11 0,61 ± 0,02 0,29 (3,57 × 10 −65 )
Модель Уилкинсона – Харрисона Линейная модель с использованием среднего заряда и доли образующих чередование остатков (Уилкинсон и Харрисон, 1991; Дэвис и др. , 1999; Харрисон, 2000).Доступно по адресу https://github.com/brunoV/bio-tools-solubility-wilkinson. 2 0,09 ± 0,00 0,55 ± 0,03 –0,06 (1,16 × 10 −4 )
Веб-сервер ccSOL omics Поддержка векторной модели машины (Agostini et al. , 2014) . Обучено и протестировано с использованием набора данных PSI: Biology, курируемого внутри компании. Доступно по адресу http://s.tartaglialab.com/new_submission/ccsol_omics_file. 5 NA 0.51 ± 0,01 –0,02 (0,18)

Таблица 1. Сравнение методов прогнозирования растворимости белков и программного обеспечения

web server web server
. подходов . Характеристики . Время стены (с на последовательность) a . PSI: Биология (AUC) b . eSOL [ R s ( P -значение)] .
SWI Среднее арифметическое (данное исследование). Оценка композиции последовательности с использованием набора из 20 значений аминокислотных остатков, полученных из Smith et al. нормализованный фактор B . Обучено и протестировано с использованием набора данных PSI: Biology, подготовленного DNASU (Seiler et al. , 2014). Доступно на https://tisigner.com/sodope и https://github. com/Gardner-BinfLab/SoDoPE_paper_2020. 1 0,00 ± 0,00 0.71 ± 0,01 0,50 (2,51 × 10 −205 )
Protein-Sol Линейная модель (Hebditch et al. , 2017). Обучено и протестировано с использованием набора данных eSOL (Niwa et al. , 2009). Доступно на https://protein-sol.manchester.ac.uk/. 10 1,16 ± 0,75 0,68 ± 0,02 0,54 (2,37 × 10 -240 )
Гибкость Скользящее окно из девяти аминокислотных остатков с использованием Vihinen et al. нормализованный фактор B . Доступно на https://github.com/biopython/biopython. 1 0,38 ± 0,04 0,67 ± 0,02 0,37 (7,73 × 10 −106 )
DeepSol S2 Модели нейронных сетей (Khurana et al. c, , 2018). Обучено и протестировано с использованием набора данных PSI: Biology, подготовленного ccSOL omics (Agostini et al. , 2014). Доступно по адресу https://github.com/sameerkhurana10/DSOL_rv0.2. 57 (11 типов) 2069,77 ± 1613,63 0,67 ± 0,02 0,23 (5,82 × 10 −41 )
DeepSol S3 2075,93 ± 1613.803 0,35 (7,48 × 10 −91 )
DeepSol S1 2081,93 ± 1612,71 0,64 ± 0,03 0,39 (9,52 × 10 −116 )
Модели линейной и логистической регрессии (Sormanni et al., 2015, 2017). Обучено и протестировано с использованием ранее опубликованных наборов данных (Família et al. , 2015). Доступно на http://www-vendruscolo.ch.cam.ac.uk/camsolmethod.html. 4 NA 0,66 ± 0,01 0,44 (4,53 × 10 −148 )
PaRSnIP Модель машины для повышения градиента (Rawi et al. , 2018). Обучено и протестировано с использованием набора данных PSI: Biology, подготовленного ccSOL omics (Agostini et al., 2014). Доступно на https://github.com/RedaRawi/PaRSnIP. 8477 (14 типов) 2055,50 ± 1621,11 0,61 ± 0,02 0,29 (3,57 × 10 −65 )
Модель Уилкинсона – Харрисона Линейная модель с использованием среднего заряда и доли образующих чередование остатков (Уилкинсон и Харрисон, 1991; Дэвис и др. , 1999; Харрисон, 2000). Доступно по адресу https://github.com/brunoV/bio-tools-solubility-wilkinson. 2 0.09 ± 0,00 0,55 ± 0,03 –0,06 (1,16 × 10 −4 )
Веб-сервер ccSOL omics Поддержка векторной модели машины (Agostini et al. , 2014). Обучено и протестировано с использованием набора данных PSI: Biology, курируемого внутри компании. Доступно по адресу http://s.tartaglialab.com/new_submission/ccsol_omics_file. 5 NA 0,51 ± 0,01 –0,02 (0,18)
0,3300
. подходов . Характеристики . Время стены (с на последовательность) a . PSI: Биология (AUC) b . eSOL [ R s ( P -значение)] .
SWI Среднее арифметическое (данное исследование). Оценка композиции последовательности с использованием набора из 20 значений аминокислотных остатков, полученных из Smith et al. нормализованный фактор B . Обучено и протестировано с использованием набора данных PSI: Biology, подготовленного DNASU (Seiler et al. , 2014). Доступно на https://tisigner.com/sodope и https://github.com/Gardner-BinfLab/SoDoPE_paper_2020. 1 0,00 ± 0,00 0,71 ± 0,01 0,50 (2,51 × 10 −205 )
Protein-Sol Линейная модель (Hebditch , 2017) . Обучено и протестировано с использованием набора данных eSOL (Niwa et al., 2009). Доступно на https://protein-sol.manchester.ac.uk/. 10 1,16 ± 0,75 0,68 ± 0,02 0,54 (2,37 × 10 -240 )
Гибкость Скользящее окно из девяти аминокислотных остатков с использованием Vihinen et al. нормализованный фактор B . Доступно на https://github.com/biopython/biopython. 1 0,38 ± 0,04 0,67 ± 0,02 0.37 (7,73 × 10 −106 )
DeepSol S2 Модели нейронных сетей (Khurana и др. , 2018) c . Обучено и протестировано с использованием набора данных PSI: Biology, подготовленного ccSOL omics (Agostini et al. , 2014). Доступно по адресу https://github.com/sameerkhurana10/DSOL_rv0.2. 57 (11 типов) 2069,77 ± 1613,63 0,67 ± 0,02 0,23 (5,82 × 10 −41 )
DeepSol S3 2075. 93 ± 1613,80 0,66 ± 0,02 0,35 (7,48 × 10 −91 )
DeepSol S1 2081,93 ± 1612,71 0,64 ± 0,03 0,64 ± 0,03 0,33
Внутренний веб-сервер CamSol Модели линейной и логистической регрессии (Сорманни и др. , 2015, 2017). Обучено и протестировано с использованием ранее опубликованных наборов данных (Família et al. , 2015). Доступно по адресу http: // www-vendruscolo.ch.cam.ac.uk/camsolmethod.html. 4 NA 0,66 ± 0,01 0,44 (4,53 × 10 −148 )
PaRSnIP Модель машины для повышения градиента (Rawi et al. , 2018). Обучено и протестировано с использованием набора данных PSI: Biology, подготовленного ccSOL omics (Agostini et al. , 2014). Доступно на https://github.com/RedaRawi/PaRSnIP. 8477 (14 типов) 2055,50 ± 1621,11 0,61 ± 0. 02 0,29 (3,57 × 10 −65 )
Модель Уилкинсона – Харрисона Линейная модель с использованием среднего заряда и доли остатков, образующих чередование (Wilkinson and Harrison, 1991; Davis et al. , 1999; Харрисон, 2000). Доступно по адресу https://github.com/brunoV/bio-tools-solubility-wilkinson. 2 0,09 ± 0,00 0,55 ± 0,03 –0,06 (1,16 × 10 −4 )
Веб-сервер ccSOL omics Поддержка векторной модели машины (Agostini et al., 2014). Обучено и протестировано с использованием набора данных PSI: Biology, курируемого внутри компании. Доступно по адресу http://s.tartaglialab.com/new_submission/ccsol_omics_file. 5 NA 0,51 ± 0,01 –0,02 (0,18)

Чтобы измерить время стенок для инструментов прогнозирования растворимости, мы выбрали 10 последовательностей, которые охватывают широкий диапазон длин из PSI: Biology and Наборы данных eSOL (от 36 до 2389 остатков). Все инструменты запускались и рассчитывались по времени с помощью одного процесса без использования графических процессоров на высокопроизводительном компьютере [/ usr / bin / time -f ‘% E’ ; Операционная система CentOS Linux 7 (Core), 72 ядра в 2 × узлах Broadwell (E5-2695v4, 2.1 ГГц, два сокета, 18 ядер на сокет), память 528 ГиБ]. В качестве входных файлов использовались файлы fasta с одной последовательностью.

«> 2,4 SWI

Чтобы улучшить прогноз растворимости белков, мы оптимизировали Smith et al. Нормализованные -факторы B с использованием набора данных PSI: Biology (рис. 2). Чтобы избежать включения гомологичных последовательностей в тестовые и обучающие наборы, мы сгруппировали цели PSI: Biology с помощью USEARCH v11.0.667, 32-бит (Edgar, 2010). Последовательности His-метки были удалены из всех последовательностей перед кластеризацией, чтобы избежать ложных кластерных включений. Мы получили 5050 кластеров, используя параметры: -cluster_fast -id 0.4 -msaout -threads 4. Эти кластеры были сгруппированы в 10 подмножеств с ~ 1200 последовательностями на подмножество вручную. Последующие шаги были выполнены с использованием последовательностей с His-метками.

Мы итеративно уточняли веса аминокислотных остатков для оценки растворимости, используя 10-кратную перекрестную проверку, в которой целью была максимальная площадь под кривой ROC (AUC) (рис. 2A). Поскольку AUC недифференцируема, мы использовали метод оптимизации Нелдера – Мида (реализованный в SciPy v1.2.0), который представляет собой эвристическую оптимизацию на основе симплексов без производных (Millman and Aivazis, 2011; Nelder and Mead, 1965; Oliphant, 2007). На каждом этапе перекрестной проверки мы использовали повторную выборку с начальной загрузкой, содержащую 1000 растворимых и 1000 нерастворимых белков. Оптимизация проводилась для каждого образца, давая 1000 наборов гирь. Среднее арифметическое этих весов использовалось для определения AUC обучения и тестирования для этапа перекрестной проверки.

Для контроля были сгенерированы случайные белковые последовательности с возрастающей длиной, начиная с длины в 50 остатков до 6000 остатков с шагом 50 остатков. Сотни случайных последовательностей были сгенерированы для каждой длины, что дало в общей сложности 12 000 уникальных случайных последовательностей.

Наш веб-сервер принимает нуклеотидную или аминокислотную последовательность. После отправки последовательности на веб-сервер HMMER отправляется запрос для аннотирования белковых доменов (https: // www.ebi.ac.uk/Tools/hmmer/) (Potter и др. , 2018). После того, как белковые домены идентифицированы, пользователи могут выбрать домен или любую настраиваемую область (включая полноразмерную последовательность), чтобы проверить вероятность растворимости, гибкости и общего среднего значения гидропатии (GRAVY). Эта функция позволяет биохимикам белков планировать свои эксперименты и выбирать домены или области с высокой вероятностью растворимости. Кроме того, мы реализовали алгоритм моделирования отжига, который максимизировал вероятность растворимости для данной области, создав список областей с расширенными границами.Пользователи также могут предсказать улучшение растворимости, выбрав обычно используемый тег растворимости или настраиваемый тег.

Мы связали SoDoPE с TIsigner, который является нашим существующим веб-сервером для оптимизации доступности сайта инициации перевода (Bhandari et al. , 2019). Этот конвейер позволяет пользователям прогнозировать и оптимизировать как экспрессию белка, так и растворимость интересующего гена. Веб-сервер SoDoPE находится в свободном доступе по адресу https://tisigner.com/sodope.

«> 2.7 Статистический анализ

Анализ данных был проведен с использованием Pandas v0.25.3 (McKinney, 2010), scikit-learn v0.20.2 (Pedregosa et al. , 2011), numpy v1.16.2 (van der Walt et al. , 2011) и statsmodel v0.10.1 (Seabold и Perktold, 2010). Графики были созданы с использованием Matplotlib v3.0.2 (Hunter, 2007) и Seaborn v0.9.0 (Waskom et al. , 2014).

«> 2,8 Код и доступность данных

Блокнот

Jupyter нашего анализа можно найти по адресу https: // github.ru / Gardner-BinfLab / SoDoPE_paper_2020. Исходный код нашего сервера прогнозирования растворимости (SoDoPE) можно найти по адресу https://github. com/Gardner-BinfLab/TISIGNER-ReactJS.

«> 3 Результаты

, 2014) на основании анализа растворимости клеточного лизата с использованием SDS-PAGE (Xiao et al., 2010). Как система экспрессии, так и метод анализа растворимости обычно используются в лабораториях (Costa et al. , 2014). Этот большой набор данных охватывает широкий спектр вопросов растворимости белков.

Мы оценили девять стандартных и 9920 различных свойств последовательностей белков с использованием модуля Biopython ProtParam и пакета «protr» R, соответственно (Cock et al. , 2009; Xiao et al. , 2015). Например, стандартные свойства включают GRAVY, склонность к вторичной структуре, структурную гибкость белка и т. Д., в то время как различные свойства включают аминокислотный состав, автокорреляцию и т. д. Поразительно, что структурная гибкость белка превосходит другие характеристики при прогнозировании растворимости (AUC = 0,67; рис. 1, дополнительный рис. S2 и таблица S2).

Рис. 1.

Глобальная структурная гибкость превосходит другие свойства стандартных белковых последовательностей в прогнозировании растворимости белков. ROC-анализ характеристик стандартной белковой последовательности для прогнозирования растворимости 12 216 рекомбинантных белков, экспрессируемых в E.coli (набор данных PSI: Biology). Кривые ROC показаны на двух отдельных панелях для ясности. Показатели AUC (идеальный = 1,00, случайный = 0,50) показаны в скобках. Пунктирными линиями обозначены характеристики случайных классификаторов. См. Также дополнительный рисунок S2 и таблицу S2. AUC — Площадь под кривой ROC; GRAVY, среднее значение гидропатии; PSI: Биология, Инициатива структуры белка: Биология; ROC, рабочая характеристика приемника

Рис. 1.

Глобальная структурная гибкость превосходит другие стандартные свойства последовательностей белков при прогнозировании растворимости белков.ROC-анализ стандартных характеристик белковой последовательности для прогнозирования растворимости 12 216 рекомбинантных белков, экспрессированных в E.coli (PSI: набор данных по биологии). Кривые ROC показаны на двух отдельных панелях для ясности. Показатели AUC (идеальный = 1,00, случайный = 0,50) показаны в скобках. Пунктирными линиями обозначены характеристики случайных классификаторов. См. Также дополнительный рисунок S2 и таблицу S2. AUC — Площадь под кривой ROC; GRAVY, среднее значение гидропатии; PSI: Биология, Инициатива структуры белка: Биология; ROC, рабочая характеристика приемника

, 1989; Smith et al. , 2003; Vihinen et al. al. , 1994) (см. также дополнительные материалы). Эти нормализованные B -факторы могут применяться к любым белковым последовательностям без кристаллографических данных для предсказания гибкости, например как реализовано в Biopython. Следовательно, мы можем упростить уравнение (1), установив f′i = Bi как марковскую модель нулевого порядка.Тогда упрощенная глобальная гибкость F ‘представляет собой среднее арифметическое нормированных B -факторов (математическое доказательство см. В дополнительном материале).

F ′ = 〈f′i〉 = 〈Bi〉

(3)

Мы обнаружили сильную корреляцию между F и F ′ для набора данных PSI: Biology (rho Спирмена = 0,98, P -значение ниже недопустимого потока в машине). уровень). Следовательно, метод скользящего окна [уравнения (1) и (2)] для этой цели не требуется.

Мы применили метод среднего арифметического (т.е. оценка состава последовательности) в PSI: набор данных биологии с использованием четырех наборов ранее опубликованных нормированных факторов B (Bhaskaran and Ponnuswamy, 1988; Ragone et al. , 1989; Smith et al. , 2003; Vihinen ). и др., , 1994). Среди этих наборов факторов B оценка композиции последовательности с использованием последнего опубликованного набора нормализованных факторов B дала наивысшую оценку AUC (AUC = 0,66; дополнительный рисунок S3).

Для повышения точности предсказания растворимости мы итеративно уточняли веса аминокислотных остатков, используя алгоритм оптимизации Нелдера-Мида (Nelder and Mead, 1965) (рис.2). Smith et al. В качестве начальных весов использовались нормализованные -факторы B . Чтобы избежать тестирования и обучения на аналогичных последовательностях, мы сгенерировали 10 наборов перекрестной проверки с максимальной неоднородностью между этими подмножествами (то есть без похожих последовательностей между подмножествами). Мы сгруппировали все 12 216 PSI: биологические белковые последовательности по 40% -ному порогу сходства с помощью USEARCH, чтобы получить 5050 кластеров с отдаленным межкластерным сходством (см. Раздел 2 и дополнительный рисунок S4). Кластеры были сгруппированы в 10 наборов перекрестной проверки по ~ 1200 последовательностей в каждом.Поскольку около 12% кластеров содержат смесь растворимых и нерастворимых белков, мы избегали выбора репрезентативной последовательности для каждого кластера (дополнительный рисунок S4C). Кроме того, чтобы избежать переобучения из-за сходства последовательностей и несбалансированных классов, мы выполнили 1000 повторных выборок начальной загрузки для каждого шага перекрестной проверки (рис. 2A и дополнительный рис. S5). Мы рассчитали показатели растворимости с использованием оптимизированных весов и показателей AUC для каждого этапа перекрестной проверки, как показано на рисунке 2A. Наши результаты обучения и тестирования AUC были равны 0.72 ± 0,00 и 0,71 ± 0,01, соответственно, демонстрируя улучшение на 7,5% по сравнению с гибкостью в предсказании растворимости (среднее ± стандартное отклонение; фиг. 2B и дополнительная таблица S3).

Рис. 2.

Вывод SWI. ( A ) Блок-схема показывает итеративное уточнение весов аминокислотных остатков для прогнозирования растворимости. На каждом этапе перекрестной проверки использовались отдельные кластеры сходства последовательностей для обучения и тестирования. Кроме того, бутстрапирование использовалось для повторной выборки каждого обучающего набора, избегая обучения и тестирования на аналогичных последовательностях.Оценки растворимости белковых последовательностей рассчитывали с использованием подхода оценки состава последовательностей. Эти оценки использовались для вычисления оценок AUC для наборов данных для обучения и тестирования. ( B ) Обучение и тестовые характеристики предсказания растворимости с использованием оптимизированных весов для 20 аминокислотных остатков при 10-кратной перекрестной проверке (средняя AUC ± стандартное отклонение). Соответствующие данные и цифры доступны в дополнительной таблице S3 и на рисунках S4 и S5. ( C ) Сравнение 20 начальных и конечных масс аминокислотных остатков. Конечные веса W = 〈Vi〉, 1≤i≤10 использовали для расчета показателя растворимости белковой последовательности (SWI) в четырех последующих анализах. Закрашенные кружки, которые представляют собой аминокислотные остатки, окрашены в зависимости от гидрофобности (Kyte and Doolittle, 1982). Сплошные черные кружки обозначают ароматические остатки фенилаланина (F), тирозина (Y), триптофана (W). Пунктирная диагональная линия означает отсутствие изменения веса. См. Также дополнительную таблицу S4. AUC — Площадь под кривой ROC; ROC, рабочая характеристика приемника. (Цветная версия этого рисунка доступна в Интернете по адресу Bioinformatics .)

Рис. 2.

Вывод SWI. ( A ) Блок-схема показывает итеративное уточнение весов аминокислотных остатков для прогнозирования растворимости. На каждом этапе перекрестной проверки использовались отдельные кластеры сходства последовательностей для обучения и тестирования. Кроме того, бутстрапирование использовалось для повторной выборки каждого обучающего набора, избегая обучения и тестирования на аналогичных последовательностях. Оценки растворимости белковых последовательностей рассчитывали с использованием подхода оценки состава последовательностей.Эти оценки использовались для вычисления оценок AUC для наборов данных для обучения и тестирования. ( B ) Обучение и тестовые характеристики предсказания растворимости с использованием оптимизированных весов для 20 аминокислотных остатков при 10-кратной перекрестной проверке (средняя AUC ± стандартное отклонение). Соответствующие данные и цифры доступны в дополнительной таблице S3 и на рисунках S4 и S5. ( C ) Сравнение 20 начальных и конечных масс аминокислотных остатков. Конечные веса W = 〈Vi〉, 1≤i≤10 использовали для расчета показателя растворимости белковой последовательности (SWI) в четырех последующих анализах.Закрашенные кружки, которые представляют собой аминокислотные остатки, окрашены в зависимости от гидрофобности (Kyte and Doolittle, 1982). Сплошные черные кружки обозначают ароматические остатки фенилаланина (F), тирозина (Y), триптофана (W). Пунктирная диагональная линия означает отсутствие изменения веса. См. Также дополнительную таблицу S4. AUC — Площадь под кривой ROC; ROC, рабочая характеристика приемника. (Цветная версия этого рисунка доступна по адресу Bioinformatics онлайн.)

Окончательные веса были получены из средних арифметических весов для отдельных аминокислотных остатков, полученных в результате перекрестной проверки (рис.2 и дополнительная таблица S4). Мы наблюдали более чем 20% изменение веса остатков цистеина (C) и гистидина (H) (рис. 2C и дополнительная таблица S4). Эти результаты согласуются с вкладом остатков цистеина и гистидина, как показано на дополнительном рисунке S2B. Мы называем показатель растворимости белковой последовательности, рассчитанный с использованием конечных весов, SWI: где W i — оптимизированный вес остатка i .

Для проверки результатов перекрестной проверки мы использовали набор данных, не зависящий от PSI: Biology, известный как eSOL (Niwa et al. , 2009) (Дополнительная таблица S1B). Этот набор данных состоит из процентов растворимости белков E.coli , определенных с использованием бесклеточной системы E.coli ( N = 3198). Наша оценка растворимости с использованием конечных весов показала значительное улучшение корреляции с растворимостью белка E.coli по сравнению с исходными весами (нормализованные коэффициенты B Смита и др.) [Коэффициент Спирмена 0,50 ( P ) = 2,51 × 10−205⁠) против 0.40 ( P = 4,57 × 10–120⁠)]. Мы повторили корреляционный анализ, удалив лишние аминокислотные остатки, включая His-теги, из последовательностей eSOL (MRGSHHHHHHTDPALRA и GLCGR на N- и C-концах соответственно). Этот искусственный набор данных был создан на основе предположения, что His-теги мало влияют на растворимость. Мы наблюдали небольшое снижение корреляции для этого искусственного набора данных (rho Спирмена = 0,47, P = 3,67 × 10−176⁠), что может быть связано с влиянием His-меток на растворимость и / или ограничениями. нашего подхода, который может быть более подходящим для гибридных белков His-tag.

Мы выполнили корреляционный анализ Спирмена для наборов данных PSI: Biology и eSOL. SWI показывает самую сильную корреляцию с растворимостью по сравнению со стандартными свойствами и характеристиками различных последовательностей 9920 (рис. 3 и дополнительный рис. S2, соответственно; см. Также дополнительные таблицы S2B, S5 и S6). SWI сильно коррелирует с гибкостью, предполагая, что SWI также является хорошим показателем глобальной структурной гибкости.

Рис. 3.

SWI сильно коррелирует с растворимостью белка.( A ) График корреляционной матрицы растворимости рекомбинантных белков, экспрессируемых в E.coli , и свойств их стандартных белковых последовательностей и SWI. Эти рекомбинантные белки являются мишенями PSI: Biology ( N = 12 216) с бинарным статусом растворимости «Protein_Soluble» или «Tested_Not_Soluble». Соответствующие данные доступны в дополнительной таблице S5. ( B ) График корреляционной матрицы процентов растворимости белков E.coli и свойств их стандартных белковых последовательностей и SWI.Процент растворимости был ранее определен с использованием бесклеточной системы E.coli (eSOL, N = 3198). Соответствующие данные доступны в дополнительной таблице S6. GRAVY, среднее значение гидропатии; PSI: Биология, Инициатива структуры белка: Биология; R s , Ро Спирмена; SWI, взвешенный индекс растворимости

Рис. 3.

SWI сильно коррелирует с растворимостью белка. ( A ) График корреляционной матрицы растворимости рекомбинантных белков, экспрессируемых в E.coli и свойства их стандартных белковых последовательностей и SWI. Эти рекомбинантные белки являются мишенями PSI: Biology ( N = 12 216) с бинарным статусом растворимости «Protein_Soluble» или «Tested_Not_Soluble». Соответствующие данные доступны в дополнительной таблице S5. ( B ) График корреляционной матрицы процентов растворимости белков E. coli и свойств их стандартных белковых последовательностей и SWI. Процент растворимости был ранее определен с использованием E.coli бесклеточная система (eSOL, N = 3198). Соответствующие данные доступны в дополнительной таблице S6. GRAVY, среднее значение гидропатии; PSI: Биология, Инициатива структуры белка: Биология; R s , Ро Спирмена; SWI, взвешенный по растворимости индекс

Мы спросили, можно ли предсказать растворимость белка по поверхностным аминокислотным остаткам. Чтобы ответить на этот вопрос, мы изучили ранее опубликованный набор данных о «липкости» поверхности белка 397 E.coli (Levy et al. , 2012). Этот набор данных имеет аннотацию для поверхностных остатков, основанную на ранее решенных кристаллических структурах белка. Мы наблюдали небольшую корреляцию между «липкостью» поверхности белка и данными о растворимости из eSOL (rho Спирмена = 0,05, P = 0,34, N = 348; дополнительный рисунок S6A). Затем мы оценили, достаточно ли оценки аминокислотного состава с использованием поверхностных остатков, при которой оптимизация только весов поверхностных остатков должна привести к аналогичным или лучшим результатам, чем SWI.Как и выше, мы итеративно уточняли веса поверхностных остатков, используя алгоритм оптимизации Нелдера – Мида. Метод был инициализирован Smith et al. Нормализованные -факторы B и максимальный коэффициент корреляции были целью. Однако при сходимости была получена низкая корреляция (rho Спирмена = 0,18, P = 7,20 × 10–4⁠; дополнительный рисунок S6B). Напротив, SWI полноразмерных последовательностей имеет гораздо более сильную корреляцию с растворимостью (rho Спирмена = 0.46, P = 2,97 × 10−19⁠; Дополнительный рис. S6C). Эти результаты показывают, что полноразмерные последовательности вносят вклад в растворимость белка, а не только поверхностные остатки, предполагая, что растворимость модулируется котрансляционным фолдингом (Davis et al. , 1999; Natan et al. , 2018).

Чтобы понять свойства растворимых и нерастворимых белков, мы определили обогащение аминокислотных остатков в PSI: Biology мишенях относительно последовательностей eSOL (см. Раздел 2).Мы заметили, что мишени PSI: Biology обогащены заряженными остатками лизина (K), глутаматом (E) и аспартатом (D) и обеднены ароматическими остатками триптофана (W), хотя и в меньшей степени для нерастворимых белков (дополнительный рис. S7A). Как и ожидалось, остатки цистеина (C) обогащены нерастворимыми белками PSI: Biology, что подтверждает предыдущие выводы о том, что остатки цистеина способствуют плохой растворимости в системе экспрессии E.coli (Diaz et al. , 2010; Wilkinson and Harrison , 1991).

Кроме того, мы сравнили распределение оценок растворимых и нерастворимых белков по шкале SWI в наборах данных PSI: Biology и eSOL. Мы включили анализ случайных последовательностей, чтобы подтвердить, может ли SWI различать биологические и случайные последовательности. В целом, баллы SWI растворимых белков выше, чем баллы нерастворимых белков (дополнительный рисунок S7B), а баллы SWI истинных биологических последовательностей выше, чем баллы случайных последовательностей, что устраняет нашу озабоченность по поводу потенциального недостатка этой независимой позиции. , подход к оценке композиции последовательности.

«> 3.3 SWI превосходит многие инструменты для прогнозирования растворимости белков

Чтобы подтвердить полезность SWI для прогнозирования растворимости, мы сравнили SWI с существующими инструментами CamSol v2.1 (Sormanni et al. , 2015, 2017), ccSOL omics (Agostini et al. , 2014), DeepSol v0 .3 (Khurana et al. , 2018), PaRSnIP (Rawi et al. , 2018), Protein-Sol (Hebditch et al. , 2017) и модель Уилкинсона-Харрисона (Davis et al., 1999; Харрисон, 2000; Уилкинсон и Харрисон, 1991). Мы не включили специализированные инструменты, которые моделируют структурную информацию белка, такую ​​как геометрия поверхности, поверхностные заряды и доступность растворителя, потому что эти инструменты требуют предварительных знаний о третичной структуре белка. Например, Aggrescan3D и SOLart принимают только файлы PDB, которые можно либо загрузить из банка данных белков, либо создать с помощью программы моделирования гомологии (Hou et al. , 2019; Kuriata et al., 2019).

SWI превосходит другие инструменты, за исключением Protein-Sol, в прогнозировании растворимости белка E.coli (рис. 4A и таблица 1). Результаты теста AUC для SWI также были менее вариабельными, чем у большинства других инструментов, что позволяет предположить, что SWI менее склонен к переобучению (рис. 2A и 4A). Наша программа SWI C также является самым быстрым алгоритмом прогнозирования растворимости (рис. 4B, таблица 1 и дополнительная таблица S7).

Рис. 4.

SWI превосходит существующие инструменты прогнозирования растворимости белков.( A ) Точность прогнозирования инструментов прогнозирования растворимости с использованием вышеуказанных наборов перекрестной проверки (рис. 2A). Для SWI показатели AUC теста были рассчитаны на основе 10-кратной перекрестной проверки (т. Е. В виде прямоугольной диаграммы на фиг. 2B). Для других инструментов перекрестная проверка не проводилась, поскольку показатели AUC рассчитывались непосредственно из отдельных подмножеств, используемых для перекрестной проверки. CamSol и ccSOL omics доступны только как веб-серверы (без цветов заливки). ( B ) Время стенок инструментов для прогнозирования растворимости белков на последовательность (логарифмическая шкала).Все инструменты командной строки запускались трижды с использованием 10 последовательностей, выбранных из наборов данных PSI: Biology и eSOL. Связанные данные доступны в дополнительной таблице S7. AUC — Площадь под кривой ROC; PSI: Биология, Инициатива структуры белка: Биология; ROC, рабочая характеристика приемника; SWI, взвешенный индекс растворимости; с, секунды. (Цветная версия этого рисунка доступна на сайте Bioinformatics онлайн.)

Рис. 4.

SWI превосходит существующие инструменты прогнозирования растворимости белков.( A ) Точность прогнозирования инструментов прогнозирования растворимости с использованием вышеуказанных наборов перекрестной проверки (рис. 2A). Для SWI показатели AUC теста были рассчитаны на основе 10-кратной перекрестной проверки (т. Е. В виде прямоугольной диаграммы на фиг. 2B). Для других инструментов перекрестная проверка не проводилась, поскольку показатели AUC рассчитывались непосредственно из отдельных подмножеств, используемых для перекрестной проверки. CamSol и ccSOL omics доступны только как веб-серверы (без цветов заливки). ( B ) Время стенок инструментов для прогнозирования растворимости белков на последовательность (логарифмическая шкала).Все инструменты командной строки запускались трижды с использованием 10 последовательностей, выбранных из наборов данных PSI: Biology и eSOL. Связанные данные доступны в дополнительной таблице S7. AUC — Площадь под кривой ROC; PSI: Биология, Инициатива структуры белка: Биология; ROC, рабочая характеристика приемника; SWI, взвешенный индекс растворимости; с, секунды. (Цветная версия этого рисунка доступна в Интернете по адресу Bioinformatics .)

, 1994). Структурная гибкость белка была связана с конформными вариациями, функциями, термостабильностью, связыванием лиганда и неупорядоченными областями (Ma, 2005; Radivojac, 2004; Schlessinger and Rost, 2005; Teague, 2003; Vihinen, 1987; Yin et al. , 2011; Юань и др. , 2005). Однако использование гибкости при прогнозировании растворимости было упущено, хотя их взаимосвязь была ранее отмечена (Tsumoto et al. , 2003). В этом исследовании мы показали, что гибкость сильно коррелирует с растворимостью (рис.3). Основываясь на нормированных факторах B , используемых для вычисления гибкости, мы вывели новые независимые от положения и длины веса для оценки растворимости данной белковой последовательности (т. Е. Оценки на основе состава последовательности). Мы называем этот показатель растворимости белка SWI.

При дальнейшем осмотре мы наблюдаем некоторые интересные свойства в SWI. SWI антикоррелирует со склонностью к спирали, GRAVY, ароматичностью и изоэлектрической точкой (рис. 2C и 3), предполагая, что SWI включает в себя ключевые склонности, влияющие на растворимость.Известно, что аминокислотные остатки с более низкой ароматичностью или гидрофильностью улучшают растворимость белка (Han et al. , 2019; Kramer et al. , 2012; Niwa et al. , 2009; Trevino et al. , 2007; Warwicker et al., 2014; Wilkinson and Harrison, 1991). В соответствии с предыдущими исследованиями заряженные остатки аспартата (D), глутамата (E) и лизина (K) связаны с высокой растворимостью, тогда как ароматические остатки фенилаланина (F), триптофана (W) и тирозина (Y) связаны с низкой растворимостью. растворимость (рис.2C и дополнительный рисунок S7). Остаток цистеина (C) имеет самый низкий вес, вероятно, потому что дисульфидные связи не могли быть должным образом образованы в хозяевах экспрессии E.coli (Aslund and Beckwith, 1999; Jia and Jeon, 2016; Rosano and Ceccarelli, 2014; Stewart et al. al. , 1998). Веса, вероятно, различаются, если анализ растворимости был проведен с использованием дефицитных по редуктазе штаммов-хозяев E. coli Origami или эукариотических хозяев.

Сообщалось, что более высокая склонность к спирали увеличивает растворимость (Huang et al., 2012; Идикула-Томас и Баладжи, 2005). Однако наш анализ показал, что склонность к спирали и повороту антикоррелирует с растворимостью, тогда как склонность к слою не коррелирует с растворимостью, указывая тем самым, что неупорядоченные области могут иметь тенденцию быть более растворимыми (Fig. 3). В соответствии с ними SWI имеет более сильные отрицательные корреляции со склонностью к спирали и повороту. Наши результаты также предполагают, что растворимость белка можно в значительной степени объяснить общим аминокислотным составом, а не только поверхностными аминокислотными остатками.Эта идея согласуется с нашим пониманием того, что растворимость и сворачивание белка тесно связаны, а сворачивание происходит котрансляционно, сложный процесс, который управляется различными внутренними и внешними факторами (Chiti et al. , 2003; Davis et al. , 1999; Диас и др. , 2010; Натан и др. , 2018; Тарталья и др. , 2004; Уилкинсон и Харрисон, 1991). Однако неясно, почему склонность к слою мало влияет на растворимость, поскольку β -листы, как было показано, тесно связаны с агрегацией белков (Idicula-Thomas and Balaji, 2005).

Мы пришли к выводу, что SWI — это хорошо сбалансированный индекс, полученный с помощью простого метода оценки композиции последовательности. Чтобы продемонстрировать полезность SWI, мы разработали веб-сервер под названием SoDoPE (https://tisigner.com/sodope). SoDoPE вычисляет вероятность растворимости выбранной пользователем области на основе SWI, которая может быть либо полной, либо частичной последовательностью (см. Раздел 2 и дополнительную таблицу S8). Эта реализация основана на нашем наблюдении, что некоторые белковые домены имеют тенденцию быть более растворимыми, чем другие, и эти растворимые домены могут повышать растворимость белка в целом.Чтобы продемонстрировать этот момент, мы использовали SoDoPE для анализа трех коммерческих моноклональных антител и протеомов коронавирусов тяжелого острого респираторного синдрома (SARS-CoV и SARS-CoV-2) (Marra et al. , 2003; Wang et al. , 2009; Wu et al. , 2020) (дополнительные рисунки S8 и S9). SoDoPE также предоставляет возможности для прогнозирования растворимости в присутствии тегов, повышающих растворимость. Точно так же эти теги слияния могут действовать как растворимые «белковые домены», которые могут перевешивать склонность нерастворимых белков к агрегации.Однако некоторые растворимые слитые белки могут стать нерастворимыми после протеолитического расщепления меток растворимости (Lebendiker and Danieli, 2014). Кроме того, SoDoPE интегрирован с TIsigner, веб-сервисом для оптимизации экспрессии белков (Bhandari et al. , 2019). Этот конвейер обеспечивает целостный подход к улучшению результатов экспрессии рекомбинантного белка.

» data-legacy-id=»ref1″> Список литературы

Acton

T.B.

и другие. (

2005

)

Роботизированная платформа для клонирования и производства белка Северо-восточного консорциума структурной геномики

.

Методы Enzymol

.,

394

,

210

243

.

Агостини

F.

и другие. (

2014

)

ccSOL omics: веб-сервер для прогнозирования растворимости эндогенной и гетерологичной экспрессии в Escherichia coli

.

Биоинформатика

,

30

,

2975

2977

.

Ослунд

,

F.

Беквит

,

Дж.

(

1999

)

Надсемейство тиоредоксинов: избыточность, специфичность и нечестная геномика

.

J. Bacteriol.

,

181

,

1375

1379

.

Bhandari

B.K.

и другие. (

2019

)

Высокодоступные сайты инициации трансляции позволяют предсказать успешную экспрессию гетерологичного белка

.

BioRxiv

,

726752

.

Бхаскаран

Р.

,

Ponnuswamy

P.K.

(

1998

)

Позиционная гибкость аминокислотных остатков в глобулярных белках

.

Внутр. J. Pept. Протеин Res

.,

32

,

241

255

.

Хантер

,

Дж. Д.

Matplotlib: среда 2D-графики

.

Comput. Sci. Англ.

,

9

,

90

95

.

Чан

Вт.-C.

и другие. (

2010

)

Обучение предсказанию эффективности экспрессии векторов в производстве рекомбинантных белков

.

BMC Bioinform

.,

11

,

S21

.

Чен

Л.

и другие. (

2004

)

TargetDB: база данных целевой регистрации для проектов структурной геномики

.

Биоинформатика

,

20

,

2860

2862

.

Чити

F.

и другие. (

2003

)

Рационализация влияния мутаций на скорость агрегации пептидов и белков

.

Природа

,

424

,

805

808

.

Петух

P.J.A.

и другие. (

2009

)

Biopython: свободно доступные инструменты Python для вычислительной молекулярной биологии и биоинформатики

.

Биоинформатика

,

25

,

1422

1423

.

Коста

С.

и другие. (

2014

)

Теги слияния для определения растворимости, очистки и иммуногенности белков в Escherichia coli : новая система fh8

.

Фронт. Микробиол

.,

5

,

63

.

Craveur

P.

и другие. (

2015

)

Гибкость белков в свете структурных алфавитов

.

Фронт. Мол. Biosci

.,

2

,

20

.

Дэвис

Г.Д.

и другие. (

1999

)

Новые системы слитых белков, разработанные для обеспечения растворимой экспрессии в Escherichia coli

.

Biotechnol. Bioeng

.,

65

,

382

388

.

Диас

A.A.

и другие. (

2010

)

Прогнозирование растворимости белка в Escherichia coli с использованием логистической регрессии

.

Biotechnol.Bioeng

.,

105

,

374

383

.

Эдгар

R.C.

(

2010

)

Поиск и кластеризация на порядки быстрее, чем BLAST

.

Биоинформатика

,

26

,

2460

2461

.

Эспозито

D.

,

Chatterjee

D.K.

(

2006

)

Повышение экспрессии растворимого белка за счет использования тегов слияния

.

Curr. Opin. Biotechnol

.,

17

,

353

358

.

Семья

C.

и другие. (

2015

)

Прогнозирование предрасположенности пептидов и белков к образованию амилоида

.

PLoS One

,

10

,

e0134679

.

Хабиби

N.

и другие. (

2014

)

Обзор методов машинного обучения для прогнозирования растворимости сверхэкспрессированных рекомбинантных белков в Escherichia coli

.

BMC Bioinform

.,

15

,

134

.

Хан

,

X.

и др. . (

2020

)

Повышение растворимости и активности белков за счет введения небольших пептидных тегов, разработанных с использованием моделей машинного обучения

.

Метаболические инженерные коммуникации

,

11

,

e00138

.

Харрисон

R.G.

(

2000

)

Экспрессия растворимых гетерологичных белков посредством слияния с белком NusA

.

Инновации

,

11

,

4

7

.

Хебдич

М.

и другие. (

2017

)

Protein-Sol: веб-инструмент для прогнозирования растворимости белка по последовательности

.

Биоинформатика

,

33

,

3098

3100

.

Heckmann

D.

и другие. (

2018

)

Машинное обучение, применяемое к количеству оборота ферментов, выявляет структурные корреляты белков и улучшает метаболические модели

.

Nat. Коммуна

.,

9

,

5252

.

Хиросе

С.

,

Ногучи

т.

(

2013

)

ESPRESSO: система для оценки экспрессии и растворимости белков в системах экспрессии белков

.

Протеомика

,

13

,

1444

1456

.

Hou

Q.

и другие. (

2018

)

Вычислительный анализ аминокислотных взаимодействий, которые способствуют или снижают растворимость белка

.

Sci. Представитель

.,

8

,

14661

.

Hou

Q.

и другие. (

2019

)

SOLart: основанный на структуре метод прогнозирования растворимости и агрегации белков

.

Биоинформатика

,

36

,

1445

1452

.

Huang

H.-L.

и другие. (

2012

)

Прогнозирование и анализ растворимости белка с использованием нового метода оценочной карты с дипептидным составом

.

BMC Bioinform

.,

13

,

S3

.

Идикула-Томас

S.

,

Баладжи

П.В.

(

2005

)

Понимание взаимосвязи между первичной структурой белков и их склонностью к растворимости при сверхэкспрессии в Escherichia coli

.

Protein Sci

.,

14

,

582

592

.

Цзя

Б.

,

Jeon

C.О.

(

2016

)

Высокопроизводительная экспрессия рекомбинантного белка в Escherichia coli : текущее состояние и перспективы на будущее

.

Открыть Биол

.,

6

,

160196

.

Karplus

P.A.

,

Schulz

G.E.

(

1985

)

Прогнозирование гибкости цепи в белках

.

Naturwissenschaften

,

72

,

212

213

.

Хурана

С.

и другие. (

2018

)

DeepSol: платформа глубокого обучения для предсказания растворимости белков на основе последовательностей

.

Биоинформатика

,

34

,

2605

2613

.

Kramer

R.M.

и другие. (

2012

)

На пути к молекулярному пониманию растворимости белков: повышенный отрицательный поверхностный заряд коррелирует с повышенной растворимостью

.

Biophys. J

.,

102

,

1907

1915

.

Куриата

A.

и другие. (

2019

)

Aggrescan3D (A3D) 2.0: прогноз и инженерия растворимости белка

.

Nucleic Acids Res

.,

47

,

W300

W307

.

Kyte

J.

,

Дулиттл

Р.Ф.

(

1982

)

Простой метод отображения гидропатического характера белка

.

J. Mol. Биол

.,

157

,

105

132

.

Лебендикер

м.

,

Danieli

T.

(

2014

)

Производство белков, склонных к агрегированию

.

FEBS Lett

.,

588

,

236

246

.

Леви

E.D.

и другие. (

2012

)

Клеточное скопление накладывает глобальные ограничения на химию и эволюцию протеомов

.

Proc. Natl. Акад. Sci. США

,

109

,

20461

20466

.

млн лет

Дж

(

2005

)

Полезность и ограничения анализа нормального режима при моделировании динамики биомолекулярных комплексов

.

Структура

,

13

,

373

380

.

Марра

M.A.

и другие. (

2003

)

Последовательность генома коронавируса, ассоциированного с SARS

.

Наука

,

300

,

1399

1404

.

McKinney

W.

(

2010

)

Структуры данных для статистических вычислений в Python

. В. Труды 9-й конференции «Питон в науке» .

51

56

.

Millman

K.J.

,

Айвазис

м.

(

2011

)

Python для ученых и инженеров

.

Comput. Sci. Eng

.,

13

,

9

12

.

Натан

E.

и другие. (

2018

)

Котрансляционная сборка белков накладывает эволюционные ограничения на гомомерные белки

.

Nat. Struct. Мол. Биол

.,

25

,

279

288

.

Nelder

J.A.

,

Мед

р.

(

1965

)

Симплексный метод минимизации функции

.

Comput. J

.,

7

,

308

313

.

Нива

т.

и другие. (

2009

)

Бимодальное распределение растворимости белков, выявленное с помощью агрегационного анализа всего ансамбля белков Escherichia coli

.

Proc. Natl. Акад. Sci. США

,

106

,

4201

4206

.

Олифант

T.E.

(

2007

)

Python для научных вычислений

.

Comput. Sci. Eng

.,

9

,

10

20

.

Pedregosa

F.

и другие. (

2011

)

Scikit-learn: машинное обучение на Python

.

J. Mach. Учиться. Res

.,

12

,

2825

2830

.

Гончар

S.C.

и другие. (

2018

)

Веб-сервер HMMER: обновление 2018

.

Nucleic Acids Res

.,

46

,

W200

W204

.

Radivojac

P.

(

2004

)

Гибкость белков и внутреннее нарушение

.

Protein Sci

.,

13

,

71

80

.

Рагон

р.

и другие. (

1989

)

График гибкости белков

.

Protein Eng

.,

2

,

497

504

.

Рави

,

р.

и др. .(

2018

)

PaRSnIP: предсказание растворимости белков на основе последовательностей с использованием машины для повышения градиента

.

Биоинформатика

,

34

,

1092

1098

.

Росано

Г.Л.

,

Ceccarelli

E.A.

(

2014

)

Экспрессия рекомбинантного белка в Escherichia coli : достижения и проблемы

.

Фронт. Микробиол

.,

5

,

172

.

Schlessinger

A.

,

Рост

Б.

(

2005

)

Гибкость и жесткость белка предсказаны на основе последовательности

.

Белки

,

61

,

115

126

.

Seabold

S.

а также

Perktold

J.

(

2010

).

Statsmodels: эконометрическое и статистическое моделирование с помощью python

. В. Труды 9-й конференции «Питон в науке» .

57

61

.

Seiler

C.Y.

и другие. (

2014

)

Плазмида DNASU и PSI: хранилища биологических материалов: ресурсы для ускорения биологических исследований

.

Nucleic Acids Res

.,

42

,

D1253

D1260

.

Smith

D.K.

и другие. (

2003

)

Улучшенные параметры гибкости аминокислот

.

Protein Sci

.,

12

,

1060

1072

.

Сорманни

P.

и другие. (

2015

)

CamSol — метод рационального конструирования мутантов белков с повышенной растворимостью

.

J. Mol. Биол

.,

427

,

478

490

.

Сорманни

P.

и другие. (

2017

)

Быстрый и точный скрининг in silico растворимости библиотеки моноклональных антител

.

Sci. Представитель

.,

7

,

8200

.

Стюарт

E.J.

и другие. (

1998

)

Образование дисульфидной связи в цитоплазме Escherichia coli : изменение роли тиоредоксинов in vivo

.

EMBO J

.,

17

,

5543

5550

.

Тарталья

G.G.

и другие. (

2004

)

Роль ароматичности, открытой поверхности и дипольного момента в определении скорости агрегации белка

.

Protein Sci

.,

13

,

1939

1941

.

Тиг

S.J.

(

2003

)

Влияние гибкости белков на открытие лекарств

.

Nat. Rev. Drug Discov

.,

2

,

527

541

.

Trevino

S.R.

и другие. (

2007

)

Вклад аминокислот в растворимость белка: Asp, Glu и Ser вносят более благоприятный вклад, чем другие гидрофильные аминокислоты в РНКазе Sa

.

J. Mol. Биол

.,

366

,

449

460

.

Цумото

К.

и другие. (

2003

)

Практические рекомендации по рефолдингу белков из телец включения

.

Protein Expr. Purif

.,

28

,

1

8

.

van der Walt

S.

и другие. (

2011

)

Массив NumPy: структура для эффективных численных вычислений

.

Comput. Sci. Eng

.,

13

,

22

30

.

Вихинен

М.

(

1987

)

Связь гибкости белка с термостабильностью

.

Protein Eng

.,

1

,

477

480

.

Вихинен

М.

и другие. (

1994

)

Точность прогнозов гибкости белка

.

Белки

,

19

,

141

149

.

Waldo

G.S.

(

2003

)

Генетический скрининг и направленная эволюция растворимости белков

.

Curr. Opin. Chem. Биол

.,

7

,

33

38

.

Ван

X.

и другие. (

2009

)

Области потенциальной агрегации в биотерапевтических препаратах: обзор коммерческих моноклональных антител

.

МАБ

,

1

,

254

267

.

Warwicker

J.

и другие. (

2014

)

Содержание лизина и аргинина в белках: вычислительный анализ предлагает новый инструмент для расчета растворимости

.

Мол. Фарм

.,

11

,

294

303

.

Васком

м.

и другие. (

2018

) seaborn: v0.9.0. .

Wilkinson

D.L.

,

Харрисон

R.G.

(

1991

)

Прогнозирование растворимости рекомбинантных белков в Escherichia coli

.

Биотехнология

,

9

,

443

448

.

Wu

Z.

и другие. (

2019

)

Направленная эволюция белков с помощью машинного обучения с комбинаторными библиотеками

.

Proc. Natl. Акад. Sci. США

,

116

,

8852

8858

.

Wu

F.

и другие. (

2020

)

Новый коронавирус, связанный с респираторным заболеванием человека в Китае

.

Природа

,

579

,

265

269

.

Сяо

Н.

и другие. (

2015

)

Protr / ProtrWeb: пакет R и веб-сервер для создания различных схем числового представления последовательностей белков

.

Биоинформатика

,

31

,

1857

1859

.

Сяо

р.

и другие. (

2010

)

Платформа для производства высокопроизводительных образцов белка северо-восточного консорциума структурной геномики

.

J. Struct. Биол

.,

172

,

21

33

.

Ян

К.К.

и другие. (

2019

)

Направленная эволюция белковой инженерии под управлением машинного обучения

.

Nat. Методы

,

16

,

687

694

.

Инь

H.

и другие. (

2011

)

О связи между гибкостью остатков и взаимодействиями остатков в белках

.

Протеиновый пепт. Lett

.,

18

,

450

456

.

Юань

Z.

и другие. (

2005

)

Прогнозирование профилей протеина B-фактора

.

Белки

,

58

,

905

912

.

© Автор (ы) 2020. Опубликовано Oxford University Press.

Это статья в открытом доступе, распространяемая в соответствии с условиями лицензии Creative Commons Attribution License (http: // creativecommons.org / licenses / by / 4.0 /), который разрешает неограниченное повторное использование, распространение и воспроизведение на любом носителе при условии правильного цитирования оригинальной работы.

оценивает производительность объекта «glmnet», используя тестовые данные. — Assessment.glmnet • glmnet

Получите набор тестов, выполните сводные измерения производительности для glmnet. модель (ы)

 Assessment.glmnet (
  объект,
  newx = NULL,
  новый
  веса = NULL,
  family = c («гауссовский», «биномиальный», «пуассоновский», «полиномиальный», «cox», «mgaussian»),
  ...
)

путаница.glmnet (
  объект,
  newx = NULL,
  новый
  family = c («биномиальный», «полиномиальный»),
  ...
)

roc.glmnet (объект, newx = NULL, newy, ...) 

Аргументы

объект

Встроенный "glmnet" или "cv.glmnet" , "расслабленный" или "cv.relaxed" объект, ИЛИ матрица прогнозов (для roc.glmnet или Assessment.glmnet ). Для roc.glmnet модель должно быть «двучленом», и для путаница.glmnet должен быть либо «биномиальный» или «полиномиальный»

новыйx

Если нужно делать прогнозы, это значения «x». Необходимый для путаницы.glmnet

новый

обязательный аргумент для всех функций; новые значения ответа

гири

Для наблюдательных гирь для контрольных наблюдений

семья

Семейство модели, если прогнозы передаются как ‘объект’

дополнительных аргумента к predic.glmnet , когда «объект» является «glmnet» подходит, и для получения статистики необходимо делать прогнозы.

Значение

Assessment.glmnet создает список векторов показателей. roc.glmnet список матриц с двумя столбцами ‘roc’, и confusion.glmnet список таблиц. Если одно предсказание при условии, или прогнозы сделаны на основе объекта CV, последние два отбрасывают перечислить статус и создать единую матрицу или таблицу.

Детали

Assessment.glmnet производит все различные измерения производительности предоставляется cv.glmnet для каждой из семей. Один вектор или может быть предоставлена ​​матрица прогнозов, объекты подобранной модели или CV объекты. В случае, когда прогнозы еще предстоит сделать, ... аргументов позволяют, например, «смещения» и другие прогнозы. параметры, такие как значения «гаммы» для «расслабленных» аппроксимаций. roc.glmnet создает для одного вектора двухколоночную матрицу со столбцами TPR и FPR (процент истинных положительных и ложных положительных результатов).Этот объект можно нанести на построить кривую ROC. Если требуется более одного прогноза, тогда составлен список таких матриц. confusion.glmnet производит матрица путаницы, содержащая результаты классификации. Опять же, сингл таблица или список с методом печати.

См. Также

Автор

Trevor Hastie and Rob Tibshirani
Сопровождающий: Trevor Hastie [email protected]

Примеры

данные (QuickStartExample)
x <- QuickStartExample $ x; y <- Пример быстрого запуска $ y
установленный.семя (11)
поезд = образец (seq (длина (y)), 70, replace = FALSE)
fit1 = glmnet (x [поезд,], y [поезд])
оценить.glmnet (fit1, newx = x [-train,], newy = y [-train])
#> $ mse
#> s0 s1 s2 s3 s4 s5 s6
#> 10.5356884 10.0473027 9.5757375 8.7448060 8.0414304 7.4451552 6.8302096
#> s7 s8 s9 s10 s11 s12 s13
#> 6.2099274 5.5979797 4.8

7 4.2620453 3.7367187 3.2983155 2.

91 #> s14 s15 s16 s17 s18 s19 s20 #> 2.6265064 2.3709330 2.1242795 1.

51 1.7587268 1.6226452 1.50

#> s21 s22 s23 s24 s25 s26 s27 #> 1.4144863 1.3354649 1.2694776 1.2143453 1.1682560 1.1297026 1.0974313 #> s28 s29 s30 s31 s32 s33 s34 #> 1.0652936 1.0249928 0.94 0.9659219 0.9435578 0.

72 0.85 #> s35 s36 s37 s38 s39 s40 s41 #> 0.8970118 0,8866020 0,8773197 0,8703946 0,8648273 0,8609494 0,8597018 #> s42 s43 s44 s45 s46 s47 s48 #> 0,8588511 0,8629691 0,8674411 0,8722799 0,8776263 0,8827885 0,8870380 #> s49 s50 s51 s52 s53 s54 s55 #> 0,87 0,8951440 0,8989787 0,27 0,81 0,51 0,02 #> s56 s57 s58 s59 s60 s61 s62 #> 0.

74 0,

97 0,

68 0,

07 0,21 0,93 0,74 #> s63 s64 s65 s66 s67 s68 #> 0,37 0,93

0,9411642 0,9426805 0,9445011 0,9458195 #> attr (, "мера") #> [1] «Среднеквадратичная ошибка» #> #> $ mae #> s0 s1 s2 s3 s4 s5 s6 s7 #> 2.6946299 2.6328780 2.5673994 2.4405206 2.3249133 2.2195763 2.1151049 2.0115127 #> s8 s9 s10 s11 s12 s13 s14 s15 #> 1.69 1.7718821 1.6518698 1.5453805 1.4483515 1.3599423 1.27 1.2066589 #> s16 s17 s18 s19 s20 s21 s22 s23 #> 1.1339882 1.0695296 1.0150683 0.9781225 0.9498621 0.

23 0.

01 0.8811996 #> s24 s25 s26 s27 s28 s29 s30 s31 #> 0,8651666 0,8551227 0,8495833 0,8445360 0,8380969 0,8279767 0,8194392 0,8094367 #> s32 s33 s34 s35 s36 s37 s38 s39 #> 0.7996659 0,76 0,7838971 0,7794754 0,7754465 0,7704058 0,7660117 0,7621631 #> s40 s41 s42 s43 s44 s45 s46 s47 #> 0,7588402 0,7581804 0,7579210 0,7600092 0,7619297 0,7637101 0,7657734 0,7688329 #> s48 s49 s50 s51 s52 s53 s54 s55 #> 0,7717302 0,7744494 0,7769264 0,7797273 0,7827940 0,7855762 0,7881095 0,77 #> s56 s57 s58 s59 s60 s61 s62 s63 #> 0.7

9 0,7943038 0,7960365 0,7976354 0,79 0,8004283 0,8016421 0,8027481 #> s64 s65 s66 s67 s68 #> 0.8037558 0.8046740 0.8053809 0.8062495 0.8068503 #> attr (, "мера") #> [1] «Средняя абсолютная ошибка» #> preds = preds (fit1, newx = x [-train,], s = c (1, 0,25)) Assessment.glmnet (preds, newy = y [-train], family = "gaussian") #> $ mse #> s1 s2 #> 7.312414 1.498532 #> attr (, "мера") #> [1] «Среднеквадратичная ошибка» #> #> $ mae #> s1 s2 #> 2.1976089 0,9470799 #> attr (, "мера") #> [1] «Средняя абсолютная ошибка» #> fit1c = cv.glmnet (x, y, держать = ИСТИНА) fit1a = Assessment.glmnet (fit1c $ fit.preval, newy = y, family = "gaussian") plot (fit1c $ lambda, log = "x", fit1a $ mae, xlab = "Log Lambda", ylab = "Средняя абсолютная ошибка") abline (v = fit1c $ lambda.min, lty = 2, col = "красный") данные (BinomialExample) x <- Биномиальный пример $ x; y <- Биномиальный пример $ y fit2 = glmnet (x [поезд,], y [поезд], family = "биномиальный") оценить.glmnet (fit2, newx = x [-train,], newy = y [-train], s = 0.1) #> $ deviance #> s1 #> 1.037535 #> attr (, "мера") #> [1] «Биномиальное отклонение» #> #> $ class #> s1 #> 0.1333333 #> attr (, "мера") #> [1] "Ошибка неправильной классификации" #> #> $ auc #> [1] 0,52 #> attr (, "мера") #> [1] "AUC" #> #> $ mse #> s1 #> 0,333371 #> attr (, "мера") #> [1] «Среднеквадратичная ошибка» #> #> $ mae #> s1 #> 0.77 #> attr (, "мера") #> [1] «Средняя абсолютная ошибка» #> сюжет (roc.glmnet (fit2, newx = x [-train,], newy = y [-train]) [[10]]) fit2c = cv.glmnet (x, y, family = "binomial", keep = TRUE) idmin = соответствие (fit2c $ lambda.min, fit2c $ lambda) сюжет (roc.glmnet (fit2c $ fit.preval, newy = y) [[idmin]]) данные (MultinomialExample) x <- MultinomialExample $ x; y <- Многочлен Пример $ y набор. семян (103) поезд = образец (seq (длина (y)), 100, replace = FALSE) fit3 = glmnet (x [поезд,], y [поезд], family = "мультиномиальный") confusion.glmnet (fit3, newx = x [-train,], newy = y [-train], s = 0,01) #> Верно #> Прогноз 1 2 3 Итого #> 1 55 44 23 122 #> 2 29 82 17 128 #> 3 25 23 102 150 #> Всего 109 149 142 400 #> #> Правильный процент: 0.5975 fit3c = cv.glmnet (x, y, family = "multinomial", type.measure = "class", keep = TRUE) idmin = соответствие (fit3c $ lambda.min, fit3c $ lambda) confusion.glmnet (fit3c $ fit.preval, newy = y, family = "multinomial") [[idmin]] #> Верно #> Прогноз 1 2 3 Итого #> 1 71 22 13 106 #> 2 39 127 26 192 #> 3 32 25 145 202 #> Всего 142 174 184 500 #> #> Правильный процент: 0,686

Быстрый алгоритм для объективной оценки дисперсии AUC на основе динамического программирования

% PDF-1.5 % 1 0 объект > поток application / pdf

  • IEEE
  • IEEE Access; 2016; 4; ; 10.1109 / ACCESS.2016.2628102
  • Площадь под кривой (AUC)
  • динамическое программирование
  • U-статистика Манна-Уитни (MWUS)
  • рабочая характеристика приемника (ROC)
  • Быстрый алгоритм для несмещенной оценки дисперсии на основе AUC по динамическому программированию
  • Weichao Xu
  • Shun Liu
  • Xu Sun
  • Siyang Liu
  • Yun Zhang
  • IEEE Access9553 2016410.1109 / ACCESS.2016.26281029560 конечный поток эндобдж 2 0 obj > поток HlWSg @HBQius \: @ HnVPs ڙ: vqTI $ IȾ /; "[$! T; # & N {ɽ7GGIwpFfɤZd6 [: ^ // 4rB $ RHB '% 쌋 ۙ HL9 {R ޕ

    TT7> i> f2 & dX ז X [b00acl, p ^ 9 S'ZZLjTZ / QyeUU @ 1Z9 ݓ ~ vz \ thvnaqŋ ՗ / 7 c ($ "nomYF} SKK [GwOOggW ߀9 a ;.Vt4ZLZ fͪ7 բ _ * = 4 D&R (d2 MN ڵ 㝸 xGJ: tyԨ , ܢ Hn =% ycI1`slP | x2)) c_ K5F [kA! BQ_, | D

    пакет R для построения модели и выбора признаков с ошибочными классификациями [PeerJ]

    Введение

    Обучение модели - важная задача в биомедицинских исследованиях для оценки данных omics, например, для задач классификации. Характеристики, включенные в модель и используемые для классификации, могут указывать на лежащие в основе (биологические) процессы или механизмы.

    Такие классификации в биомедицинских исследованиях часто кодируются человеческим оценщиком как бинарные, например.g., данное иммуногистохимическое окрашивание можно классифицировать как положительное / отрицательное (1/0) или как полуколичественный балл (например, 0–5) для градуированной оценки (Balermpas et al., 2017; Knoll et al. , 2016). Часто представляют интерес связанные изменения на молекулярном уровне, измеренные, например, путем анализа данных экспрессии или метилирования с массивами / секвенированием, дающими большое количество признаков.

    Двоичные данные результатов можно смоделировать с помощью логистической регрессии, обобщенной линейной модели (GLM) с функцией логит-связи (Hastie & Tibshirani, 1986; McCullagh & Nelder, 1989).Полуколичественные данные можно оценивать с помощью линейных моделей.

    Для обучения модели полная оценка всех комбинаций функций обычно невозможна (большое количество функций), а стандартные GLM не могут быть обучены для количества функций> количества наблюдений, что требует использования эвристики для предварительной фильтрации функций. Затем набор оставшихся функций можно использовать для обучения модели, например, используя обратный выбор в сочетании с информационным критерием (Akaike, 1973).

    Подбор модели обычно оценивается по их способности предсказывать наблюдаемые данные («степень соответствия»). Однако последние могут содержать ошибочные присвоения, возникающие, например, из множества источников (технические трудности, выборка или человеческая ошибка). Таким образом, принуждение модели соответствовать наблюдаемым, а не истинным базовым группам может привести к выбору несоответствующих характеристик.

    Поэтому мы предлагаем использовать эвристику для предварительной фильтрации признаков перед построением модели, которая меняет роль зависимых (классификационных) / независимых (признаков) переменных, выполняет тесты на различия и перекрестную проверку данных с измененными ролями зависимых / независимых переменных. и использовать только сохраненные элементы для последующего построения модели.

    Его производительность сравнивается со стандартным подходом перекрестной проверки (необратимые роли переменных) в смоделированных данных. Оцениваются двоичные и полуколичественные кодировки (с добавленными ошибками) в объектах, отобранных из двух или более популяций, и оценивается способность обоих подходов выбирать значимые признаки (высокое перекрытие с известной достоверностью).

    Мы предоставляем пакет R для упрощения (сравнительного) анализа с предложенной эвристикой, доступный на github (http: // github.com / mknoll / modelBuildR).

    Методы

    Методы выбора признаков

    Два метода выбора оцениваемых признаков показаны на рис. 1B и 2. Вариант 2 (V2) использует перекрестную проверку для получения порядка отдельных функций (одномерный тест) с использованием (ошибочной) классификации в качестве зависимой переменной. Для двоичных результатов использовалась cv.binary () из пакета DAAG (Maindonald & Braun, 2020), а для полуколичественных результатов использовалась cv.lm () (параметры по умолчанию, рис.3). Для выбора модели были выбраны первые n функций с наименьшими ошибками перекрестной проверки или наивысшей точностью, при этом n - это количество оцененных выборок (здесь: 50). Дальнейшая обработка была аналогичной для обоих оцениваемых методов. Вариант 1 меняет роль зависимых (классификационных) / независимых (признаков) переменных на начальном этапе фильтрации признаков. Во-первых, значительное влияние наблюдаемой классификации на каждую измеряемую характеристику проверяется с использованием линейной модели и расчета значений модели p (нулевые и полные модели, тест отношения правдоподобия, LRT). P -значения затем скорректированы с учетом множественности, корректировка Бенджамини – Хохберга и Бонферрони была оценена, все особенности с скорректированными p -значениями ниже 0,05 ( p ∗ = 0,05, рис. 1B) были сохранены. Затем был выполнен этап перекрестной проверки, сохраняя инвертированные роли независимых / зависимых переменных. Наконец, первые n функций с наименьшими ошибками перекрестной проверки были использованы для дальнейшего анализа, где n было минимальным из количества оставшихся функций и количества выборок.Для следующего шага, аналогичного варианту 2, предполагались исходные роли зависимых и независимых переменных (классификация: зависимая переменная). Построение модели было выполнено путем обратного выбора модели с использованием AIC, с логистической регрессией для двоичных результатов и линейной моделью для полуколичественной классификации. Затем прогнозы сравнивались с известной основной истинностью группы путем вычисления AUC с помощью pROC :: roc () (Robin et al., 2011) для двоичных и pROC :: multiclass.roc () для полуколичественных классификаций (рис.2). Оценивали AUC и AUC (методы связывания: среднее, случайное).

    Рисунок 1: Построение модели для данной классификации с использованием многомерных данных.
    (A) Основные шаги в построении модели и описание решаемой впоследствии проблемы потенциальной ошибочной классификации. (B) Сравнительно оцененные стратегии предварительной фильтрации / упорядочения функций перед построением модели и описание того, как оценивается производительность модели.
    Рисунок 2: Смоделированные данные для двоичной (A) и полуколичественной классификации (B) и введение ошибок, используемых для оценки подходов к выбору признаков / построению модели.
    Наблюдаемая классификация была взята из биномиального распределения для различных вероятностей для каждой группы, для полуколичественных данных предполагалось равное расстояние между классами, и ошибки были добавлены на основе данных, выбранных из биномиальных распределений.
    Рисунок 3: Обзор функций, реализованных в пакете modelBuildR, и необходимых параметров.
    (A) Создание объекта fitModel для анализа. (B) Предварительная фильтрация функций.(C) Подходы к перекрестной проверке. (D) Окончательная примерка модели.

    Расчетные данные

    Обзор смоделированных данных дает рис. 2. Были протестированы два общих случая: бинарная классификация и полуколичественная градуированная классификация вместе с многомерными данными. Чтобы сохранить разумное время расчета, в 50 выборках было оценено всего 100 характеристик. Предполагалось, что только часть признаков (~ 10%, выборка с помощью runif ()) показывает различия между группами.Для двух групповых анализов они были взяты из двух нормальных распределений с различными различиями в средних и стандартных отклонениях. Для более чем двух классов различия между средними значениями последующих классов / распределений были постоянными, как и их стандартные отклонения. Размеры групп были сбалансированы, если это было невозможно, количество выборки группы с наивысшим рейтингом было расширено. Для обеспечения воспроизводимости использовали фиксированные семена. Ошибки в классификациях были введены следующим образом: для бинарной классификации соответствующее групповое назначение было извлечено из биномиального распределения, что дало 0,1 с вероятностями вероятность 1 и вероятность 2.Для большего количества классов вектор из 0,1 значений был получен аналогично для вероятности prob1 и вычтен из истинной классификации. Абсолютные значения использовались как ошибочная классификация. Воспроизводимый код и анализы доступны в виде капсулы CodeOcean: https://codeocean.com/capsule/3333162/tree/v1.

    Модель

    BuildR пакет

    Представленные анализы были выполнены с помощью пакета modelBuildR. Обзор его функциональных возможностей представлен на рис.3, дополнительные функциональные возможности указаны в виньетке пакета.

    Конструктору для нового экземпляра fitModel требуются данные функции data.frame с функциями в строках и выборками в столбцах, метаданные data.frame с выборками в строках и ковариатами в столбцах, спецификация классификационной (зависимой) переменной var и тип модели для обучения (type, lr для логистической регрессии и lm для линейной модели). Оценка связи переменной классификации с измерениями признаков выполняется с помощью testSign (), ожидая параметра настройки множественности (pAdj, все разрешенные методы из stats :: p.Adjust ()) и отсечка значения p (pCut). Реализованы различные методы перекрестной проверки, cv () выполняет перекрестную проверку инвертированных ролей зависимых / независимых переменных, как описано выше (рис. 1B и 2). cvB () и cvL () выполняют перекрестную проверку неинвертированных ролей переменных. fitM (), наконец, выполняет обучение модели с помощью функции R stats :: step () с параметрами по умолчанию (с использованием AIC или BIC) или с использованием подхода перекрестной проверки (см. дополнительные методы).

    В дополнение к ранее описанному анализу, этап предварительного выбора признаков также может быть выполнен с включением дополнительных ковариат (как для оценки модели, так и для этапа перекрестной проверки, подробности см. В виньетке пакета: виньетка («modelBuildR»)).

    Данные Omics и альтернативные методы выбора функций

    450k данных о метилировании человека Illumina и клиническая информация когорты TCGA-GBM были получены через портал данных GDC 07.11.2019. Если не указано иное, для анализа использовали данные метилирования, преобразованные методом логита (значения M ). Классификация G-CIMP проводилась следующим образом: L = 282,7 + 114,2 * cg064, p = exp ( L ) / (1 + exp ( L )).Образцы с p <0,5 были классифицированы как CIMP- и CIMP + в противном случае. Пакет glmnet (Friedman, Hastie & Tibshirani, 2010) использовался для регрессии лассо с использованием перекрестной проверки для выбора подходящего значения лямбда и randomForest (Liaw & Wiener, 2002) для случайного анализа лесов. Использовались тесты Стьюдента t . Оптимальные пороги прогностического разделения (минимальное значение p ) были рассчитаны с помощью dataAnalysisMisc :: findOptCutoff () (dataAnalysisMisc, 2020).Пакет pvclust (pvclust, 2019) использовался для согласованной кластеризации, пакет umap R в сочетании с umap-learn для уменьшения размерности (Konopka, 2020; McInnes & Healy, 2018). Уровень значимости альфа был зафиксирован на уровне 0,05 (двусторонний).

    Результаты

    Полуколичественная классификация и истинные градуированные различия в исходных данных

    Подгонка модели (> 0 как существенно отличающиеся идентифицированные признаки, pAdj <0.05, корректировка Бенджамини – Хохберга) чаще оказывалась успешной при использовании V2. V1 показал более низкие доли для меньшего числа категорий (успешное соответствие модели, эталон V2: медиана: 88%, диапазон: 70–97%, рис. 4A). Наблюдаемые медианы AUC были сходными между V1 и V2 (фиг. 4B) и не различались между методами корректировки значений p (V1, фиг. 4B). AUC, стратифицированные по количеству истинных основных групп и средней разнице для корректировок BH и Бонферрони, показаны на рис. S2 + S3. Различия между V1 / V2 наблюдаемых AUC уменьшались для увеличения числа категорий, единичные выбросы наблюдались в основном для V1.Более высокая неопределенность классификации (вероятность1 0,3 / 0,6) показала более низкие значения AUC, особенно для меньшего числа групп (рис. S2 + S3). Большие стандартные отклонения с меньшими средними различиями снижали AUC для V1, что более заметно для Бонферрони, чем для корректировки Бенджамини-Хохберга (рис. S2 + S3). Требования к медианному времени подгонки модели были ниже для V1 (рис. S1).

    Рисунок 4: Сравнение методов предварительного выбора признаков для полуколичественной классификации с истинными лежащими в основе равноудаленными различиями между группами.
    (A) Количество успешно обученных моделей (V1, корректировка множественности Бенджамини-Хохберга). (B) AUC предсказаний модели, проверенных на основании фактов для различных ошибок классификации и различных методов корректировки множественности. AUC (C – D) и ранги AUC (E – F) для V1 и V2, методы ранговых связей: avg, average, rnd, random.

    Бинарная классификация и две истинные базовые группы

    Количество успешных подгонок модели варьировалось от 139 до 144 для V2 и от 0 до 144 для V1 (корректировка Бенджамини – Хохберга, рис.5А). Время обработки было меньше для V1 (<5 против> 20 с, фиг. 5B, фиг. S1). Минимальные наблюдаемые AUC были> 0,5 для всех комбинаций, оцененных с помощью V1, 13% моделей приводят к AUC <= 0,5 для V2 (рис. S5). Отдельный анализ комбинаций проб1 / проб2 показал, что 0,1 / 0,1; 0,3 / 0,1; 0,1 / 0,3; 0,3 / 0,3; 0,6 / 06; 0,6 / 0,9; 0.9 / 0.9 не дали никаких моделей для V1 (фиг. 5A), V2 идентифицировал модели с низкими AUC в этих случаях (фиг. S4 + S5). Никакой общей разницы в AUC между поправками Бонферрони и Бенджамини – Хохберга не удалось обнаружить при разделении результатов по вероятности (рис.S4 + S5). Увеличение средних различий позволило модели соответствовать большим стандартным отклонениям с V1, с более высокими средними значениями AUC для корректировки Бонферрони для большинства оцениваемых комбинаций (фиг. S4 + S5, фиг. 5C). Более высокие медианные значения AUC наблюдались для V1 (фиг. 5D), а также более высокие медианные значения AUC (фиг. 5C).

    Рисунок 5: Сравнение методов предварительного выбора признаков для бинарных результатов с лежащими в основе истинными дихотомическими группами.
    (A – D) Количество успешно обученных моделей (корректировка множественности Бенджамини-Хохберга).(E – H) Время, необходимое для подгонки модели. (I, J, K) AUC предсказаний модели, проверенных на основании достоверных данных для различных вероятностей классификации. (L – M) Ранги AUC для V1 и V2, методы ранжирования: avg, average, rnd, random.

    Производительность обоих подходов была дополнительно протестирована для большего количества функций (до 10 000) и большего количества выборок в группе (тот же размер, до 100) и с вероятностями 0,1 и 0,3 с корректировкой значения Bonferroni p . Результаты представлены на рис.S7. Для n = 25 образцов на группу, никакие модели не могут быть оснащены V1. И AUC, и AUC были выше для V1, вплоть до AUC, равного 1, где соответствующие модели из V2 достигли AUC не выше 0,8. Минимальные наблюдаемые AUC для V1 составляли 0,6. V2 не продемонстрировал явного влияния параметров распределения, из которых были взяты данные, на AUC, в отличие от V1. Таким образом, V1 превосходит V2 также в больших наборах данных.

    Полуколичественная классификация и две истинные лежащие в основе группы

    Затем оценивали промежуточное звено между двумя ранее проанализированными условиями.Классификация могла быть градуированной (полуколичественной), но основная группировка предполагалась дихотомической. V1 приводит к подгонке модели в среднем на 35% (диапазон: 16–48%, корректировка значений по Бенджамини – Хохбергу p ) успешных подгонок модели с использованием V2 (рис. 6A). Время обработки было меньше для V1 (рис. S1). V1 давал более высокие ранги AUC по сравнению с V2 (фиг. 6B). Минимальные наблюдаемые AUC составляли 0,64 для V1 и 0,44 для V2. V2 дало 5 моделей с AUC <= 0,5. Стратификация по количеству категорий показала более высокие медианные ранги AUC для V1 и увеличивающиеся медианные ранги для V2 (рис.6C), а также увеличение AUC для> = 4 категорий для V2 (рис. 6C). Стратификация AUC по вероятности ошибки (вероятность1) и количеству категорий показала уменьшение AUC для увеличения вероятности ошибки, особенно для V2 (рис. S6). Зависимость AUC от количества категорий, средней разницы и стандартных отклонений между двумя основными группами показала более высокие AUC для более низких стандартных отклонений, особенно для 4 групп для V1 (рис. S6).

    Рисунок 6: Сравнение методов предварительного выбора признаков для полуколичественной эквидистантной классификации с истинными дихотомическими базовыми группами.
    (A) Количество успешно обученных моделей (корректировка множественности Бенджамини-Хохберга). AUC (B – C) и AUC (F – G) ранги V1 и V2, методы ранговых связей: avg, average, rnd, random. (D) AUC и ранги (E), разделенные по количеству полуколичественных категорий.

    Пример использования: идентификация прогностически различных CIMP-глиобластом на основе метилирования

    Для сравнительной оценки предложенной эвристики мы оценили ряд методов на предмет их способности идентифицировать / извлекать две предположительно истинные группы прогностически различных опухолей G-CIMP-GBM, присутствующих в когорте данных массива данных метилирования TCGA-GBM 450k (рис.7). Две прогностически разные группы (длительно выжившие, LTS и краткосрочные выжившие, STS) были определены, как показано на рис. S7 и Дополнение. Методы. Представление umap было рассчитано из данных массива метилирования, распределение образцов LTS / STS показано на фиг. 7A. Опухоли LTS расположены скорее в правом нижнем углу, опухоль STS - в верхней части графика. Разделение выборок на основе данных, основанное на представлении umap, было выполнено вручную с помощью прямой линии (рис. 7B). Результирующая группировка выборок (вверху, внизу линии, grp1 и grp2) использовалась для обучения случайного лесного классификатора, регрессии лассо и логистической регрессии с предложенной эвристикой.Для классификатора случайного леса был выполнен дополнительный анализ путем выбора зондов CpG с наивысшим рейтингом (важность, среднее уменьшение Джини, рис. 7E, 2–4 столбцы) для последующего иерархического кластерного анализа. Дополнительные методы выбора признаков показаны на рис. 7F – 7H. Сравнивались прогнозы на основе классификатора случайного леса, два основных кластера для подходов, включающих иерархическую [консенсусную] кластеризацию и оптимальное прогностическое разделение непрерывных значений (прогнозы на основе лассо и новой эвристики, минимальное значение p ) w.r.t. их способность к прогностическому разделению (рис. 7D – 7H и таблица 1). Лучшее разделение было достигнуто с помощью новой эвристики (средняя разница выживаемости 7,51 месяца), за которой последовал случайный лесной классификатор с иерархическим кластерным анализом наиболее важных CpG (6,04 месяца). Выбор подхода BIC, AIC или CV в fitM () дал ту же модель (Таблица S1).

    Рисунок 7: Сравнительная оценка новой предложенной эвристики для идентификации прогностически различных опухолей G-CIMP на основе данных массива метилирования.
    (A) Оценочные данные. (B) Umap-представление M-значений с классификацией LTS / STS (см. Рис. S7 и дополнительные методы) и соответствующие кривые выживаемости (C). Ручное разделение прогностически различных опухолей, umap (D) и кривые выживаемости (E). (F) Оцененные подходы к обнаружению групп прогностически различных опухолей. hcl: иерархический кластерный анализ. (G – I) эвристика modelBuildR, (G) оценки модели с цветовой кодировкой в ​​представлении umap данных метилирования и разделенные прогностической группой (высокий / низкий, см. H).(H) Кривые выживаемости соответствуют наиболее достижимому разделению (минимальное значение p , вертикальная линия, I). Прогнозы случайных лесов (J), ранжирование CpG-зондов на основе случайных лесов (K, важность, среднее уменьшение Джини), иерархический кластерный анализ выбранных зондов (L, синий, область D2, евклидово расстояние), кривые выживаемости двух основных кластеров ( М). (F) Иерархический кластерный анализ (палата.D2, Евклидово расстояние) 1% большинства вариантных зондов (среднее абсолютное отклонение) и соответствующие кривые выживаемости двух основных кластеров (O).(P) Кривые выживаемости для прогнозов модели регрессии лассо, аналогично I. (Q) График вулкана для дифференциально регулируемых зондов ( t -тест, корректировка Бонферрони), выбранные зонды использовались для согласованной кластеризации (R, hcl, ward.D2) , Евклидово), прогностическое разделение двух основных кластеров (S). Кривые выживаемости Каплана-Мейера, p-значения теста отношения правдоподобия (модели Cox-PH).

    Обсуждение

    Omics-данные, например данные об экспрессии или метилировании, часто используются для понимания основной биологии (Capper et al., 2018). В трансляционных исследованиях молекулярные данные пациентов часто сравнивают с заданной бинарной классификацией (например, подтип опухоли A против B) или градуированной полуколичественной оценкой, например, иммуногистохимического напряжения классов интенсивности от 1 до 5 (Balermpas et al. др., 2017; Knoll et al., 2016). Однако о проспективно измеренном межэкспертном соглашении по классификации степени и гистотипа рака яичников специалистами (патологами) сообщалось только в 85–95% (Barnard et al., 2018). Таким образом, доля ошибочных классификаций в 5–15% может считаться консервативной оценкой даже для подготовленных оценщиков.

    Таблица 1:

    Сравнение различных методов прогностического разделения G-CIMP-негативных опухолей глиобластомы на основе данных массива метилирования.

    Модель Модель
    Метод Средняя разница в выживаемости [месяцы] HR, 95% ДИ p -значение
    Случайный лес 3.2 1,3 [0,86–2,03] 0,2
    Случайный лес + hcl 6,04 0,5 [0,41–0,96] 0,03
    Большинство вариантов + hcl 4,5 0,8 [0,54–1,30] 0.4
    т -тест + hcl * 3,0 0,6 [0,39–0,98] 0,04
    Лассо 3,7 0,6 [0,42–0,99] 0,04
    Сборка R 7.51 0,5 [0,33–0,81] 0,004
    DOI: 10.7717 / peerj.10849 / table-1

    Обучение модели для классификации может указывать на лежащие в основе биологические механизмы, поскольку предполагается, что на этапе обучения модели выбираются признаки, которые надежно позволяют делать выводы о группах. Оценка всех возможных комбинаций функций для обучения модели невозможна для типичных наборов данных, а также для стандартных подходов к моделированию также часто невозможно (количество функций>> количество выборок), гребенчатая регрессия и лассо (Santosa & Symes, 1986; Tibshirani, 1996). ) позволяют работать с такими данными.Кроме того, функции можно предварительно отфильтровать с помощью самых разных методов (Lazar et al., 2012). Бинарные результаты можно моделировать с помощью логистической регрессии и градуированных, равноудаленных классификаций с помощью линейных моделей. Для обсуждения применяемых в настоящее время методов анализа реальных клинических данных - начиная от простого анализа на основе ROC до сложных моделей и подходов к выбору признаков - см. Chen et al. (2019) и Део (2015). Несмотря на то, что модели глубокого обучения могут показывать исключительно высокую производительность для конкретных задач в биомедицинских исследованиях, их применение часто ограничивается скудностью данных или низким качеством (Chen et al., 2019) и могут быть уязвимы для небольших состязательных возмущений (Yuan et al., 2019). Следовательно, необходимы новые методы, позволяющие проводить анализ с использованием данных более низкого качества. Кроме того, очень сложным и мощным методам глубокого обучения не хватает прозрачности (Holzinger et al., 2019), но объяснимость и интерпретируемость часто являются решающим моментом, необходимым для более механистического понимания основных процессов.

    Методы часто стремятся как можно лучше объяснить наблюдаемые данные (классификация), e.g. путем использования критериев согласия или достаточных различий в информационных критериях, при решении проблемы переобучения, например, путем включения перекрестной проверки. Однако выбор признаков по-прежнему основан на (вероятной) ошибочной классификации.

    Мы стремились оценить, может ли эвристика, которая меняет роли зависимых (классификация) и независимых (характеристики) переменных на этапе предварительной фильтрации, помочь получить функции, связанные с истинной базовой структурой / группировкой (тестирование значительных различий, перекрестная проверка ).Поэтому мы смоделировали данные для двух или более различных классов, добавили ошибку в классификации и попытались получить исходную классификацию, количественно определенную с помощью (многоклассового) анализа ROC.

    Оценка истинно различных популяций, закодированных полуколичественно, не показала глобального предпочтения V1 или V2, за исключением более низких временных требований для V1. Рейтинги AUC были еще выше для V1, что делало V1 разумным подходом к анализу. Однако наличие лишь небольших различий между популяциями может ухудшить производительность в этих условиях.

    Наличие двух истинных групп может быть закодировано бинарным (человеком) оценщиком или, например, для иммуногистохимического окрашивания, градуированным, даже если присутствуют только две группы. Обе комбинации были оценены, что показало очевидное общее преимущество предложенной эвристики для двоичного кодирования. Это было верно не только для систематического анализа с небольшим количеством признаков ( n = 100) и 25 выборками на группу, но также и для больших наборов данных, содержащих до 10 000 функций и 100 выборок на группу.Для полуколичественного кодирования лучшая производительность была замечена для меньшего количества полуколичественных категорий. Таким образом, эвристика может быть рекомендована для двоичных классифицированных данных, и если для классификации используется только несколько категорий (~ 4), может присутствовать двоичная основная истинность. Из-за больших временных затрат только комбинация, дающая явное преимущество (две группы, двоичная классификация), была протестирована с большим количеством функций и образцов.

    Предложенная эвристика для предварительной фильтрации признаков приводит к ряду комбинаций, для которых не подходит ни одна модель.Эти комбинации, однако, привели бы к моделям с низкими значениями AUC (по сравнению с наземной истиной) с использованием стратегии выбора функций только для перекрестной проверки (V2). Более либеральные стратегии корректировки значений p не всегда были полезными, поэтому выполнение различных процедур корректировки множественности с изменяющимися границами значений p с учетом их соответствующей мощности должно быть оценено в будущей работе. Более низкие временные затраты эвристики могут оказаться полезными, особенно для больших наборов данных.

    Мы использовали когорту данных массива данных метилирования TCGA-GBM 450k G-CIMP-отрицательных опухолей, чтобы продемонстрировать способность предложенной эвристики извлекать признаки, способные разделить вероятные истинные различные основные группы опухолей. Прямое сравнение с дополнительными методами, даже для небольшого числа подходов, показало превосходную производительность новой эвристики. Не слишком углубляясь в потенциальное биологическое значение (без независимой проверки), стоит отметить, что данные массива метилирования используются для обнаружения и классификации отдельных подгрупп глиомы и G-CIMP-глиобластомы, которые также показывают различия в прогнозе (Capper et al. ., 2018; Knoll et al., 2019; Hwang et al., 2019).

    Таким образом, предложенная эвристика оказалась наиболее полезной для идентификации двух групп, закодированных в двух или нескольких категориях. Идентифицированные признаки были более вероятными для представления истинных связанных характеристик. Однако в будущем необходима работа для подтверждения этих результатов на более сложных / реальных данных, например, с несбалансированными группами, большими размерами выборки и множественными (некоррелированными) истинными эффектами в базовых данных. Для упрощения применения таких тестов можно использовать наш пакет modelBuildR, который общедоступен на github.

    Выводы

    В биомедицинских исследованиях нельзя пренебречь ошибочной классификацией, при этом уровень ошибок достигает 15%. Однако классические методы выбора признаков предполагают, что предоставленная маркировка является правильной, и выбирают признаки, которые лучше всего объясняют потенциально ошибочные данные, даже если интерес представляют истинные базовые группы. Мы предлагаем новую эвристику выбора признаков, которая меняет роли зависимых и независимых переменных на начальном этапе выбора признаков и действует стандартными методами.Его превосходные характеристики в определении характеристик, связанных с достоверной информацией, даже для неправильно маркированных образцов, демонстрируются на синтетических данных, полученных из двух истинных групп и двоичного ручного кодирования. Пример использования данных omics массива метилирования показывает многообещающие результаты. Необходима дальнейшая работа, чтобы лучше охарактеризовать приложения, для которых предложенная эвристика может быть полезной.

    Дополнительная информация

    AUC, стратифицированная по параметрам, используемым для моделирования данных с полуколичественной классификацией и градуированной наземной достоверностью

    BH p - регулировка значения на этапе предварительной фильтрации.

    DOI: 10.7717 / peerj.10849 / supp-2

    AUC, стратифицированная по параметрам, используемым для моделирования данных с полуколичественной классификацией и градуированной наземной достоверностью

    Bonferroni p - регулировка значения на этапе предварительной фильтрации.

    DOI: 10.7717 / peerj.10849 / supp-3

    AUC, стратифицированная по параметрам, используемым для моделирования данных для двоичной классификации и дихотомической наземной истинности

    BH p - регулировка значения на этапе предварительной фильтрации.

    DOI: 10.7717 / peerj.10849 / supp-4

    AUC, стратифицированная по параметрам, используемым для моделирования данных для двоичной классификации и дихотомической наземной истинности

    Bonferroni p - настройка значений на этапе предварительной фильтрации и количество моделей с AUC <= 0,5.

    DOI: 10.7717 / peerj.10849 / supp-5

    AUC, стратифицированная по параметрам, используемым для моделирования данных с полуколичественной классификацией и дихотомической базовой истинностью

    BH p - настройка значений на этапе предварительной фильтрации, данные показаны для 3,4 и 5 групп.

    DOI: 10.7717 / peerj.10849 / supp-6

    Сравнение методов представления признаков для бинарных результатов с лежащими в основе истинными дихотомическими группами и для большего количества признаков и образцов

    (A) AUC предсказаний модели, проверенных на групповую истинность для различных вероятностей классификации, количества образцов и признаков. (B) Ранги AUC для V1 и V2, методы ранжирования: среднее среднее, rnd: случайное. (C) AUC стратифицированы параметрами, используемыми для моделирования данных.Корректировка p-значения Бонферрони.

    DOI: 10.7717 / peerj.10849 / supp-7

    Идентификация прогностически различных опухолей и связанных дифференциально метилированных зондов из набора данных массива метилирования 450k TCGA-GBM

    Кривые выживаемости Каплана – Мейера, тест отношения правдоподобия (Cox-PH) p -значения. Подробнее см. Suppl-Methods.

    DOI: 10.7717 / peerj.10849 / supp-8 Модель

    modelBuildR, созданная для прогностического отделения опухолей G-CIMP от когорты TCGA-GBM

    M-значения были использованы для обучения модели, двоичный результат (grp1 vs grp2, рис.7B), параметры по умолчанию.

    DOI: 10.7717 / peerj.10849 / supp-9

    Huawei P9 можно сравнить с Samsung Galaxy S7 и LG G5?

    Huawei vient tout juste d’officialiser son nouveau vaisseau amiral, le P9. Une montée en gamme par rapport au P8 qui permet à Huawei de se Positionner Clairement sur le marché haut de gamme. Случайный пример сравнения новых моделей Huawei с флагманами Samsung и LG: Galaxy S7 и LG G5.

    Это предварительная версия Huawei P9 от Samsung Galaxy S7 и LG G5? Смартфоны Les Trois находятся в одном из сегментов сегмента, haut de gamme, avec des tarifs dépassant les 500 евро. On est loin des anciens Huawei позиционирует себя как преимущество в сегменте игровой среды. Принятие мер по основному использованию одежды и тестеру одежды с использованием модных аксессуаров, анализ методов анализа данных на телефонах, для сохранения Huawei P9, предназначенного для использования в повседневной жизни, в режиме реального времени, в моделях с папье, на дополнительных телефонах. haut de gamme du moment .

    Модель Huawei P9 Samsung Galaxy S7 LG G5
    Версия Android Android 6.0 Marshmallow Android 6.0 Marshmallow Android 6.0 Marshmallow
    Конструктор интерфейса Emotion UI 4.0 TouchWiz LG UX
    Taille d'écran 5,2 пакета (2,5D) 5,1 пакета 5,3 пакета
    Определение 1920 x 1080 пикселей 2560 x 1440 пикселей 2560 x 1440 пикселей
    Плотность пикселей 424 ppp 577 ppp 554 ppi
    Технология LCD IPS Super AMOLED IPS LCD Quantum
    Traitement anti-rayures Gorilla Glass 3 (с подтверждением) Gorilla Glass 4 3D Arc Glass
    SoC Кирин 955 Samsung Exynos 8890 Qualcomm Snapdragon 820
    Процессор (ЦП) 4 x Cortex-A53 и 4 x Cortex-A72 4 x Exynos M1 и 4 x Cortex-A53 4 x Kryo
    Puce Graphique (GPU) Mali T-880 Mali T-880 MP12 Adreno 530
    Mémoire vive (RAM) 3 Go 4 Go 4 Go
    Mémoire interne (flash) 16 Go 32/64 Go (UFS 2.0) 32 Go (UFS 2.0)
    microSD Oui Oui Oui
    Фотография одежды (дорсальная) Двойной захват, 12 мегапикселей Dual-Pixel, 12 мегапикселей, разрешение f / 1,7 Двойной захват на глубине 16 и 8 мегапикселей
    Фотография в одежде (фронтальная) 8 ​​мегапикселей 5 мегапикселей 8 мегапикселей
    Видео для регистрации 1080p при 30 кадрах в секунду 4K при 30 кадрах в секунду 4K при 30 кадрах в секунду
    Wi-Fi 802.11 a / b / g / n / ac (2,4 + 5 ГГц) 802.11 a / b / g / n / ac (2,4 + 5 ГГц) 802.11 a / b / g / n / ac (2,4 + 5 ГГц)
    Bluetooth 4,1 4,1 4,1
    Réseaux 4G кат. 4 (150/50 Мбит / с)
    700/800/1800/2600 МГц
    4G кат. 9 (450/50 Мбит / с)
    700/800/1800/2600 МГц
    4G кат. 6 (300/50 Мбит / с)
    700/800/1800/2600
    SIM 2 × nano-SIM
    или
    1x nano-SIM + 1x microSD
    1 x nano-SIM 1 x nano-SIM
    NFC Oui Oui Oui
    Capteur d'empreintes Oui, au dos Oui, en façade Oui, au dos
    Порты
    (входы / выходы)
    USB Type-C micro-USB USB Type-C
    Аккумулятор 3000 мАч 3000 мАч с быстрой зарядкой 2.0 2800 мАч, средняя быстрая зарядка 3.0
    Размеры 145 x 70,9 x 6,95 мм 142,4 x 69,6 x 7,9 мм 149,4 x 73,9 x 7,7 мм
    Poids 144 грамма 152 грамма 159 граммов
    Couleurs gris, blanc noir, blanc, gris et or gris / titan / or / rose
    Prix Consuillé 599 евро 699 евро 699 евро

    Autour de 5 pouces

    В терминах формата, троих смартфонов, точных для данного сегмента, они содержат Huawei P9 с 5,2 модулями, 5,1 модулями для Galaxy S7 от Samsung и 5,3 модулями для LG G5.Trois diagonales qui se tiennent dans un mouchoir de poche et qui sont dans la moyenne du marché des smartphones haut de gamme. В приложении Huawei сохранена уникальная гамма фаблетов (les fameux Huawei Mate), которая включает в себя различные композиции с высокой гаммой для смартфонов в формате плюс условные обозначения.

    De l’aluminium, du plastique et du verre

    Au niveau du design, много разных смартфонов.Компания Samsung использует массивные детали из алюминия и алюминия на границах, а LG использует алюминий с пластиковым покрытием на основе пластика Huawei, который предлагает алюминиевый корпус в стиле Mate 8. Encore une fois , Huawei разрабатывает дизайн и разрабатывает продукцию для анкетирования и создания P9, не зависящих от конкурентов.

    IPS против Super AMOLED

    Pour l’écran, Huawei использует IPS в стиле G5 от LG.Ce dernier использует всю технологию Quantum Dot для лучшего восприятия цветов. Chez Samsung, на оставшейся части технологии Super AMOLED, которая конфигурируется и контрастирует и показывает лучшие цвета ЖК-дисплеев с малыми калибрами. На случай, если вы захотите сделать что-нибудь из памяти Galaxy S7 и оставив ее, компания Huawei ждет своего прекрасного сюрприза с технологией IPS NEO bien maîtrisée.

    Toujours dans le domaine de l’affichage, les définitions d’écran ne sont pas similaires entre les trois produits.D’un côté, Samsung и LG по определению QHD (2560 x 1440 пикселей), в последнее время разрешение включает в себя 554 и 577 PPP. Chez Huawei, на оставшемся компьютере с разрешением Full HD (1920 x 1080 пикселей), имеет разрешение 424 PPP. Rappelons que la definition QHD apporte peu d’intérêt sur l’écran d’un smartphone, à l’exception d’usages très spécifiques tels que la réalité virtuelle.

    Kirin 955 против Exynos 8890 против Snapdragon 820

    Au niveau des performances, le Kirin 955 du P9 est un Kirin 950 avec des fréquences de fonctionnement revues à la hausse.Il nous avait vraiment convaincus au sein du Mate 8, et il y a fort à parier que le P9 soit donc une petite bombe niveau réactivité. Он не делал ничего нового для Galaxy S7 и LG G5 с Exynos 8890 и Snapdragon 820 от Qualcomm. Nous avions d’ailleurs réalisé un Compartif de performances, qui plaçait le Kirin 950 en très bonne place face à l’Exynos 8890.

    Sony и Leica для фотографий

    Любители фотографии, не переходящие в прошлое, делают партнерские отношения между Leica и Huawei, портируя фрукты.Эта часть фотографии P9, созданная с использованием фруктовых отношений между двумя объектами, включает в себя два захвата 12 мегапикселей Sony IMX286 и чечевицу, созданную в сотрудничестве с Leica.

    Il faudra servere de voir ce que cela donne dans la pratique, mais la technologie s’annonce intéressante, avec un capteur dédié à la captation des détails (en noirs et blanc) и l’autre capteur dédié aux couleurs. Huawei réussira-t-il. Il semble are les armes pour, et espérons que sa partie logicielle soit soignée, d’autant que la mise au point est hybride avec l’utilisation de trois технологий: лазер, par mesure de contraste et par profondeur.

    Des capteurs d’empreintes

    Au rayon de la sécurité, les trois смартфоны sont à peu près égaux, avec la présence d’un capteur d’empreintes digitales. Huawei va un peu plus loin en intégrant un capteur d’empreintes digitales 3D, permettant d’analyser en l’empreinte dans la profondeur. De quoi améliorer la fiabilité des empreintes et d’éviter de tromper le smartphone avec la photo d’une empreinte.

    Le réseau n’est pas mis de côté

    Huawei является специалистом по телефонным коммуникациям с сильной стороной, указанной в профессиональной области, отмеченной как новые курсы.Huawei не умеет получать прибыль с помощью смартфонов с тройной системой антенн на P9. Les trois ne fonctionnent pas en même temps, mais chacune peut prendre le relai de l’autre, afin d’améliorer la connectivité. En Wi-Fi, функция, обеспечивающая постоянное автоматическое подключение к Wi-Fi, без использования функции качества сигнала, качество обслуживания (дебит, задержка и т. Д.). Samsung предлагает своим пользователям возможность подключения к сети Wi-Fi с возможностью создания точки доступа Wi-Fi для подключения к сети без подключения к Интернету.

    Le rapport qualité - prix

    Enfin, finissions par la question qui fâche, le prix. Le Huawei P9 стоит 50 евро плюс предварительный заказ на P8. Малгре все, что вам нужно, это большой конкурс на Galaxy S7 и LG G5 по цене 699 евро. Цена за 150 евро, Huawei P9 не будет предлагать качественную связь - приз плюс постоянство флагманов LG и Samsung.

    Montée en gamme declare, le P9 de Huawei является большим предвкушением.Смартфон, созданный для интенсивного соблазнения, изысканный антураж австралийских роскошных моделей Samsung Galaxy,…
    Lire la suite


    Залейте свою жизнь, но не пригласите ее в приложение для мобильного телефона Android и iOS. Вы можете найти статьи, досье и другие видео на YouTube.

    Цифровое секвенирование следующего поколения выявляет мутации с низким содержанием в образцах сока поджелудочной железы, взятых из двенадцатиперстной кишки пациентов с раком поджелудочной железы и внутрипротоковыми папиллярными муцинозными новообразованиями

    Введение

    Предполагается, что рак поджелудочной железы будет второй ведущей причиной смерти от рака в США к 2030 году.1 Большинство пациентов с протоковой аденокарциномой поджелудочной железы (PDAC) имеют рак на поздней стадии и быстро прогрессируют.

    Эндоскопическая ультрасонография (EUS) и / или МРТ / МР-холангиопанкреатография (MRCP) могут точно идентифицировать кисты поджелудочной железы размером менее сантиметра2 и используются для скрининга людей с сильным семейным анамнезом рака поджелудочной железы, чтобы попытаться обнаружить бессимптомный рак поджелудочной железы I стадии и значительные предраковые поражения .2–10 Большинство кист поджелудочной железы, обнаруживаемых у пациентов, проходящих скрининг, считаются внутрипротоковыми папиллярными муцинозными новообразованиями (IPMN).2 Однако наиболее распространенные предраковые поражения, интраэпителиальные новообразования поджелудочной железы (PanINs), как правило, слишком малы (<5 мм в диаметре по определению), чтобы их можно было идентифицировать методами визуализации.11 Необходимы новые тесты для выявления клинически значимых предшественников и ранней излечимой инвазивной болезни. рака, и одним из возможных подходов является анализ панкреатического сока. Анализ секретин-стимулированного панкреатического сока, полученного эндоскопически из двенадцатиперстной кишки пациентов, включенных в исследования рака поджелудочной железы (CAPS), показал, что обнаружение мутаций GNAS тесно коррелировало с наличием IPMN, и обнаружение мутаций TP53 в 67% случаев с PDAC и 50% случаев с запущенными предвестниками.2, 4, 12–14 Аналогичным образом мутации KRAS обычно обнаруживаются в образцах сока от пациентов с раком поджелудочной железы и пациентов, проходящих скрининг. Мутации KRAS , обнаруженные в соке поджелудочной железы лиц с высоким риском без аномалий визуализации поджелудочной железы, как полагают, возникают из-за небольших поражений PanIN.15 В этих исследованиях использовался цифровой анализ кривой плавления и пиросеквенирование для обнаружения мутаций, но секвенирование следующего поколения (NGS) широко используется в клинических лабораториях для обнаружения соматических мутаций в раковых тканях.16, 17

    NGS оценивается как тест для обнаружения низкораспространенных соматических мутаций во вторичных жидкостях, таких как плазма, 18, но частота ошибок секвенирования, вызванная анализами NGS, создает проблемы для обнаружения низкораспространенных мутаций. Варианты последовательности, идентифицированные с помощью тестов на основе NGS, должны присутствовать в достаточных концентрациях (> 1%), чтобы их можно было рассматривать как истинные мутации, а не как фоновые ошибки секвенирования.19 Концентрации соматических мутаций в дуоденальных коллекциях панкреатического сока обычно довольно низкие (обычно 0.1–1%) даже среди пациентов с PDAC15, и, следовательно, их обнаружение с помощью NGS требует внесения изменений в стандартные протоколы NGS. Молекулярные стратегии, такие как SafeSeq, использовались в исследовательских условиях, чтобы помочь отличить истинные соматические мутации с низким содержанием от ошибок низкого уровня, связанных с NGS.20 В принципе, способность NGS точно обнаруживать мутации с низким содержанием можно улучшить, если с использованием «цифровых» стратегий, аналогичных цифровой ПЦР. Мы разработали цифровой метод NGS для этой цели, выполнив дискретный NGS-анализ множества (обычно 96) отдельных аликвот ДНК из одного биологического образца, где каждая аликвота содержит только несколько геномных эквивалентов ДНК.Затем можно ожидать, что каждая аликвота будет иметь либо ноль, либо одну содержащую мутацию ДНК-матрицу на каждом интересующем нуклеотиде в дополнение к небольшому количеству матриц дикого типа. Истинные соматические мутации должны обнаруживаться более чем в одной аликвоте.21 В этом исследовании мы оценили цифровой NGS как стратегию обнаружения мутаций с низким содержанием, а затем применили этот метод для обнаружения мутаций в дуоденальных коллекциях панкреатического сока, полученных от пациентов с и без неоплазия протока поджелудочной железы для оценки диагностической точности этого теста.

    Материалы и методы

    Пациенты и образцы

    Образцы панкреатического сока для этого исследования были получены от участников, включенных в исследования CAPS (http://clinicaltrials.gov, NCT00438906, NCT00714701 и NCT02000089) .2, 4 Сто пятнадцать Были включены перспективно включенные субъекты (53 открытия, 62 проверки), чтобы представить различные диагностические возможности (см. дополнительную онлайн-таблицу S1). Группы пациентов включали пациентов с диагнозом (1) PDAC (n = 34), в том числе отобранных пациентов, у которых развился рак поджелудочной железы во время наблюдения (n = 4), (2) IPMN (n = 57), диагностированных на основании хирургической патологии или результатов визуализации, включая случаи, проходящие скрининг поджелудочной железы, или (3) контрольные (n = 24) с нормальной поджелудочной железой, проходящие EUS по другим показаниям, или хронический панкреатит.Заархивированный первичный рак поджелудочной железы или ткань IPMN были секвенированы у некоторых пациентов, чтобы сравнить мутации, обнаруженные в образцах сока, с мутациями, присутствующими в опухолях.

    Секрецию панкреатического сока стимулировали инфузией синтетического секретина человека (ChiRhoClin) (0,2 мкг / кг внутривенно в течение одной минуты). Сок собирали из просвета двенадцатиперстной кишки в течение ~ 5 минут (обычно 5–10 мл) .13 Кроме того, было секвенировано несколько образцов жидкости из кисты поджелудочной железы, аспирированной во время EUS.22

    Все элементы этого исследования были одобрены Johns Hopkins. институциональный наблюдательный совет, и от всех пациентов было получено письменное информированное согласие.

    Цифровой NGS

    Все цифровые NGS-анализы проводились без учета информации о пациентах. Пользовательская панель Ion AmpliSeq использовалась для мультиплексирования ПЦР и секвенирования девяти генов (122 ампликона в двух пулах праймеров, см. Дополнительную онлайн-таблицу S2), мутировавших в новообразованиях протоков поджелудочной железы ( KRAS, GNAS, TP53, SMAD4, CDKN2A, RNF43, TGFBR2, BRAF , PIK3CA ) .23–26 Было приготовлено 96 аликвот ДНК из сока каждого пациента, и каждая аликвота была подвергнута NGS. Каждой аликвоте, содержащей мутацию, присваивался один балл мутации.

    Оценка точности цифрового NGS

    Цифровой NGS был выполнен на образцах ДНК фибробластов дикого типа и трех контрольных пулах, содержащих низкие концентрации мутаций (20 линий клеток рака поджелудочной железы, смешанных с ДНК фибробластов) (см. Дополнительные онлайн-таблицы S3 и S4).

    Цифровая капельная ПЦР

    Цифровая капельная ПЦР (ddPCR) была проведена без учета цифровых результатов NGS, чтобы помочь оценить точность цифрового NGS.

    (Дополнительные методы см. В дополнительных материалах в Интернете).

    Статистика

    Медианные оценки мутаций между PDAC, IPMN и контрольной группой сравнивали с помощью тестов Манна-Уитни U и χ 2 . Кривые рабочих характеристик приемника (ROC) были построены для оценки мутаций гена-кандидата, а площадь под кривой (AUC) была рассчитана трапециевидным методом. Использовали программное обеспечение SPSS и GraphPad Prism6. Двусторонний p <0,05 считался статистически значимым.

    Результаты

    Обнаружение мутаций с низким содержанием в эталонных пулах ДНК с помощью цифрового NGS

    Мы обнаружили, что цифровой NGS может обнаруживать все 28 миссенс и нонсенс мутаций в эталонных пулах ДНК рака поджелудочной железы, присутствующих в концентрациях от> 0.От 1% до 1% относительно ДНК дикого типа и 90% мутаций присутствуют на уровне 0,1% относительно ДНК дикого типа (см. Дополнительную онлайн-таблицу S4). Чтобы не называть ошибки секвенирования, связанные с NGS, мутациями, нам потребовалось обнаружение одного и того же варианта последовательности в трех независимых цифровых реакциях NGS в качестве критерия для определения вариантов последовательностей, не являющихся горячими точками, идентифицированных цифровым NGS, как истинные мутации (в дополнение к обычным мутациям). метрики для вызова мутаций). Мы также сравнили цифровой NGS с ddPCR на предмет их способности обнаруживать мутаций KRAS в панкреатическом соке и обнаружили почти полное соответствие между этими двумя методами (см. Также дополнительные онлайн-материалы).

    Соматические мутации, обнаруженные в образцах панкреатического сока

    Используя цифровой NGS, мы сравнили профили мутаций пациентов с диагнозом PDAC по сравнению с IPMN по сравнению с контрольной группой сначала в наборе для обнаружения (Случаи № 1–53), а затем в наборе для проверки (Случаи № 54–115). Результаты комбинированного набора суммированы на рисунках 1–3 и см. Дополнительную онлайн-таблицу 5, таблицу 1. Результаты набора для обнаружения и проверки представлены на дополнительных рисунках S2-S4 и в дополнительных материалах.Мутационный анализ первичного рака поджелудочной железы или IPMN также проводился для случаев с достаточным количеством неопластической ткани (см. Дополнительные онлайн-таблицы S6 и S5). Большинство образцов сока с мутациями имели цифровой NGS-балл <10 (диапазон 1–87) (таблица 1).

    Таблица 1.

    Соматические мутации, идентифицированные в соке поджелудочной железы с помощью цифрового NGS *

    Рисунок 1

    Распространенность генов, идентифицированных как мутировавшие в соке поджелудочной железы с помощью цифрового секвенирования следующего поколения. В некоторых случаях протоковой аденокарциномы поджелудочной железы (PDAC) также наблюдалось внутрипротоковое папиллярное муцинозное новообразование (IPMN).

    Рис. 2

    Концентрация мутаций в поджелудочной железе (баллы цифрового секвенирования следующего поколения (dNGS)) по группам заболеваний. IPMN, внутрипротоковое папиллярное муцинозное новообразование; PDAC, протоковая аденокарцинома поджелудочной железы.

    Рисунок 3

    Анализ кривой рабочих характеристик приемника (ROC), оценивающий, как мутация гена поджелудочного сока оценивается по выделенным группам заболеваний. IPMN, внутрипротоковое папиллярное муцинозное новообразование; PDAC, протоковая аденокарцинома поджелудочной железы.

    В совокупной выборке из 115 пациентов 31 из 34 (91.2%) пациентов с PDAC и 51 из 56 (91,1%) с диагнозом IPMN (без PDAC) имели по крайней мере одну мутацию, обнаруженную в их образце сока поджелудочной железы, по сравнению с 13 из 24 (54,2%) контрольной группы без признаков неоплазии поджелудочной железы ( p = 0,001 и p <0,001). KRAS Мутации (как с цифровым NGS, так и с ddPCR для набора обнаружения) были обнаружены в образцах сока 10 из 24 контрольных (41,7%), 42 из 56 (75,0%) пациентов с IPMN и 25 из 34 (73,5%) пациентов с PDAC. Несколько пациентов, особенно с PDAC, имели множественные мутации KRAS , обнаруженные в их образцах сока.15

    Тридцать пять случаев имели вредные мутации TP53 , в том числе 20 с PDAC и 15 с IPMN. Вредные мутации SMAD4 были обнаружены у семи пациентов; у трех были миссенс-мутации. SMAD4 миссенс-мутации часто вредны.27, 28 Шесть из этих пациентов страдали раком поджелудочной железы. В одном случае без PDAC (Случай № 21) с вредоносной мутацией SMAD4 была проведена резекция по результатам высокого риска29; расширенный (~ 1 см) главный проток поджелудочной железы, связанный с IPMN 6 см с дисплазией промежуточной степени.Ни в одном из остальных 80 случаев не было мутации SMAD4 (p <0,001 по сравнению с PDAC). Мутации в TP53 и / или SMAD4 , двух наиболее специфичных маркерах, не были обнаружены в образцах сока контрольных образцов, но были обнаружены в 22 из 34 (64,7%) случаев с PDAC и в 16 из 56 (30,4%) случаев. с IPMN (p <0,0001, p = 0,003, соответственно, PDAC vs IPMN, p = 0,0007, χ 2 ).

    Двенадцать других пациентов с IPMN подверглись резекции поджелудочной железы, включая три случая с мутациями TP53 : у этих пациентов была дисплазия промежуточной степени в их IPMN и / или PanIN-2 в образце резекции.Тринадцать случаев IPMN с низкими мутациями TP53 (цифровые баллы NGS ≤4) все еще находятся под наблюдением без признаков прогрессирования ≥1 года после получения пробы сока. Пациенту №20 была выполнена дистальная резекция поджелудочной железы по поводу IPMN. У нее было мутаций GNAS и BRAF в дополнение к TP53 , обнаруженному в ее предоперационном образце сока. У нее был диагностирован метастатический PDAC 6 лет спустя, несмотря на то, что по данным контрольной компьютерной томографии у нее была ничем не примечательная поджелудочная железа, в том числе за 6 месяцев до появления метастазов.В целом (включая прогрессирующие случаи, описанные ниже) и в дополнение к 3 случаям TP53 с положительной мутацией, которые подверглись резекции с дисплазией промежуточной степени / PanIN-2, 4 из 17 пациентов с IPMN с низкими концентрациями мутации TP53 в их соке поджелудочной железы (цифровые оценки NGS ≤4), которые продолжали наблюдение, прогрессировали до рака поджелудочной железы в течение периода исследования.

    Тридцать шесть (53%) из 68 случаев с диагнозом IPMN (включая 12 случаев с PDAC, которые также имели IPMN) имели мутаций GNAS , обнаруженных в их образцах сока поджелудочной железы.Из 21 случая, у которых было мутаций RNF43 в их панкреатическом соке, 13 также имели мутацию GNAS и 16 возникли у пациентов с диагнозом IPMN, что согласуется с данными о том, что RNF43 и особенно GNAS чаще мутируют в IPMN, чем в обычных PDAC.23 У пациентов с диагнозом IPMN были более вероятны мутации, обнаруженные в их соке поджелудочной железы, чем в контрольной группе (51 из 56, 91,1%) (p <0,001), и с большей вероятностью, чем в контрольной группе, были мутации, отличные от KRAS. и GNAS , обнаруженные в их образцах сока поджелудочной железы (26 из 56 против 1 из 24) (p = 0.0005).

    Мутации CDKN2A, PIK3CA, TGFBR2 и BRAF были обнаружены в небольшом количестве образцов сока от пациентов с PDAC или IPMN, что соответствует низкой распространенности этих мутаций при первичном раке поджелудочной железы.

    В целом, концентрации мутаций панкреатического сока были значительно выше в образцах сока от пациентов с PDAC по сравнению с контролем (p <0,0001), как и концентрации только мутанта KRAS (p = 0,001) и концентрации мутанта TP53 и / или SMAD4 (p <0.001) (рисунок 2, таблица 2). С помощью анализа кривой ROC общие оценки цифровых мутаций NGS могут отличать случаи PDAC от контроля и случаи IPMN с AUC 0,89 (p <0,0001) и 0,69, p = 0,003), соответственно (рисунок 3, таблица 3). Концентрации мутировавших TP53 и / или SMAD4 в соке поджелудочной железы были выше среди случаев с диагнозом PDAC, чем IPMN (Mann-Whitney, p <0,0001). С помощью анализа кривой ROC цифровые оценки NGS для мутанта TP53 и / или SMAD4 могут отличить случаи PDAC от случаев IPMN без PDAC с 32.4% чувствительность и 100% специфичность (AUC 0,73, p = 0,0002), а также от контролей с AUC 0,82 (p <0,001, специфичность 100%, чувствительность 64,7%). Среди случаев PDAC с мутациями TP53 и / или SMAD4 , 12 из 22 имели цифровой балл NGS ≥5 по сравнению с 0 из 16 с IPMN (p = 0,001). С помощью анализа ROC общие цифровые оценки NGS также могут отличать случаи IPMN от контроля с AUC 0,85 (p <0,0001).

    Таблица 2

    Статистический анализ концентраций мутаций поджелудочного сока с помощью цифровых баллов NGS

    Таблица 3

    Анализ кривой рабочих характеристик приемника (ROC) концентраций мутаций поджелудочного сока (всего 115 #)

    Один интересный случай (Случай № 24, таблица 1 ) с синдромом МакКьюна-Олбрайта (который вызван постзиготическими мутациями GNAS ) прошли EUS для оценки дальнейших бесчисленных кист поджелудочной железы, обнаруженных с помощью компьютерной томографии.Его образец панкреатического сока имел высокую концентрацию мутанта GNAS (цифровой балл NGS = 29) и RNF43 .

    Обнаружение соматических мутаций в соке поджелудочной железы до диагностики рака поджелудочной железы

    Мы также проанализировали серийные образцы сока поджелудочной железы от четырех пациентов, которые прошли скрининг и наблюдение на рак поджелудочной железы, а затем заболели раком поджелудочной железы. Пациент № 36 (таблицы 1 и 4) находился под наблюдением в течение 5 лет, и у него был собран панкреатический сок 61 месяц, 16 месяцев и 4 месяца до того, как у него был диагностирован рак поджелудочной железы.За 2+ года до постановки диагноза PDAC с помощью EUS и MRI / MRCP были обнаружены четыре небольшие стабильные кисты тела и хвоста поджелудочной железы (диаметром 6–10 мм) и очаговая дилатация главного панкреатического протока (3,7 мм). При постановке диагноза МРТ / МРХП выявило новое образование головки поджелудочной железы размером 3 см. КТ поджелудочной железы (3D) также идентифицировала эту массу с деформацией стенки двенадцатиперстной кишки. EUS подтвердил деформацию двенадцатиперстной кишки, а тонкоигольная аспирация (FNA) подтвердила рак. Образец его резекции содержал умеренно дифференцированный PDAC стадии IIB, мультифокальный PanIN-2 и PanIN-3.Цифровой NGS-анализ образца панкреатического сока, собранный за 4 месяца до постановки диагноза, обнаружил высокие концентрации мутанта KRAS (G12D) и мутанта SMAD4 (Q311X): обе мутации были обнаружены в его резецированном раке поджелудочной железы. Этот образец сока также имел мутацию GNAS (R201C), вероятно, из его IPMN. Образец его сока, собранный за 16 месяцев до постановки диагноза, имел низкие концентрации мутации SMAD4, Q311X, а также мутации, не обнаруженные при его раке. Низкие уровни KRAS G12D и GNAS R201C были обнаружены в 61-месячном преддиагностическом образце сока, но не мутации SMAD4 .

    Таблица 4

    Серийный сбор сока поджелудочной железы у пациента, у которого во время наблюдения развился рак поджелудочной железы.

    В случае № 35 (см. Дополнительную онлайн-таблицу S7) развился рак поджелудочной железы в его хвосте во время наблюдения за кистами поджелудочной железы. У этого пациента была выявлена ​​мутация TP53, R248Q в его резецированном первичном раке, которая была обнаружена с помощью цифрового NGS в образцах сока, собранных за 13 месяцев до постановки диагноза и при постановке диагноза. Ранее мы сообщали об использовании цифрового анализа кривой плавления с пиросеквенированием для обнаружения этой мутации в преддиагностическом образце сока в этом случае.13

    В случае № 48 (см. Дополнительную онлайн-таблицу S7) мутации были обнаружены в образце сока, собранном во время постановки диагноза, но не в образце сока, собранном за 15 месяцев до постановки диагноза. Во время этого 15-месячного визита с помощью EUS и МРТ были обнаружены атрофическая жировая ткань поджелудочной железы и небольшая киста тела поджелудочной железы (4,3 мм). После неоадъювантной терапии ему сделана тотальная панкреатэктомия.

    Пациенту № 53 в течение 4 лет было проведено пять контрольных посещений EUS (см. Дополнительную онлайн-таблицу S7). В течение первых 3 лет ЭУЗИ, МРТ и КТ выявили множественные кисты тела и хвоста поджелудочной железы размером менее сантиметра, а 2.Киста шейки поджелудочной железы 4 см с минимальным расширением прилегающего фокального протока, но без каких-либо проблем. Эта киста, взятая во время трех посещений EUS, не имела примечательного цитологического исследования. Преимущества хирургической резекции обсуждались на нашей междисциплинарной конференции CAPS, и был достигнут консенсус в отношении МРТ в течение 6 месяцев и EUS через 12 месяцев. Вместо этого пациенту была проведена обычная компьютерная томография брюшной полости через 12 месяцев, а через 4 месяца пациентка обратилась с жалобой на недавнюю потерю веса и боли в животе. КТ по ​​протоколу поджелудочной железы и 3D-реконструкция выявили новую компрессию двенадцатиперстной кишки.EUS выявила образование головки поджелудочной железы, вызывающее компрессию проксимального отдела двенадцатиперстной кишки, что ограничивало интубацию двенадцатиперстной кишки и препятствовало сбору панкреатического сока без изменения кист поджелудочной железы. FNA подтвердила рак. Пациенту была проведена панкреатодуоденэктомия по поводу диаметра 2,5 см, плохо дифференцированный, T3N1, край-отрицательный, PDAC и мультифокальный PanIN-2. Хирургическая патология пришла к выводу, что рак возник в результате IPMN, что согласуется с результатами визуализации. Микродиссекцию с помощью лазерного захвата проводили для выделения опухолевой ДНК из четырех областей резецированного рака поджелудочной железы (∼0.На расстоянии от 5 см до 1 см). Девяносто шесть цифровых NGS-реакций, выполненных на этих четырех образцах рака, и образец EUS / FNA рака выявили мутации в KRAS (G12D), TP53 (Q100Rframeshift) и SMAD4 (Q388X) во всех четырех образцах рака. а также субклональные мутации ( SMAD4, G386R, h390R) в некоторых образцах. Цифровой NGS образца EUS / FNA идентифицировал мутацию KRAS G12D и мутацию SMAD4 h390R, но другие мутации, обнаруженные при удаленном раке, не были обнаружены, несмотря на наличие адекватного образца FNA (с концентрацией KRAS G12D 13%) .Кроме того, в образце FNA обнаружена мутация, не обнаруженная в образцах резецированного рака ( TP53, L344P), что согласуется с генетической гетерогенностью в географических регионах поджелудочной железы и других карцином.30, 31 Мы также проанализировали три образца жидкости кисты поджелудочной железы, собранные 16– 36 месяцев до постановки диагноза рака поджелудочной железы. Каждый образец жидкости кисты содержал только мутаций GNAS R201C, KRAS G12V и KRAS G12D. Примечательно, что рак поджелудочной железы не имел мутации GNAS , что является дополнительным доказательством того, что рак не возник в результате IPMN.Цифровой NGS-анализ также был проведен на четырех образцах сока поджелудочной железы. Исходный образец сока, собранный за 4 года до постановки диагноза, содержал только низкие уровни мутанта KRAS . Образец сока, собранный ближе всего к ее диагнозу рака поджелудочной железы (прогноз на 19 месяцев), содержал мутаций кодона 12 KRAS и мутацию TP53 (Y220C), но не мутации SMAD4 или TP53 , обнаруженные при раке (см. таблица S6).

    Обсуждение

    Визуализация поджелудочной железы используется для выявления признаков неоплазии поджелудочной железы, но используемые в настоящее время тесты имеют ограничения: они не могут идентифицировать PanIN и часто не могут адекватно оценить неопластическую природу кист поджелудочной железы.EUS считается отличным тестом для обнаружения небольших твердых образований поджелудочной железы 32, но EUS может пропускать изоэхогенные поражения, а точность EUS для обнаружения очень маленьких (субсантиметровых) PDAC широко не изучалась.

    Молекулярный анализ панкреатического сока теоретически может предоставить доказательства наличия неоплазии поджелудочной железы, которая может быть не очевидна при визуализации поджелудочной железы. В целом, распространенность мутаций, обнаруженных с помощью цифрового NGS, в нашей исследуемой популяции согласуется с ожидаемой распространенностью мутаций в предшественниках новообразований и рака поджелудочной железы.11, 24, 33 Ранее мы продемонстрировали, что мутации KRAS и GNAS могут быть обнаружены в дуоденальных коллекциях панкреатического сока14, 15, 34 и что эти мутации обычно обнаруживаются у пациентов с раком поджелудочной железы и у пациентов, проходящих скрининг на их семейная история рака поджелудочной железы. Мы также обнаружили, что когда мутации (обычно мутант KRAS или GNAS) выявлялись в контроле без признаков неоплазии поджелудочной железы, их концентрации обычно были низкими, что согласуется с предыдущими сообщениями.14, 15 Поскольку у большинства пациентов с PanIN и IPMN низкой степени злокачественности инвазивный рак поджелудочной железы не разовьется, необходимы 35 дополнительных диагностических маркеров, более специфичных для наличия дисплазии высокой степени и раннего инвазивного рака поджелудочной железы. Мы обнаружили, что мутации в TP53 , которые, как считается, возникают при прогрессировании PanIN и IPMN от дисплазии низкой степени до высокой и инвазивного рака поджелудочной железы11, обычно обнаруживаются в образцах сока поджелудочной железы пациентов с инвазивным раком поджелудочной железы, но не обнаружен в контроле без новообразований.Низкие концентрации мутаций TP53 были обнаружены в меньшинстве случаев IPMN, но более высокие концентрации (оценка мутации ≥5) были обнаружены только в случаях рака поджелудочной железы. Потребуется долгосрочное наблюдение, чтобы определить, связаны ли низкие уровни мутаций TP53 в панкреатическом соке с неопластическим прогрессированием. Мы обнаружили, что общие концентрации мутантной ДНК могут отличать случаи PDAC от контроля с высокой точностью (AUC 0,89, p <0,001). SMAD4 Мутации были наиболее специфичными для рака поджелудочной железы; только 1 из 80 случаев без рака поджелудочной железы имел мутацию SMAD4 ; дело IPMN с функциями высокого риска.29

    Цифровые результаты NGS сока поджелудочной железы у лиц из группы высокого риска, находящихся под наблюдением, у которых впоследствии развился инвазивный рак поджелудочной железы, подчеркивают потенциальную клиническую полезность этого теста. В двух из этих случаев были обнаружены мутации SMAD4 или TP53 в образцах сока поджелудочной железы за 1 год до постановки диагноза рака поджелудочной железы, в то время как при визуализации не было выявлено никаких подозрительных поражений. Эти мутации совпадают с мутациями, обнаруженными при их раке.Эти случаи также дают некоторое представление о том, как быстро может возникнуть рак поджелудочной железы (и достичь стадии IIB) после не имеющего отношения к EUS экзамена. Хотя математическое моделирование генных изменений рака поджелудочной железы использовалось для оценки того, что для распространения инициирующей раковой клетки поджелудочной железы за пределы поджелудочной железы требуется много лет, 31 другой отчет, в котором исследовались рост и прогрессирование рака поджелудочной железы у пациентов, подчеркивает быстрое прогрессирование рака поджелудочной железы.36, 37 Таким образом, анализ с использованием возраста пациента и стадии опухоли на момент постановки диагноза, 36 наблюдений за степенью прогрессирования опухоли у некоторых пациентов, ожидающих резекции рака поджелудочной железы, 37, а также опыт скрининга пациентов с высоким риском - все поддерживают идею о том, что время, необходимое для роста рака поджелудочной железы от необнаруживаемой до обнаруживаемой стадии (представляющей рост через стадию T1 до более высоких стадий T), невелико (возможно, 1 год или меньше).Эти отчеты также согласуются с новыми математическими моделями роста первичной злокачественной опухоли, которые учитывают миграцию опухолевых клеток внутри опухоли.38 Поскольку конечной целью скрининга поджелудочной железы является предотвращение смерти путем выявления рака поджелудочной железы I стадии или, если возможно, PanIN-3 Текущие протоколы скрининга поджелудочной железы рекомендуют ежегодное наблюдение, даже если есть поражения, обнаруженные при визуализации.39

    Ограничения нашего отбора проб и анализа панкреатического сока в его нынешней форме предполагаются отсутствием каких-либо обнаруживаемых мутаций в нескольких случаях PDAC, а также отсутствие каких-либо обнаруживаемых мутаций в образце сока из случая № 48, собранном за 15 месяцев до их диагностики PDAC.Результаты случая № 53 также дали представление об ограничениях анализа панкреатического сока - мутации SMAD4 и TP53 , выявленные при раке, не были обнаружены в образце сока поджелудочной железы, собранном за 19 месяцев до диагностики, а также не было обнаружено GNAS R201C. мутация, обнаруженная в образцах жидкости кисты IPMN. Хотя мутации SMAD4 и высокие концентрации мутаций TP53 могут отличить случаи рака поджелудочной железы от пациентов с IPMN с высокой специфичностью, необходимы улучшения диагностической чувствительности нашего теста на панкреатический сок.Такие улучшения могут потребовать получения более качественного образца сока поджелудочной железы. Образцы панкреатического сока, собранные из двенадцатиперстной кишки, имеют гораздо более высокие концентрации мутаций, чем панкреатический сок, взятый из протока поджелудочной железы.12 Идеальный тест сока поджелудочной железы позволит отличить случаи с PDAC, IPMN с дисплазией высокой степени или PanIN-3 от пациентов с низкой степенью. дисплазия / PanIN-1, особенно в популяции высокого риска, где распространенность IPMN является обычным явлением2. Результаты в одном случае также выявили ограничения использования FNA для глубокого секвенирования для выявления мутаций в раке; несколько мутаций, присутствующих в образце резецированной опухоли, не были обнаружены в образце FNA.Этот случай подчеркивает проблемы, связанные с неоднородностью опухоли при проведении всестороннего мутационного анализа образцов опухоли поджелудочной железы. Одной из сильных сторон этого исследования было то, что мы смогли изучить профили мутаций сока поджелудочной железы у нескольких пациентов, образцы которых были собраны за несколько месяцев или лет до постановки диагноза рака поджелудочной железы. Необходимо изучить большее количество этих пациентов, чтобы лучше оценить тесты на раннее выявление рака поджелудочной железы, но для этого необходимо, чтобы большое количество пациентов проходило регулярный скрининг и сбор биологических образцов.

    Рак поджелудочной железы, возникающий у пациентов с уже существующей IPMN, часто не возникает из-за их IPMN. Это было верно в отношении четырех зарегистрированных случаев, когда под наблюдением развился инвазивный рак поджелудочной железы. Поскольку образцы сока поджелудочной железы содержат маркеры, распространяющиеся по всей протоковой системе поджелудочной железы, анализ образцов сока от пациентов с кистами поджелудочной железы может выявить доказательства PanIN или инвазивного рака, помимо их кисты. В этом отношении сок поджелудочной железы может иметь дополнительную роль к анализу жидкости кисты поджелудочной железы, который является лучшим образцом для анализа для определения неопластической природы кисты поджелудочной железы.22 Необходимость оценки всей поджелудочной железы, вероятно, будет особенно важной для пациентов с семейным анамнезом рака поджелудочной железы, которые часто имеют мультифокальные PanIN и IPMN в поджелудочной железе.40 Действительно, несмотря на то, что IPMN обычно выявляются у пациентов, проходящих скрининг поджелудочной железы учитывая семейный анамнез рака поджелудочной железы, считается, что большинство видов рака поджелудочной железы, которые развиваются у этих пациентов, возникают через путь PanIN.11 В соответствии с этой гипотезой гистологический обзор более 1000 видов рака поджелудочной железы не обнаружил значительных различий (например, большее количество случаев, связанных с IPMN. раковые заболевания) между семейными и спорадическими случаями.41 Признание важности PanIN в развитии рака поджелудочной железы, даже среди пациентов с кистами поджелудочной железы, имеет значение для того, как мы проводим скрининг пациентов с кистами поджелудочной железы, особенно пациентов с обширным семейным анамнезом рака поджелудочной железы. прогрессирование в рак, но пациенты с этими кистами могут по-прежнему получать пользу от регулярного наблюдения для выявления прогрессирования, связанного с PanIN.

    Цифровой анализ NGS может использоваться для выявления мутаций с низким содержанием в других биологических образцах, где ожидается, что концентрации мутаций будут ниже, чем предел обнаружения обычных анализов NGS, и, поскольку он может быть выполнен со стандартными реагентами NGS, может быть легко включается в протоколы молекулярно-диагностической лаборатории после внутренней оценки.

    Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *

    2019 © Все права защищены. Карта сайта