Камиль Исаев, вице-президент корпорации EMC, генеральный директор Центра исследований и разработок в "Сколково"
© ComNews
21.07.2014

В мае 2014 года исполнился год с момента открытия R&D-центра компании EMC в "Сколково". Вице-президент корпорации EMC, генеральный директор Центра исследований и разработок в "Сколково" Камиль Исаев рассказал корреспонденту ComNews Александру Калигину о деятельности центра.

- Недавно компания EMC отметила первую годовщину открытия Центра исследований и разработок EMC в "Сколково" при кластере информационных технологий. В чем заключается его деятельность?

- Компания EMC получили статус ключевого партнера "Сколково" в конце 2012 года, еще до открытия R&D-центра. Входя в консультационный индустриальный совет фонда, мы принимаем участие в управлении проектом "Сколково", основываясь на накопленном опыте и знаниях.

Мы являемся участниками не только самого совета, но и рабочей группы при нем. Задачей этой группы является предложение механизмов, благодаря которым крупные компании могли бы способствовать ускоренному развитию проекта.

Что касается R&D-центра, то за это время он не только был создан как юридическое лицо. Также были созданы все необходимые органы управления, составлены планы деятельности, эти планы защищены на уровне корпорации, получено финансирование, составлены пакеты проектов, и эти проекты начали осуществляться. Были налажены партнерские отношения с целым рядом организаций внутри EMC, так как руководство должно понимать, что R&D-центр приносит пользу всей корпорации. Также в рамках проектов в "Сколково" мы вступили в партнерские отношения с рядом как зарубежных, так и российских компаний.

Штат R&D-центра в "Сколково" состоит из сотрудников EMC и нанятых консультантов в пропорции примерно 4 к 1. Консультантами являются специалисты из тех областей, в которых мы сами не являемся экспертами.

EMC – инжиниринговая компания, но развивать направление R&D мы начали относительно недавно. Несколько лет назад был создан центр исследований в Бразилии, который специализируется на решениях для нефтегазового комплекса. В "Сколково" же мы решили развивать другую сферу – медицину будущего. Наша идея заключается в создании решений на основе инфраструктуры EMC для пользователей из данной области человеческой деятельности.

За прошедший год в центре было запущено несколько важных проектов, посвященных сферам геномной биоинформатики, интеллектуальных сетей и технологий больших данных. Разрабатываемые совместно с партнерами решения на стыке ИТ и биологии помогут эффективно и быстро осуществлять диагностику сложных заболеваний.

- Почему вы выбрали именно это направление?

- Мы считаем его актуальным по нескольким причинам. Никто из сотрудников EMC не является ни доктором медицины, ни генетиком. Мы все сотрудники ИТ-индустрии. Но мой небольшой опыт, накопленный за последний год, позволяет утверждать, что биомедицинское направление в настоящее время играют роль одного из драйверов мировой науки. Эта роль аналогична той, которую играли 50-60 лет назад ядерный и космический проекты.

В 1981 году я поступал на физфак МГУ. На то время как раз пришелся пик популярности физических наук. Государство поддерживало системообразующие мегапроекты, в которых участвовали профессионалы из смежных областей – физики, математики, программисты. В современном мире биомедицинские науки играют аналогичную роль. Их поддерживают правительства большинства развитых и развивающихся стран. Они привлекают к себе специалистов из смежных областей знаний.

Например, американский Broad Institute, учредителями которого являются Harward и MIT, – это один из крупнейших мировых центров секвенирования генома человека. Его бюджет составляет около $300 млн в год. Половина этой суммы приходит из федерального правительства США, а вторая половина - из различных благотворительных фондов и коммерческих проектов. В Европе также существует целый ряд подобных научных центров - например, European Bioinformatics Institute, Sanger Institute, Genomics England – некоммерческая организация, созданная правительством Великобритании для секвенирования 100 тыс. геномов. Огромное значение исследованиям подобного рода уделяется в Китае. В Beijing Institute of Bioinformatics работает свыше 300 сотрудников, 20 секвенаторов, ЦОД на 5000 вычислительных ядер.

Все эти организации, а также около 170 похожих на них, являются членами глобального альянса Global Alliance for Genomics and Health, задача которого - предложение оптимальных трендов интеграции геномных и клинических данных. EMC наряду с крупнейшими ИТ-компаниями, такими как Google, Amazon, Microsoft, IBM, также является членом этого альянса.

Первый проект по расшифровке генома человека закончился чуть более 10 лет назад. Он занял 10 лет и стоил миллиарды долларов. С тех пор стоимость полногеномного секвенирования стремительно падала. Сейчас она приблизилась к отметке $1 тыс. за одно исследование. Накопление знаний и существенное падение стоимости исследований в этой области позволяет надеяться на то, что данные методики будут широко внедряться в практическую медицину.

Так как в ДНК человека свыше 3 млрд пар нуклеотидов, расшифровка одного генома имеет такое количество данных, которое будучи умноженным на 1 млн исследованных людей дает типичную задачу, связанную с Big Data. Поэтому таким компаниям, как EMC, следует этим заниматься.

- Расскажите подробнее о работе EMC в данном направлении?

- Исследования генома человека будет иметь смысл, только если их результаты эффективно интегрировать в клиническую практику. Процесс интеграции нетривиален с точки зрения ИТ-поддержки, так как требования к хранению, обработке, анализу и безопасности данных в научном и клиническом мире существенно различаются. Если в научном мире мы наблюдаем максимальную открытость, возможность делиться результатами исследований, возможность сотрудничества ученых из разных стран, то в клиническом мире все наоборот. Там присутствует строгая конфиденциальность, жесткие этические нормы, законы, которые регулируют доступ к данным и безопасность этих данных. Кроме того, эти законы различаются в разных странах.

Информационная система, которая призвана решать эту проблему, должна совмещать открытость науки с закрытостью медицины и давать возможность работать одновременно с теми и с другими данными. Поэтому ИТ-платформа должна отвечать ряду требований. Во-первых, она должна быть масштабируемой, ведь речь идет о работе с огромными массивами данных, которые требуют высокопроизводительных вычислений. Во-вторых, стоимость системы не должна быть слишком высока, иначе никто не сможет себе ее позволить. В-третьих, платформа должна быть оснащена мощными средствами аналитики. Далеко не все данные, накопленные в результате исследования тех или иных геномов, позволяют извлечь нужную информацию для лечения тех или иных заболеваний. В-четвертых, мы сталкиваемся с новыми требованиями к информационной безопасности, которые совмещают разные критерии и правила работы с разными данными. При этом всем система должна быть проста в использовании. С ней будут работать люди, которые не являются профессионалами в области ИТ, – практикующие доктора, генетики, научные сотрудники.

Одновременное совмещение этих требований составляет непростую инженерную задачу. Для ее решения подойдет технология гибридных облаков. Часть решения построена на основе частной инфраструктуры компании, например клиники, которая обеспечит высокий уровень безопасности, надежность хранения данных будет обеспечена целым рядом программных решений. Также будет публичная часть, расположенная в облаке, доступ к которому получат все заинтересованные стороны. Концепция гибридного облака является одной из ключевых стратегий компании EMC.

- Кто является партнером компании EMC в данном проекте?

- Как я уже говорил, никто из нас не является доктором медицины или профессиональным генетиком, поэтому, для того чтобы понять, какие актуальные задачи стоят перед пользователями, нам необходимо вступать в партнерство с компаниями, работающими в этой области. Проекты в области геномной биоинформатики осуществляются вместе с партнерами компании из Parseq Lab (бывшая Sequoia Genetics) и Лаборатории алгоритмической биологии Академического университета РАН под руководством профессоров Павла Певзнера и Максима Алексеева. С партнерами из корпорации Intel центр исследований и разработок EMC решает задачи по созданию инновационных решений для облачных вычислений и аналитики больших данных.

Для осуществления работы в области интеграции геномных и клинических данных необходимо иметь доступ к ним. Это непростая задача, так как данные должны быть в цифровом виде. Они должны содержать не только текстовую информацию, но и результаты анализов, кардиограмм, рентгена. Поэтому мы ищем партнеров, которые могли бы помочь выработать механизм, позволяющий получить такой доступ в той части, которая нам необходима.

- Каковы планы по дальнейшему развитию R&D-центра?

- Пока в центре работает 10 человек. До конца года мы намерены увеличить штат до 20 человек, а через два года - до 50. Также мы планируем начать разработки и в других направлениях. Если проект медицины будущего интернационален, то второе направление, которое мы выберем, должно быть привязано к российскому рынку. Поэтому его выбор во многом зависит от того, каких мы найдем партнеров для его осуществления. У этих партнеров должна быть необходимость, возможность и желание сотрудничать с нами. Пока в России существует не очень много проектов в области больших данных. Как потенциальные сферы, в которых мог бы пригодиться наш опыт, мы рассматриваем нефтегазовую, телекоммуникационную и рекламную отрасли. У нас уже есть несколько идей, но проектом их пока назвать нельзя.