Современные научные исследования невозможны без накопления и анализа сверхбольших массивов данных, содержащих миллиарды описаний физических объектов, каждый из которых описан значениями миллионов показателей. Сверхбольшие массивы данных характерны для современной биомедицины, хемоинформатики, молекулярной фармакологии, системной биологии и важны для выявления достоверных исследований, разработки эффективных и безопасных лекарств и эффективных биомаркёров. Интеллектуальный анализ таких «сверхбольших данных» (т.н. “big data”) обуславливает необходимость разработки специальных вычислительных методов.
В Институте фармакоинформатики разрабатываются, апробируются и практически применяются методы и алгоритмы анализа «сверхбольших данных» (в частности, данных из области биомедицины и фармакологии). Математической основой для разработки новейших подходов к анализу сверхбольших данных являются:
- топологический подход к анализу плохо-формализованных задач распознавания и классификации,
- метрический подход к анализу разнородных признаковых описаний,
- теория анализа размеченных графов,
- алгебраический подход к синтезу корректных алгоритмов,
- комбинаторная теория разрешимости,
- теория классификации значений признаков,
- метрическая теория корректности и полноты алгоритмов.
Основные исследовательские направления Института фармакоинформатики:
- Разработка математических методов выявления закономерностей, скрытых в сверхбольших данных
- Разработка и применение алгоритмов анализа «сверхбольших данных»
- Разработка методов высокоточной донозологической диагностики
- Анализ генетических предрасположенностей к «болезням цивилизации»
- Исследование системной биологии микронутриентных кофакторов
- Интеллектуальный анализ данных для доказательной медицины
- Хемоинформационный анализ перспективных лекарственных средств
- Биофизическое моделирование лекарств и таргетных белков
- Интеллектуальный анализ масс-спектрометрических данных
- Разработка алгоритмов для поиска и классификации научной литературы
- Вне-биологические приложения разрабатываемых алгоритмов анализа данных
Фармакоинформационный подход к разработке перспективных препаратов и к оценке эффектов имеющихся лекарственных препаратов подразумевает использование методов интеллектуального анализа разнородных биомедицинских данных (в т.ч. методов прогнозирования состояний пациента в зависимости от анамнеза, приема различных лекарств, биомаркеров и других показателей), методов молекулярной фармакологии и биоинформатики (включая прогнозирование структур белок-лигандных комплексов (докинг), распознавание/прогнозирование пространственных структур белков, функциональных классов белков на основе аминокислотных последовательностей и др.), методы хемоинформатики (прогнозирование фармакологических свойств молекул-лигандов на основе их молекулярных структур), автоматизированный анализ сверхбольших массивов биомедицинских публикаций (десятки миллионов документов), разработку эффективных методов обработки сверхбольших массивов данных, получаемых в результате исследования живых систем современными высокопроизводительными (high-throughput) методами и др.
В основе разрабатываемых нами инновационных подходов к фармакоинформационному анализу лежат математически обоснованные методы выявления скрытых закономерностей. Эти методы разрабатываются в рамках проблемно-ориентированных теорий, позволяющих разрабатывать вычислительно-эффективные алгоритмы для пред-обработки и анализа разнородных данных (например, разнородных признаковых описаний пациентов, молекулярных маркеров заболеваний, химической и пространственной структуры фармацевтических препаратов, таргетных белков и т.д.).
Основной областью применения разрабатываемых методов интеллектуального анализа данных и основанных на них высокоэффективных вычислительных систем является биомедицина. Тем не менее, разрабатываемые методы применяются и в совершенно других областях современной науки: например, в материаловедении (для прогнозирования свойств высокотемпературных сверхпроводников и других перспективных материалов) и др.
Структурные подразделения Института фармакоинформатики:
- Лаборатория математических методов анализа сверхбольших данных
- Лаборатория интеллектуального анализа разнородных биомедицинских данных
- Лаборатория хемоинформационного анализа перспективных лекарственных средств
- Лаборатория системной биологии и биоинформатики
- Лаборатория интеллектуального анализа данных доказательной медицины
- Лаборатория интеллектуального анализа данных высокопроизводительных методов
- Лаборатория биофизического моделирования лекарств и таргетных белков