Молодежная лаборатория «Медицинские цифровые изображения на основе базисной модели» («МедЦифра») создана в ДГТУ в 2024 году и является одной из пяти российских лабораторий, входящих в кампус Blue Sky Research – экспериментальный конкурс идей молодых ученых, применяющих большие языковые модели для решения задач в химии и биологии. Лаборатория представляет собой симбиоз двух коллективов: биологов и специалистов IT-систем.
Цель: Создание цифровых помощников человека.
Результаты стратегического проекта (в продуктовой логике), полученные в 2023 году:
Разработан программный продукт для анализа роста липобластов, фибробластов, адипоцитов при помощи искусственного интеллекта
Ключевые эффекты:
- Тестирование программы в региональных медицинских учреждениях
- Внедрение в патологоанатомические отделения РФ
Описание продукта: мультимодальная веб- платформа с gpt-ассистентами для исследователей и специалистов в области биомедицины. Разработка предполагает возможность работы с датасетами с открытым доступом и большим объемом данных конфокальной микроскопии, изображениями биопроб и тканей, а также анализа текстов результатов исследований в формате ассистента-обозревателя.
Эффект (ценность):
Медицина и ветеринария: повышение качества и сокращение срока диагностики заболеваний, в том числе на ранних стадиях. Сокращение времени и трудозатрат при проведении анализов до 99% (оцифровка препаратов и реагентов, разметка клеток при помощи ИИ, цифровой подбор изображений по метаданным, точность диагностики).
Наука и образование: междисциплинарная подготовка кадров нового поколения (IT + медицина и ветеринария), повышение качества и сокращение сроков подтверждения научных гипотез.
Заказчик: ООО «Вижнтех», Фонд молодежных инициатив Санкт-Петербурга,
ООО «Яндекс»
Срок разработки: 3 года
Ожидаемый объем выпуска: к 2030 г. веб-платформа с 4 ассистентами с вероятностью постановки верного диагноза не менее 90%. Плановая стоимость подписки около 70 тыс. руб. При использовании в 10% медучреждений и университетах объем рынка в год составит около 500 млн. руб.
Текущий статус разработки: УГТ 2. Собраны датасеты цифровых изображений для нейросетевых ассистентов. Настроены и обучены следующие модели: Llama, CogvLM, Clip, Sam. Построена оригинальная архитектура цифровых ассистентов. Нейросетевые модели эффективно дообучаются с помощью LoRa адаптации.
Оценка степени локализации: 100% российская разработка.
Разработка соответствует: кодам ГРНТИ 28.23.15 Распознавание образов. Обработка изображений, 34.57.23 Методы получения биомедицинской информации, 34.55.15 Математические и машинные модели биосистем / приоритетное направление НТР Превентивная и персонализированная медицина, обеспечение здорового долголетия.