Способны ли нейронки делать самостоятельные открытия — на этот счет мнения ученых расходятся. Пока одни запускают инициативы вроде The Nobel Turing Challenge, другие применяют LLM в куда более приземленных сценариях. Мы в Beeline Cloud решили посмотреть, чего уже добились «ИИ-ученые» и как использовать их потенциал в мирных целях: в конце статьи есть подборка профильных open source-инструментов, которые могут облегчить работу по анализу и подготовке научных статей и исследований.
Еще в 2013 году директор Национального института исследования генома человека США Эрик Грин отмечал, что «естественные науки все больше напоминают индустрию по обработке бигдаты». А сегодня молекулярная биология фактически входит в эксабайтную эру — этому способствуют масштабы данных, собираемых в геномике, протеомике, метаболомике и биомедицинской визуализации. Если взглянуть на другие научные дисциплины, то один только телескоп «Хаббл» генерирует десятки гигабайт данных в месяц, а эксперименты на БАКе — десятки петабайт за тот же период.
На помощь приходят методы машинного обучения и нейросети, которые хорошо подходят для классификации, «просеивания» и анализа неструктурированных данных. Однако если сейчас ИИ-алгоритмы играют роль ассистента в исследовательском процессе, то впоследствии роли могут поменяться, и «ассистировать» будет уже человек: в научном сообществе все чаще поднимается вопрос так называемых безжизненных открытий (lifeless discoveries) — сценариев, при которых нейросети не только помогают анализировать данные, но и самостоятельно приходят к новым научным выводам.
Некоторые исследователи и футурологи предполагают, что в будущем система искусственного интеллекта сможет даже претендовать на Нобелевскую премию, сделав собственное открытие. Один из сторонников этой идеи — японский ученый и глава Института системной биологии Хироаки Китано. Он запустил инициативу The Nobel Turing Challenge, цель которой — разработать автономную систему ИИ, способную заниматься наукой и выдавать результаты, неотличимые по качеству от работ лучших человеческих умов, — и в теории получить Нобелевскую премию к 2050 году. Разумеется, на данный момент ни одна нейросеть не заслужила «нобелевку», но в 2024 году высшую академическую награду получили разработчики интеллектуальной системы — AlphaFold. Модель научилась с высокой точностью предсказывать трехмерную структуру белков, решив задачу, над которой биологи бились более полувека.
Пускай сейчас до академических наград нейросетям далеко, но разработчики пытаются научить современные системы ИИ выдвигать собственные гипотезы и проверять их. Например, такую нейросеть развивают в Ругтгертском университете, правда, пока ее тестируют на уже известных научных открытиях. В частности, нейронка «переоткрыла» некоторые законы о движении планет, опираясь на наблюдения Тихо Браге и Иоганна Кеплера, собранные более четырех веков назад — например, первый закон Кеплера, который гласит, что каждая планета движется по эллиптической орбите, в одном из фокусов которой находится Солнце, а также закон всемирного тяготения Ньютона.
В 2020 году специалисты из Швейцарской высшей технической школы Цюриха представили проект SciNet, чтобы проверить, способна ли нейросеть содействовать новым открытиям в физике и пользоваться физическими законами, как настоящий ученый. Модель успешно протестировали на «игрушечных задачах» из разных разделов физики. В одном из экспериментов нейросеть использовала законы сохранения и смогла предсказать движение двух сталкивающихся частиц, а в другом — вычислила, где на небе будут находиться Солнце и Марс в определенный момент.
Примером ИИ-системы, которая уже применяется на практике, может быть программно-аппаратная платформа CRESt от команды из MIT. Ее цель — помочь найти решения реальных проблем в энергетике и ускорить разработку материалов с заданными свойствами. Сперва специальный алгоритм анализирует научные публикации, ищет описания элементов и прекурсоров, которые могут быть полезны при синтезе. Затем их эффективность проверяется на практике: аппаратная часть CRESt включает роботизированную руку для работы с жидкостями, систему для резкого нагрева материала, автоматизированную электрохимическую лабораторию, а также набор камер, позволяющих отслеживать ход экспериментов, выявлять потенциальные проблемы. Платформа CRESt уже помогла разработать материал для топливного элемента, а всего с ее помощью провели порядка 3,5 тыс. электрохимических испытаний.
Интеллектуальные инструменты, которые помогают исследователям «просеивать» научную литературу, анализировать публикации — и в целом работать с большими наборами данных, появляются не только в формате проприетарных проектов научных лабораторий, но и в open source. Вот некоторые из них:
Это — мультиагентная система для автоматизации научных исследований, которую представили инженеры из исследовательской компании FutureHouse. Каждый агент отвечает за отдельный этап научного пайплайна. Так, модули Crow, Falcon и Owl выполняют поиск тематической литературы, а также объединяют данные из различных источников. Другой агент — Finch — проводит комплексный анализ собранной информации.
На счету Robin уже есть первое практическое достижение — новый способ лечения сухой формы возрастной макулярной дегенерации (хроническое заболевание, которое приводит к снижению остроты зрения у пожилых людей). Агенты провели обзор научных публикаций и выдвинули гипотезу о том, что усиление фагоцитоза клеток пигментного эпителия сетчатки (RPE) может иметь терапевтический эффект. Затем они оценили набор молекул-кандидатов, способных повлиять на этот процесс. После исследователи протестировали предложенные соединения в лаборатории и нашли подходящее.
Это — система предварительной оценки научных текстов перед отправкой в профильные журналы. Она анализирует структуру статьи, качество изложения, предоставляя подробную обратную связь по каждому разделу. Проект разработан двумя выпускниками Швейцарской высшей технической школы Цюриха в 2024 году и находится на ранних этапах разработки — однако авторы уже обозначили дальнейшие планы. Они хотят добавить агента, который проанализирует аннотацию статьи и подберет релевантные, но не процитированные работы. Кроме того, в будущем в системе может появиться ИИ-ассистент для написания документов — «как Cursor, но для статей».
Это — Python-библиотека, разработанная при участии специалистов из лаборатории Fermilab, принадлежащей Министерству энергетики США. Ее цель — помочь ученым справляться с обработкой больших объемов данных и ускорить работу ML-моделей на аппаратном уровне. По сути, библиотека позволяет взять код, написанный с использованием фреймворков вроде PyTorch и TensorFlow, и выполнить инференс на FPGA. Программирование таких устройств обычно требует узкоспециализированных знаний, однако hls4ml снижает порог входа. По словам авторов, библиотека находит применение в самых разных областях — от физики высоких энергий до термоядерного синтеза.
Некоторые специалисты утверждают, что интеллектуальные ассистенты могут повышать эффективность и производительность труда ученых. Однако к заявлениям о радикальном росте продуктивности стоит относиться с осторожностью. В январе 2026 года группа специалистов, в которую вошли исследователи из Китая и США, с помощью специально обученной нейросети проанализировала более 40 млн научных публикаций за период с 1980 по 2025 годы — из сфер биологии, химии, физики и других. Авторы пришли к выводу, что ученые, использующие ИИ-ассистентов в своей работе, чаще публикуются и цитируются, а также быстрее продвигаются по карьерной лестнице.
Также показателен случай с исследованием, опубликованным аспирантом MIT. В выборку вошли работы более тысячи специалистов, разделенных на группы по образованию, опыту и предыдущим достижениям. Вывод, который сделал автор: использование ассистентов увеличивает число открытий на 44%, а количество патентных заявок — на 39%. Правда, после проведения ревью институт отозвал публикацию — у рецензентов возникли опасения по поводу достоверности исследования: «Мы сообщаем, что MIT не уверен в происхождении и надежности данных, а также в правдивости исследования, представленного в данной статье. Исходя из этого, мы также считаем, что публикация данной статьи на arXiv может нарушать Кодекс поведения платформы».
Возможно, нейросети когда-нибудь сумеют совершить важное открытие. Может, это даже произойдет к 2050 году, как предсказывают эксперты. Но пока системы ИИ остаются лишь одним из вспомогательных инструментов, потому что главный двигатель прогресса — все еще человеческое любопытство (пожалуй, оно и к лучшему).
Дополнительное чтение по теме в нашем блоге:
Как собрать ИИ-агента — открытые руководства для чтения
Какие еще проблемы кибербеза предсказали фантасты 40-70-х?
Карьерный буст в новом году: читаем научно-техническую литературу эффективно
Когда метод «просто погугли» не работает. Нишевые open source-инструменты для работы с научной и технической литературой
Источник

