"Машины могут строить гипотезы, проводить эксперименты по их проверке и оценивать результаты, причем без вмешательства человека"
Росс Кинг

Можно ли автоматизировать научные открытия? Я имею в виду не автоматизацию экспериментов, а возможность создания машины - робота-ученого, - способной получать новые научные знания? Мы с коллегами потратили десять лет на создание такой машины. У нас было два основных мотива. Первый - желание лучше понять суть науки. Знаменитый физик Ричард Фейнман сказал: «Если я чего-то не могу создать, значит я этого не понимаю». Согласно такой логике, попытка создать робота-ученого требует от нас выработки конкретных технических решений, включающих в себя взаимоотношения между абстрактными и реальными объектами и между наблюдаемыми и теоретическими явлениями, а также пути порождения гипотез. Второй мотив был практическим. Робот-ученый может вести исследования продуктивнее и с меньшей затратой средств. Некоторые научные проблемы настолько сложны, а их решение требует таких масштабных исследований, что для их проведения просто не хватит исследователей. И все надежды на решение таких проблем мы возлагаем на автоматизацию.
Компьютерные технологии для научных исследований непрерывно совершенствуются. В их число входит «высокопроизводительная» автоматизация лабораторий для секвенирования ДНК и проверки лекарств. Менее известно, что компьютеры могут проводить автоматизированный анализ данных и их начинают применять для выдвижения оригинальных научных гипотез. Например, в химии самообучающиеся программы помогают создавать лекарства. Цель робота-ученого - объединение технологий для автоматизации всего научного процесса: формирования гипотез, разработки и проведения экспериментов для проверки этих гипотез, интерпретации получаемых результатов и повторения таких циклов до тех пор, пока не будут получены новые сведения.
Ключевой вопрос состоит, разумеется, в том, можем ли мы создать робота, способного на деле осуществлять весь этот процесс. Возможности двух роботов, созданных в нашей лаборатории, и еще нескольких, построенных во всем мире, дают основания ответить утвердительно.
Первая работа по применению искусственного интеллекта для получения научного открытия проводилась в 1960-1970-х гг. в Стэнфордском университете. Компьютерная программа Dendral была разработана для анализа масс-спектрометрических данных, а родственная ей программа meta-Dendral стала одной из первых систем обучения машин. Исследователи пытались создать автоматический прибор для поиска признаков жизни на Марсе в ходе миссии NАSА Viking в 1975 г. К сожалению, уровень техники в то время не позволил решить эту задачу. Однако с тех пор такие программы, как Prospector (для геологии), Bacon (более универсальная) и более поздние "Преемники», дали возможность автоматизировать такие задачи, как выработка гипотез и разработка экспериментов для проверки этих гипотез.
Однако для большинства таких программ способность выполнять задуманные эксперименты на практике не предусмотрена, что совершенно неприемлемо, если речь идет о том, что системы искусственного интеллекта должны работать хотя бы в полуавтоматическом режиме.
Наш робот, Адам, не похож на человека. Это сложная автоматизированная лаборатория, занимающая небольшую комнату. Она оснащена различными приборами, такими как фризер (низкотемпературный морозильник), роботы для манипулирования жидкостями, три автоматические руки, три инкубатора, центрифуга и т.д., причем все автоматизировано. Разумеется, у Адама есть и мощный мозг - компьютер, который ведет рассуждения и управляет персональными компьютерами, в свою очередь управляющими аппаратной частью системы.
Адам исследует рост колоний микроорганизмов, выбирая штаммы организмов и питательную среду и наблюдая рост в течение нескольких суток. Робот способен совершенно самостоятельно запускать в работу около тысячи сочетаний «штамм-среда». Мы разрабатывали его для очень важной области биологии, которая напрашивается на автоматизацию: функциональной геномики, т.е. исследований взаимоотношений генов и их функций.
Первое полное исследование было проведено на дрожжах Saccharomyces cerevisiae - одноклеточных грибах, используемых в пекарном деле, пивоварении, виноделии и производстве виски. Биологов дрожжи интересуют прежде всего как «модельный» организм для понимания того, как работают клетки человека. Клетки дрожжей имеют гораздо меньше генов, чем клетки человека, а выращиваются они быстро и легко. И не важно, что последний общий предок дрожжей и человека существовал, вероятно, около миллиарда лет назад: эволюция очень консервативна, и большая часть того, что верно для клеток этих организмов, подходит и для наших клеток.
Работа Адама направлена на исследование не решенной пока проблемы того, как дрожжи используют ферменты (сложные белки, служащие катализаторами определенных биохимических реакций) для превращения веществ своей питательной среды в новые клетки и отходы «производства». Ученые все еще не до конца понимают этот пр¬цесс, хотя изучают его больше 150 лет. Нам известны многие ферменты, вырабатываемые этими одно-клеточными грибами, но во многих случаях мы не знаем, в каких генах они закодированы. Адаму было поручено обнаружить гены, которые кодируют эти ферменты.
Чтобы получить новые знания, Адам должен располагать множеством уже известных сведений. Мы заложили в его программу базовые знания о метаболизме и функциональной геномике дрожжей. Обсуждать утверждение, что Адам располагает базовыми «знаниями», а не информацией, предоставим философам. Мы считаем употребление термина «знания» оправданным, потому что Адам использует их для рассуждений и в качестве руководства при взаимодействии с реальным миром.
Для представления своих знаний Адам использует логические суждения. Логика впервые была разработана 2,4 тыс. лет назад для более точного описания знаний, чем мог язык. Современная логика - это наиболее точный способ представления и обмена научными знаниями между роботом и человеком, не допускающий двусмысленных толкований. Что удобно, логика может использоваться и в качестве языка программирования, и это позволяет интерпретировать имеющиеся у Адама знания как компьютерную программу.
Чтобы запустить порученную Адаму программу исследований, мы заложили в его «мозг» множество фактов. Вот типичный пример: у 5. сегеогзгае ген АВОЗ кодирует фермент З-дезокси-D-арабиногеп-тулосонато-7-фосфат-синтетазу. Мы сообщили Адаму также связанные с этим факты, например, что этот фермент служит катализатором для реакции фосфоэнолпирувата с D-эритрозо-4-фосфатом с образованием 2-дегидро-З-деокси-D-арабино-гептонат-7-фосфата и фосфата.
Собранные вместе, эти факты образуют модель метаболизма дрожжей и объединяют данные о генах, ферментах и метаболитах (продуктах обмена веществ в клетке). Разница между моделью и простым набором данных состоит в том, что первую можно преобразовать в программу, способную оперировать данными с целью составле¬ния прогнозов. Робот-ученый способен объединять абстрактные научные модели с лабораторной автоматикой для автоматической проверки и уточнения моделей.