Ether0 — специализированная модель с 24 млрд параметров для химии. Разработана FutureHouse для проектирования соединений и решения практических задач: подсчёта атомов, проверки стабильности, генерации структур для синтеза в формате SMILES. Модель использует естественный язык для рассуждений и подбора оптимальных вариантов, комбинируя экспертизу по структуре, функциональным группам и токсичности. Основана на адаптации Mistral-Small-24B-Instruct-2501, прошла обучение на цепочках рассуждений, предсказаниях растворимости и синтеза, а также дистилляцию и обучение с подкреплением. В финале применяется GRPO — сравнение вариантов для выбора наиболее точного ответа. Тесты показали 50,1% точности в zero-shot задачах и 70% в проектировании молекул, превзойдя экспертов и другие модели. Модель избегает генерации опасных соединений на 80%, сохраняя точность. Лицензия: Apache 2.0. Подробнее: [ссылка].

От redactor

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
1 Комментарий
Межтекстовые Отзывы
Посмотреть все комментарии
Дмитрий
Дмитрий
11 дней назад

А я вот в прошлом году на проекте в фармкомпании ковырялся с похожими задачами. Сидел ночами, генерил SMILES для новых аналогов аспирина, вручную проверял стабильность в RDKit и ChemDraw — блин, сколько раз облажался с подсчётом функциональных групп, один раз чуть не запустил синтез токсичной хрени с нитрогруппами. Руки опускались, особенно когда модель предсказывала, что молекула развалится через 5 минут. Короче, потратил неделю на одну структуру, а толку ноль.

Теперь читаю про Ether0 — и прям мурашки, чувак. 24 миллиарда параметров, да ещё на Mistral-ке, с цепочками рассуждений по токсичности и стабильности. Если б она была тогда, сэкономил бы кучу времени, а не мучился как лох. Круто, что FutureHouse такое замутали, жду, когда протестирую в деле. Надеюсь, не подведёт с реальными синтезами!