Статья о поиске химических соединений с помощью Генеративно-Топографического Маппирования (GTM) в базах данных ChEMBL и ZINC. Показаны результаты поиска соединений, которые были протестированы в базе данных ChEMBL и показали высокую активность, но отсутствуют в базе данных ZINC, а также соединений, которые есть в базе ZINC, они предсказаны как активные, но их нет в базе ChEMBL. Найденные соединения были добавлены в базу данных PubChem спустя 6 месяцев после скачивания базы ChEMBL.
# Bigdata
Статья рассказывает о преимуществах цифрового хранения химических данных, таких как облегченный поиск, возможность легко делиться данными, следить за работой и качеством оформления журналов подчиненных, реализации инструментов моделирования и рекомендательных систем, сочленение со складом реактивов. Однако, многие исследователи не доверяют интернету и боятся слежки или утечки вследствие ошибки. Статья также упоминает статью в Nature о том, как цифровизация может дать синтетической химии новые возможности.
Перепост