Chemography: Searching for Hidden Treasures #virtualscreening #GTM #drugdiscovery #bigdata #дизайнлекарств #базыданных #большиеданные #хемоинформатика Поиск иголки в стоге сена является ключевой концепцией любого виртуального скрининга в процессе разработки лекарств. Эта задача только усложняется, когда мы хотим стог побольше и требования к кандидату построже. Мне бы хотелось представить вам статью, в которой мы показываем один из способов поиска такой химической иголки (как мы назвали её в статье "hidden treasures") в стоге из нескольких сотен миллионов молекул, доступных для покупке в онлайн магазине ZINC. Так, мы показываем в статье, что с помощью Генеративно-Топографического Маппирования (Generative Topographic Mapping или просто GTM) мы смогли отыскать соединения, которые были протестированы в базе данных ChEMBL и показали высокую активность, но отсутствуют в базе данных ZINC (потенциально плодотворное поле для размышлений для онлайн магазина), а также соединения, которые есть в базе ZINC, они предсказаны как активные, но их нет в базе ChEMBL (мы рассматриваем их как некий вызов медицинским химикам). В контексте последних было показано, что некоторые хемотипы таких подструктур были позже найдены в базе данных PubChem, которые показали высокую биологическую активность, как и было нами предсказано. Отмечу, что эти найденные соединения были добавлены в PubChem 6 месяцев спустя нашего скачивания базы ChEMBL, что является самой настоящей, хоть и не скоординированной экспериментальной валидацей наших предсказаний. https://pubs.acs.org/doi/10.1021/acs.jcim.0c00936