본문 바로가기

AI 독성예측

[AI독성예측] ChemoPy : freely available python package for computationalbiology and chemoinformatics

ChemoPy : 구조적 및 물리 화학적 feature를 계산하기 위한 open soruce 파이썬 패키지

16개의  drug feature 그룹안에 19개의 descriptor가 있고, 이는 1135개의 descriptor value를 포함함. --> 1135개의 descriptor value가 의미하는 것은 뭐지?

7가지 molecular fingerprint 제공
topological fingerprints,
electro-topological state(E-state) fingerprints,
MACCS keys,
FP4 keys,
atom pairs fingerprints,
topological torsion fingerprints
Morgan/circular fingerprints

semi empirical quantum chemistry progam(semi - 경험적 양자 화학 프로그램) MoPAC 을 적용하여 많은 수의 3D 분자 설명자를 편리하게 계산 가능.

고분자? 저분자? --> 분자량 기준으로 구분

이러한 descriptor들은 분자 구조가 분자 특성에 미치는 영향을 알아내기 위하여 분자 토폴로지의 구별된 측면을 캡쳐하고 확대한다. 

이러한 feature(캡쳐된 피쳐?)들은 단백질-리간드 네트워크에서 잠재적인 약물 target을 식별하기 위한 새로운 단백질-리간드 연관성을 예측하는데 널리 사용됨

분자 설명자를 계산하는 프로그램들
MARCH-INSIDE
TOPS_MODE
TOMO_COMD
Dragon
CODESSA
Molconn-Z
Chemistry Devlopment kit(CDK)
Indigo
JOELib
RDKit
Avogadro

not comprehensive(포괄적이지 않음)
limited to only a certain kind of feature(특정 종료의 피쳐에 제한)
note free, 
not easily access

 

 ChemoPy 는 MOPAC 최적화를 기반으로 수많은 분자 descriptor를 계산하는 최초의 open source 패키지.

QSAR모델을 사용하여 MIND-BEST와 같은 공용 웹서버 구현 기대

 

 

ID를 사용하여 KEGG,PubChem, DrugBank, CAS에서 분자구조를 쉽게 얻을 수 있음

많은 수의 2D, 3D 설명자를 계산 가능, Table1에 요약되어있음.

저분자에서 분자 설명자를 계산하는 방법은 2가지.

1. 내장 모듈 이용하는 것 : 16개 feature group의 설명자 안에 계산가능한 19개의 모듈이 있음. 

2. 설명자 계산 방법을 캡슐화하는 pychem 모듈을 가져와서 PyChem2D, PyChem3D 객체를 호출하는것.

MOPAC에서 AM1방법으로 최적화됨.  --> AM1이란?

MOPAC입력 파일은 Pybel 및 OpenBabel에서 직접 준비함

ChemoPy로 계산된 descriptor값이 정확한지는 확인 된 것임.