AUC는 나쁘지 않은데 Recall이 낮다.
다른 특징을 추가하면 성능을 더 올릴 수 있지 않을까?
tox21에서 했던 방법을 적용해보자.
tox21에서는
801개 dense features
molecular weight(분자량) solubility(용해도) surface area(표면적)
272,776개 sparse features
chemical substructures(화학적 하위 구조)
를 이용했다.
이것을 어떻게 얻었는지 알아내야 한다.