/ ACTIVITY

DEVOCEAN 7월 Tech 세미나 - 다가오는 Automated AI 시대, 그 기반 기술과 적용사례

대외활동 게시글 목록

다가오는 Automated AI 시대, 그 기반 기술과 적용사례

7월 테크 세미나 주제는 다가오는 Automated AI 시대, 그 기반 기술과 적용사례

이번 테크 세미나 주제는 오랜만에..!!
제가 가장 관심있어하는 AI와 관련된 주제가 나왔습니다. ㅎㅎ
특히 Auto ML과 XAI에 관한 이야기로 진행되어 너무 재미있고 유익한 시간이었습니다.

https://devocean.sk.com/vlog/view.do?id=425&vcode=A03

순서는

  1. Hyper-parameter Optimization
  2. XAI
  3. Use-Case
    순으로 진행되었습니다.

Hyper-parameter Optimization

먼저 Auto ML의 Coverage는 점차 넓어지고 있으며 현재는 데이터 이해부터 모델 평가까지 비즈니스 이해를 제외하고 굉장히 넓게 활용되고 있다고 합니다.

데이터의 Hyper Parameter을 정하는 것은 작업자가 직접 세팅해줘야하는 학습 데이터에 의해 변경되지 않는 값인데 이를 최적화시키는 것을 탐색해주는 역할을 합니다.

조합, Grid Search, Random Search는 매우 많은 숫자를 탐색해야하지만 적절한 탐색 범위를 제한해야하거나 느리고 최적의 값이 아닐 수 있다는 단점이 있습니다.

그렇기 때문에 이런 최적의 Hyper Parmaeter을 찾는 방법으로 Successive Halving Algorithm을 소개해주셨습니다.

SHA는 미리 Early Stopping을 수행하여 절반으로 줄여가며 평가를 진행하는 방법입니다.

아직 한번도 Auto ML을 활용해본 경험이 없어서 다음 프로젝트에서는 한번 사용해보고 싶습니다. ㅎㅎ

XAI

XAI는 데이터를 활용하면 항상 궁금증이 생길 수 밖에 없는 부분이라고 생각합니다.
Black-Box Model을 해석하고, 동일한 기준으로 알고리즘을 해석하기 위해 연구되고 있습니다.

예를 들어, 특정 Feature을 섞으면 모델 성과가 어떻게 바뀔지(Permutation Importance), 현재 모델의 예측력을 활용하면서 다른 모델의 설명력을 활용하는 방법(Surrogate Model)에 대해 알아보는 Concept에 대해 설명해주셨습니다.

대표적인 방법으로 LIME과 SHAP에 대해 소개해주셨으며 제가 사용해본 방법론 두가지의 이론적 배경을 다시 복습할 수 있는 좋은 기회였다고 생각합니다.

그 외에도, PDP(Partial Dependence Plt)이라는 다른 Feature을 고정하고 관심 Feature을 구간별로 변화시키면서 Target의 변화를 관찰하는 방법론에 대해 알아보았습니다.

Use-Case

Auto ML은 커버리지를 상당히 늘릴 수 있으며 최소 구축 비용으로 신뢰할 수 있는 결과를 가져올 수 있는 방법으로 많이 활용하고 있습니다.

강점으로 최소의 Resource, 최대의 효과, 검증된 알고리즘, 신뢰도 높은 결과물, 과제 아이디어와 데이터만 준비하면 활용 가능하다는 장점이 있습니다.

결론

아무래도 질문이 Auto ML이 데이터 과학자를 대체할 수 있을까? 에 대한 질문이 많이 등장하였습니다.
정답은 사실 모르겠지만 현업에서 바라보는 관점은 주니에 데이터 과학자들에게 영향을 줄 수 있지 않을까? 라는 대답을 해주셨습니다.
Auto ML과 XAI를 따로 배우지 않고 공부를 딥하게 해보진 못했지만 이번 강의를 통해 어떤 개념으로 활용되고 있는지 알수 있었던 좋은 기회였습니다.