Coding/기타 3

Support Vector Machines (SVM) 서포트 벡터 머신

서포트 벡터 머신 데이터가 어디에 속할지 판단하는 선형 분류 모델이다. margin,robustness을 최대화하는 기준을 택한다. Kernel Trick 커널 트릭은 차원을 높여 매핑하는 작업을 의미한다. 고차원 공간에서 쉽게 구분한 뒤 저차원으로 다시 매핑하는 기법이다. Source https://bkshin.tistory.com/entry/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-2%EC%84%9C%ED%8F%AC%ED%8A%B8-%EB%B2%A1%ED%84%B0-%EB%A8%B8%EC%8B%A0-SVM

Coding/기타 2022.04.14

Decision Trees(의사 결정 나무)와 Random Forests(랜덤 포레스트)

Decision Trees : 의사결정나무 의사결정나무 모델은 스무고개와 비슷하게 데이터를 feature 기준으로 순차적으로 분류한다. 전체적으로 나무를 뒤집어놓은 것과 같은 모양이며, 처음 노드를 root node, 중간을 intermediate node, 끝을 terminal node라 부른다. 큰 분산을 갖기 때문에 깊이가 매우 깊은 모델은 overfitting에 취약하다. Random Forest 의사결정나무의 단점을 보완한 랜덤포레스트 모델은 여러개의 의사결정나무 모델을 만들고, 데이터를 중복 가능하게 추출(bootstrap aggregating)해 임의로 각 모델에 넣는다. 그 이후 나온 모든 모델의 결과를 합산(앙상블)하여 예측을 하게 된다.

Coding/기타 2022.04.13

인공지능, 데이터 엔지니어 / 사이언티스트 / 애널리스트 직무 비교 정리.

데이터 직무란 데이터 직무는 기업 내 데이터를 가공, 관리, 활용하는 업무를 말한다. 데이터 자체를 중점적으로 다루는 데이터 집중 직무와, 데이터를 활용하는 데이터 활용 직무로 나뉜다. 데이터 집중 직무는 데이터 엔지니어, 데이터 사이언티스트, 데이터 분석가로 나뉜다. (그러나 회사마다 각 직무의 구분이나 명칭은 다르다) 데이터 엔지니어 (Data Engineer) 주요 업무 데이터의 수집과 관리 담당 (개발에 집중된 유형) 데이터 전처리, 다른 업무에 사용할 수 있도록 공급 데이터 처리를 위한 시스템을 구축, 관리, 최적화 일반적으로 데이터 엔지니어는 AI와 거리가 멀다 학위 학위보다 실력이 중요 필요 역량 대량의 데이터에서 필요한 부분을 추출하는 능력(ETL) 개발자에 가까운 직업으로 코딩 실력이 중..

Coding/기타 2022.02.23