"AI역량검사의 정확도와 타당도는 신뢰할 수 있는 수준인가요? 그리고 정확도 및 타당도 판단 기준과 이를 뒷받침할 실제 통계 수치가 궁금합니다"
"성과 분류 정확도와 상관계수를 AI역량검사 타당도 판단 기준으로 활용합니다"
JOBFLEX는 AI역량검사 모형의 타당도를 보다 객관적이고 과학적으로 파악하기 위해 “분류정확도 분석”과 “상관분석” 결과를 활용하고 있습니다.
분류 정확도는 대상을 얼마나 정확하게 분류하는지를 나타냅니다. 예를 들어, 동물을 분류하는 AI모형에 10개의 고양이의 사진을 넣었을 때 9개의 사진이 고양이 사진이라는 결과가 도출된다면 해당 AI모형의 분류정확도는 90%라 말할 수 있습니다.
<분류 정확도는 AI모형의 중요한 타당도 지표입니다> (이미지 출처 : becominghuman)
위의 예와 비슷하게 AI역량검사 모형은 실제 고성과자를 고성과자로 예측하였는지, 반대로 저성과자를 저성과자로 예측하였는지 판단하는 분류 알고리즘을 활용하고 있습니다.
상관분석은 두 변수 간의 관련성 정도를 파악합니다. "AI역량검사 점수"와 "실제 인사평가 점수" 간 어떤 관련성을 보이는 게 좋을까요? 당연하게도 AI역량검사 점수가 높은 구성원이 인사평가도 좋은 점수를 얻는 관계가 가장 이상적일 것입니다. 반대로 AI역량검사 점수가 낮은 구성원이 인사평가 점수를 낮게 받았을 때 AI역량검사가 타당하다고 생각하실 것입니다. 위와 같은 관계를 "정적 상관관계"를 보인다고 말합니다. 관련성 지표는 AI역량검사 모형의 타당성을 설명하는 중요 지표로 활용되고 있습니다.
<AI 역량검사 점수가 높을수록 인사평가 점수도 높을 가능성에 대해 탐색합니다>
"최대 76%의 분류정확도와 성과평가와 약 0.4 수준의 상관관계를 보이고 있습니다"
"AI역량검사의 타당도&정확도 향상은 현재 진행 중입니다"
실시간으로 수집된 AI역량검사 데이터와 성과 평가 데이터를 모형에 투입하여 지속적으로 학습시켜 중요 변수를 선별하고 모형의 예측력을 지속적으로 개선시키고 있습니다.
뿐만 아니라 심층적인 개인 역량을 측정하기 위해 AI역량검사에서는 자기보고식 설문, P6 게임 기술, 면접 영상분석 V2 기술 등 다양한 측정 및 평가 방법을 확장시켜나가고 있습니다.