본문 바로가기

광주 인공지능 사관학교 4기 맹점을 짚은 후기

본인은 4기 최종 프로젝트 최우수상 (1등) 을 수상한 시각지능B 팀의 일원으로서, 이 기관을 선택함에 있어 실질적인 도움이 될 수 있는 글을 작성한다. 다른 많은 후기들이 인터넷에 있지만, 후기 쓰고 푼돈, 선물 받는 이벤트가 있었기 때문에 적당히 걸러 듣길 바란다. 심지어 내가 아는 중간에 안나오게 된 사람도 네이버 블로그에서 인공지능 사관학교를 칭송하고 있더라.

 

인공지능 사관학교 5기를 준비하는 분들께 해드리고 싶은 말을 정리하면,

 

전공자, 학습 능률이 좋은 사람들에겐 인공지능 개론으로서 가치가 높지만, 역겨운 전시행정, 언더도그마를 감내해야함.

비전공자한테는 매우 희박한 확률로 인공지능 개발을 흉내내는 정도가 될 수 있음. (모르겠다 본인들은 전문가가 된 것으로 생각하긴 한다)

 

또한 이 글을 쓰는 목적은 한국표준협회는 현재 광주 인공지능 사업에 임함에 있어 운영을 위한 운영을 하고 있다는 사실을 알리며, 정말 AI가 광주의 핵심 사업이라면 조금 더 양질의 기관 혹은 인력으로 배정할 것을 촉구하는 것이다. 광주가 AI도시로 자리잡기 위해서는 이런 근시안적인 전술을 세우는 방식을 탈피하고, 큰 전략으로서 실제로 인재를 양성할 수 있는 역량을 갖춘 집단이 필요하다. 따라서 내가 결과적으로 얻을 수 있는 실익은, 인공지능 사관학교가 참된 인재를 양성하여 광주가 AI도시로서 자리잡아, 인공지능 사관학교 수료증이 자랑스러워 지는 것이다.

 

이 기관에 대한 총평은, "꽤 괜찮은 강사진, 운영진의 무능" 으로 정리할 수 있겠다. 기본적으로 언더도그마가 저변에 깊숙히 깔려있고, 전시행정을 추구하는 과정에서 공평함을 희생하곤 한다. 1등해놓고 왜 불만이 있나, 왜 이제서야 이런 말을 하느냐 생각할 수도 있겠다. 난 그동안 기관이 소탐대실하는 상황들을 지켜봐 왔고, 프로젝트가 끝나기 전에 이것을 폭로하면 나 혼자한테가 아닌 우리 팀에 불이익을 줄 수 있다는 생각이 들었고, 혹시나 개선의 여지가 있을까 하다가 지금에 이르렀다. 이 기관의 목표는 수강생들의 실력 향상보다 상부에 보고할 수 있는 데이터를 만드는 것이다. 솔직히 프로젝트 측면에서 어느정도의 전시행정은 이해한다. 하지만 이 기관은 선을 넘었다. 누구보다 열심히 해왔던 인원으로서 그 문제점들을 하나 하나 살펴보겠다.

 

의도치 않았지만 성과가 높지 않았던 인원들이 이 글을 불편하게 받아들일 수 있을거라 생각한다. 하지만 나는 현실적인 정보를 전달하는 행위에 대의가 있다고 본다. 

1. 커리큘럼에 대하여

1-1. 비전공자도 가능할까? 본 수업기간

 

 

 

당연히 가능하다. 위 과정을 제대로 소화할 수 있다면... 하지만 솔직히 전공자 입장에서 봤을 때 주변에 "가능"한 상태가 된 인원은 극소수였고, 이 9개월 과정은 본질적으로 말이 되지 않는다. 학창 시절을 떠올리면 월, 화, 수, 목, 금 매일 등교하여 8시간 가량 공부하는 것에 적응하는 학생은 정말 흔하지 않다. 통계적으로도 여기서 적응을 못하고 낙오하는 것이 매우 자연스럽다. 4년제 대학과 이 6개월 코스를 운영진이 자주 비교하곤 하는데, 납득하기가 많이 힘들었다. 심지어 대학원생과 비교하기도 하더라...

1-2. Pre-training의 민낯

320시간의 Pre-training이 사실 가관이다. 기본적으로 학점을 채우고 시험에 응시하여 테스트 결과에 따라 당락이 결정되는 구조를 공표하고 있지만, 이는 지켜진 바가 없다. 기본적으로 이 기관은 엄청난 미달이 나고 단순히 수강하는 학생 수를 필요로 하는 구조이기 때문이다. (300 명이라는 수강생 수에 특별함이 있을지도 모르겠다.) 경쟁률이 뭐 2.4:1이라고 하는데 경쟁에서 낙오된 수가 아니라 그냥 지원했다가 '안' 한 것일 뿐이다 즉 경쟁률이 아니라 최종 선택률이다. 실제로 경쟁에 의해 하고싶음에도 탈락한 인원은 없었다.

처음 공지에서는 16학점을 이수해야 시험을 볼 수 있고 (이 것은 원래 20학점 이었으나 완화되었다), 32학점을 이수하지 않으면 자동 탈락 처리 된다고 적혀있지만, 실제로 학점 미달로 인해 탈락한 인원은 없다. 단지 40만원을 못받았을 뿐이다. 이것이 문제가 되는 이유는 아주 간단하다. 거의 대부분이 pre-training을 제대로 하지 않고, Final test로 선별되지 않기 때문에, 반 강제적으로 Pre-training 내용을 다시 본 수업시간에 할 수 밖에 없는 구조이다. 여기서 열심히 하는 인원에 대한 배려는 존재하지 않는다. 

 

2. 컨텐츠에 대하여

 

X 해놓은 것들은 왜 step에 포함시켰는지 당최 이해가 가질 않는다. (Pre-trainig은 없는 것이나 마찬가지이다.) 이번에는 AI 실무 교육과정, 데이터 경진대회, Coding Festival, 취창업 역량강화 교육에 대해서 알아본다.

2-1. AI 실무 교육과정

솔직히 교육 내용은 인공지능 개론으로서 꽤 괜찮은 편이다. 하지만, Pre-training 내용을 다시 해야 한다는 점, 일반적인 비전공자가 이 내용을 실질적으로 이해하기가 상당히 난해하다는 점이 발목을 잡는다. 애초에 비전공자가 6개월만에 AI수업을 이해하며 듣는다는 것은, 음... 솔직히 무리라고 본다. 그럼에도 불구하고 운영진은 기관의 존속을 위해서는 하향 평준화를 시도하는 것으로 보인다. 사실 이것이 본질적인 문제일 것이다. 이 기관은 학생을 억지로 늘린다. 학습이 가능한 인원들이 아님에도 무리하게 학생들을 끌어오는 과정이 추후 서술할 문제들의 근원일 것이다.

 

2-2. 데이터 경진대회 (Kaggle)

 

여기가 막장 운영의 서막이다. 실제로 캐글 경진대회는 큰 호응을 받지 못하였고, 극 소수의 인원만이 참여하게 되었다. 그 해결책은 매우 간단했다. 기간을 늘리고 baseline코드를 주면 되는 것이다. 모두가 일단 한번은 돌려볼 수 있게 (참여율을 위해). 또한 부정행위 문제가 있었다. 사실 이 문제는 이미 캐글 사이트에 정답이 있는 문제로서 처음부터 정답을 올려서 100점을 받는 인원들이 있었고, 어떤 사람들은 정답지를 기반으로 90 점 이런식으로 정답데이터를 만들었다. 하지만 이에 대해 소스코드 검증을 했는지는 솔직히 모르겠다. 그리고 그러한 부정행위의 대가가 겨우 상을 못받는 것이라니... [100점자리 데이터를 제출하는 부정행위를 한 인원이 추후에 자신이 부정행위를 하지 않은 코드를 제출하여 정상 수상하였다고 주장하였으나, 그 진위은 밝혀진 바 없는 상태이다. 하지만 애초에 부정행위자에게 패널티 없이 새로운 기회가 주어진다는 것 자체가 상식적이지 않다.]

 

2-2. Coding Festival

 

 

 

 코딩 페스티벌은 월화수목금 "오후 8시"부터 진행되었다. 다음날 수업이 오전 9시에 시작됨을 고려하면 미친 일정이다. 일주일동안 총 50문제를 푸는 것이었는데, 원래의 취지는 빨리 푸는 인원들이 높은 점수를 받는 구조였다. 그래서 일주일간의 점수를 종합하여 반마다 순위를 가리는 것이다. 일단 기본적으로 참여율을 위해, "팀" 단위로 코딩 페스티벌을 진행한다. 그렇다. 팀에 잘하는 사람이 코드를 주면 나머지는 기계적으로 붙여넣기 하는 것이다. 우리 반은 특히 "연합"? 이라는 이상한 구조의 팀 (이 것에 대해서도 추후 언급하겠다.) 이 있었는데, 이들이 연합해서 사실상 12명의 코드가 다 똑같다. 나는 전시행정의 역함을 차치하고서라도, 4 ~ 6명이 팀이라는 룰을 어긴 부정행위에 대해 지적했지만, 시각지능B 연구원 (뭘 연구하는지는 모르겠다)들은 이에 대해 일언반구도 하지 않았다.

 

하지만 가장 큰 문제는 점수 측정 방식이 중간에 바뀌었고, 결과가 나오기 전까지 그것을 우리가 몰랐다는 것이다. 50개의 문제를 푼 팀들은 시간 순서 상관없이 모두 15만원을 받았다. 사실 우리팀은 집이 먼 사람들이 많아서 8시에 집에 가서 참여하는 것이 쉽지가 않았고, 가능성이 낮은 게임이라 생각했다. 하지만 우린  틀렸다. 다음날이라도 풀면 수상을 하는 것이었다. 모두가 15만원을 받게된 경위는 공식적으로 밝혀지지 않았다. [추가: 어떤 반에서는 완성 시간에 따라서 차등 지급한 것으로 보인다. 즉 같은 5000점 (최고점수)이더라도 완성한 시간에 따라 "정상적으로" 차등 수상했다]

 

2-3. 취창업 역량강화 교육

한 다섯번정도 했던 것 같은데, 사실 아무도 듣지 않는 교육이다. 교육을 진행하는 사람들이 준비를 안해오기 때문에 교육 내용이 두서가 없고, 결국 자신의 썰푸는 인터넷 방송의 형태로 진행된다. 놀랍게도 정말 아무도 듣지 않는다. 또한 연구원들은 아무도 이러한 현상을 파악하지 못한다. 단 한 번을 제외하고는, 외부 연사가 직접 이곳에 온적은 없다. 다 줌이나 유튜브 방송이다. 이 것은 우리 반에 한정된 이야기이고, 다른 모든 반을 둘러보지는 않았다.

 

2-4. AI 실무 프로젝트

조별과제로서 총 2번 진행한다. 나는 두 개의 프로젝트 모두 1등을 했고, 그 저변에는 박사과정에서 배운 내용이 크게 작용했다고 생각한다. 기본적으로 방임하는 형태이고, 처음에는 놀다가 마지막에 뭔가 바쁘게 하는 척 하면 강사님이 도움을 주는 플롯이다. 물론 우리는 그런 방향으로 진행하지는 않았다. 그랬다면 1등을 못했을 것이다. 프로젝트에서 발생한 문제점은 두 가지가 있었다.

 

첫 번째, 운영진이 한 학생에게 "두 팀"의 운용을 맡김 즉 결과물의 질을 고려하지 않고 편의를 추구함. 사실 "세 팀" 이었지만 한팀은 마지막에 극적으로 탈출함.

그 학생은 첫번째 프로젝트에서 꽤 좋지 않은 성적 (5팀 중 4등)을 거두었고, 그 때의 프로젝트 심사는 크게 잘못되지 않았다고 생각했다. 나는 그 학생이 능력에 비해 과한 시도를 하는 것을 사전에 우려하여 운영진에게 저 구조는 기형적이고 결과가 매우 좋지 않을 것이라 미리 제언하였지만, 신경도 쓰지 않았다. 애초에 연합팀의 존재는 용인된다고 공표되지 않은 상태였고 해당 프로젝트는 5~6인으로 충분이 가능한 것이며, 숫자가 늘어날 수록 비효율이 가중된다는 것을 나는 알고 있었다. 하지만 연합의 존재만 가능하지 실제 프로젝트는 두 개를 수행해야 했기 때문에, 결국 그 팀은 연합팀 내에서 잘하는 몇명이 두 개의 프로젝트를 진행하는 매우 기형적인 구조를 띄게 되었다. 결국 그 학생의 팀은 꼴찌를 하게 된다. 또한 자연스럽게 연합팀의 구성은 이전에 언급한 coding festival에서 부정행위를 저지르게 하였다.

 

두 번째, 그래픽 카드 지원

최종 프로젝트는 10월 25일부터 12월 3일 까지 진행되었고, 실제로 12월 4일 발표 준비를 위해 최소 11월30일 까지는 (이것도 너무 부족하긴 하다) 내용 정리가 끝나야 한다. 무려 11월 24일 H100서버에 접속할 수 있었고, 세팅 이후에 실제 이용은 11월 25일부터 할 수 있었다. 지금 생각하면 말도 안되는 접근이지만, 우리는 기존 컴퓨터에서 안돌아 가는 코드를 H100에서 돌아갈 수 있을 것이라 가정하고, 모델을 구성했다. 다행히 좋은 결과를 뽑을 수 있었지만, 운영진은 그래픽 카드 서버 접근이 엄청나게 지연된 점에 대해서 사과 한마디도 하지 않았다. 이전 계획은 A100 서버를 이용하는 것이었다고 하는데, 정말 도저히 국가 사업을 하는 기관이라고 생각하지 못할 정도의 행정력을 보여주었다. A100서버는 뭐 계약이 일방적으로 파기되었다나? 하지만 그 것이 인식된 시점이 11월 10일, 즉 급한 상황에서 약 2주동안 신계약이 지연되는 상황을 난 도저히 이해할 수가 없었다. 이 거만하고, 학생들을 단순히 자신들의 월급 토큰으로 보는 근시안적인 접근은 이 기관을 병들게 할 것이며, 지금이 이 기관의 무능한 인력들을 교체해야 할 시점으로 보인다.  

 

2-5. 시상

사실 나는 여기서 참아왔던 역겨움이 터져버렸다. 우리의 프로젝트는 약 5~60개의 팀 중에서 당당히 1등을 했지만 우리 중에서는 아무도 우수교육생이 될 수 없었다. 그것은 바로 아무리 프로젝트를 잘하고 시험을 잘 봐도 출석이 가장 큰 가중치이기 때문이다. 이게 바로, 전시행정의 극한을 보여주는 시점이라고 본다. 운영진들은 학생들의 실력 향상이 중요한 것이 아니라, 상부에 보고할 출석 수에 가중치가 높게 잡힌 것이다. 나는 실제 가중치와 적용된 비율을 요청했지만, 뭐 이런 저런 곳에 이미 게시되어 있다고 답변을 들었다. 하지만 나는 그 정보를 찾을 수 없었다.

 

2-6. 자격증

정보처리기사와 같은 실제 도움이 되는 자격증을 획득한 인원은 정말 거의 없다. 그래서 이 기관이 선택한 방법은 엄청나게 쉬운 자격 시험을 통해 통계를 불리는 것이었다. AI-900... 찾아보면 알겠지만 이 시험에 떨어지는 사람은 거의 없다. 수료할 때 인공지능 사관학교 성과를 설명하는 부분에서 자격증 취득률 55%를 보고 정말 어이가 없었다. 70% 이상이 본거같긴한데..