간략한 요약
이 비디오는 AI 분야에서 성공적인 커리어를 쌓기 위한 실질적인 단계들을 제시합니다. 단순히 튜토리얼을 따라 하는 수준을 넘어, 연구 논문 구현 및 특화된 모델 미세 조정과 같은 심층적인 프로젝트에 집중해야 합니다. 또한, AI에 필요한 수학적 지식은 생각보다 간단하며, 핵심 개념을 이해하고 PyTorch를 활용하는 것이 중요합니다. 마지막으로, 프로젝트 경험을 상세히 문서화하고 GitHub 프로필을 효과적으로 관리하여 포트폴리오를 강화하는 방법을 강조합니다.
- 튜토리얼 지옥에서 벗어나 심층적인 프로젝트에 집중
- AI에 필요한 수학은 기본적이며, 프로젝트를 통해 자연스럽게 습득 가능
- PyTorch를 사용하여 논문 구현 및 모델 미세 조정
- 프로젝트 경험을 상세히 문서화하여 포트폴리오 강화
소개
이 비디오는 AI 프로젝트를 만들고 튜토리얼을 따라 하지만 결과에 만족하지 못하는 사람들을 위한 것입니다. 저자는 수많은 프로젝트를 진행하고 직위에 지원했지만 거절당한 경험을 바탕으로 접근 방식을 바꾸어 아마존에서 인턴십을 얻고 졸업 날 연봉 20만 달러가 넘는 신입 채용 제안을 받았습니다. 이 비디오는 꿈의 인턴십과 취업 제안을 받기 위해 따라야 할 솔직한 단계들을 소개합니다.
살포와 먹이를 이용한 방법이 더 이상 효과가 없는 이유
대부분의 초보자는 튜토리얼 지옥에 갇혀 지시를 따르고 코드를 복사하며 손으로 쓴 숫자 감지기, 기본 채팅 봇, 고양이와 개 분류기 등 더 이상 쓸모없는 프로젝트를 만들고 있습니다. 이러한 방법들은 기본을 배우는 데는 좋지만, 엄청난 혜택을 얻을 수는 없습니다. GitHub이 다른 사람들과 똑같다면 채용 담당자와 채용 관리자에게 눈에 띄지 않을 것입니다.
집중해야 할 두 가지 유형의 프로젝트
AI 아키텍처를 처음부터 다시 구축하는 것과 같이 깊이 들어가 학생의 99%가 하지 않으려는 일을 해야 합니다. OpenAI, Google, Facebook, Nvidia와 같은 회사의 연구자들이 발표하는 연구 논문을 읽고 이해하여 Python 코드로 변환하는 프로젝트를 수행해야 합니다. 완벽한 복제가 목표가 아니라 주요 아이디어를 이해하고 주요 구성 요소를 코딩하는 데 집중해야 합니다. 또한, 이미 꽤 똑똑한 일반 모델을 사용하여 더욱 특수화하는 미세 조정 프로젝트도 중요합니다. 회사 내부의 질문에 답하고 효율성을 높여줄 수 있는 LLM을 구축하는 기술은 현재 매우 시장성 있는 기술입니다. GPT2, Mistral 모델, Meta의 llama 모델과 같은 오픈소스 LLM을 살펴보고, 데이터 준비 처리, 하이퍼파라미터 튜닝, 평가 지표, 배포 고려 사항 등 모든 것을 다루는 풀스택 프로젝트를 진행해야 합니다. 자신의 열정에 맞는 데이터 세트를 선택하여 코딩을 시작하는 것이 중요합니다.
AI에 필수적인 수학
AI를 배우는 데 수학 박사 학위는 필요하지 않습니다. 자동차를 운전하는 것처럼 내연 기관의 물리학을 알 필요 없이 페달을 밟는 방법과 차량을 조종하는 방법만 알면 됩니다. AI 모델을 통해 데이터가 흐르는 방식인 행렬 곱셈과 모델을 훈련하는 방식인 미적분학의 기본적 파생물만 이해하면 됩니다. x^2나 e의 x승과 같은 기본 함수의 미분을 구할 수 있다면 프로젝트를 구축할 준비가 된 것입니다. 수학은 나오는 대로 배울 수 있으며, 프로젝트를 구축하기 시작하면 수학은 정말 자연스럽게 다가올 것입니다.
엘리트 엔지니어 필수 사항
연구 논문을 쓰기 전에, 세부 조정에 들어가기 전에 엘리트 엔지니어의 필수 요소인 핵심 개념 세 가지를 알아야 합니다. 첫 번째는 경사 하강법으로, AI 모델을 훈련하는 데 사용되는 주요 알고리즘입니다. 두 번째는 선형 회귀 분석으로, 신경망과 변환기에 들어가기 전에 모델을 잘 이해하는 것이 중요합니다. 세 번째는 피드포워드 신경망으로, 가장 간단한 종류의 신경망입니다. 이 세 가지 개념을 Python으로 처음부터 구현하면 진정한 엘리트 엔지니어가 될 수 있습니다.
포트폴리오 파워하우스 프레임워크
기본적인 사항을 파악했다면 이제 PyTorch를 사용해 볼 차례입니다. PyTorch는 산업과 연구의 표준이 되어가고 있으며, 다른 프레임워크보다 훨씬 더 유연하고 직관적입니다. PyTorch에 익숙해지면 논문을 실제로 구현할 수 있습니다. PyTorch는 모든 수학적인 내용을 추상화하고 고수준 API를 호출하는 것과 반대로 모든 것을 처음부터 직접 하고 수 시간을 들여 방정식을 도출하는 것 사이의 완벽한 균형을 이룹니다. 포트폴리오는 학위만으로는 충분하지 않다는 것을 증명하는 증거입니다. 훌륭한 포트폴리오를 구축하고 매력적인 스위트 오퍼를 획득하기 위해 서류 구현과 세부 조정에 우선순위를 두고, 프로젝트 구축 경험에 대한 자세한 문서를 작성하고, 깔끔한 코드, 주석, 구조를 갖춘 공개 GitHub 계정을 보유해야 합니다. GitHub 프로필에 각 프로젝트를 설명하는 짧은 영상을 만들 수도 있습니다.