구글 코랩을 켜서 '파일'>'새 노트' 로 새 노트를 만들어주고 '1. 케라스의 texts_to_matrix() 이해하기' 코드를 전체 복사, 붙여넣기 해준 후 '런타임'>'모두 실행' 해준다.
mbti_train.xlsx와 mbti_test.xlsx를 다운받고, 둘 다 구글 스프레드로 열어준 후 구글 드라이브에 저장해준다. 코랩을 켜서 '파일'>'새 노트' 로 새 노트를 만들어주고 '2. 20개 뉴스 그룹(Twenty Newsgroups) 데이터에 대한 이해' 코드를 복사, 붙여넣기 해준다. train 이라는 변수에 mbti_train.xlsx 파일의 구글 드라이브 경로를 적어주고 test 라는 변수에 mbti_test.xlsx 파일의 구글 드라이브 경로를 저장해준다.
'3. 다층 퍼셉트론(Multilayer Perceptron, MLP)을 사용하여 텍스트 분류하기' 코드도 복사, 붙여넣기 해준다. '런타임'>'모두 실행' 하고, 구글에 로그인하게끔 하는 팝업창이 뜨는데, 그 팝업창을 통해 로그인을 한다. (만약 팝업창에서 암호코드가 나오면 복사해서 콘솔창에 뜨는 필드에 붙여넣기 한다.)
데이터 양이 많기 때문에 훈련 데이터와 테스트 데이터를 모두 거쳐 전처리, 학습, 정확도 도출까지 시간이 걸릴 수 있다.