반응형

머신러닝&딥러닝 52

VScode 에서 keras intellicode가 잘 안될 때

Visual Studio Code를 사용할 때, 자동완성 기능의 편리함을 많이 느낍니다. Python의 경우도 VScode의 확장팩인 Visual Studio IntelliCode를 사용하여 코딩을 하면 굉장히 편합니다. 그런데, tensorflow의 keras를 이용하려고 하는데 intellicode가 아래의 사진처럼 잘 안되는 걸 느꼈습니다. 제가 pylint를 사용해서 python interactive창이 뜨게 되는데 거기서는 또 잘 되더라구요. 그래서 가끔 함수 이름을 까먹을 때 그렇게 했는데 항상 하기는 불편해서 방법을 알아봤습니다. 그렇게 해서 발견한 방법을 공유합니다. 위와같이 tensor flow_core.python.keras.api로부터 keras를 불러와서 사용을 하게 되면 자동완성이..

Embedding 이란 무엇인가 이해하기

인간의 언어(자연어)는 수치화되어 있지 않은 데이터이기 때문에 머신러닝, 딥러닝 기법을 바로 사용할 수가 없다. (수치화되어있는 데이터의 예로는 Mnist나 꽃의 종류처럼 숫자로 분류가 가능한 것들을 말함.) 그래서 자연어 처리에서 특징 추출을 통해 수치화를 해줘야 하는데 이때 사용하는 것이 "언어의 벡터화"이다. 이런 벡터화의 과정을 Word Embedding이라고 한다. 가장 기본적인 벡터화의 방법은 One-hot encoding 방법이다. 예를 들어, 남자와 여자를 표현하는 벡터를 만든다고 할 때 각각을 [1,0] [0,1]로 만드는 방법이다. 그런데 이 방법은 단어가 많아지면 벡터 공간이 매우 커지고 실제 1인 값은 한 개뿐 이므로 매우 비효율적이다. 또 이런 표현방식은 단어가 뭔지만을 알려줄 뿐..

반응형