NLP 공부를 하려면 무조건 만나게 되는 HuggingFace(허깅페이스).
그런 허깅페이스에서는 친절하게도 강의를 제공해주고 있다.
더더욱 친절하게도 한글도 지원을 해준다.
왼쪽 아래에 위치하고 있는 "Learn"을 클릭해보자.
여러 강의를 제공해주지만,
지금 우리가 관심있는 것은 처음에 등장한 "NLP Course"를 클릭하자.
어?! 영어로 나오네!?
왼쪽 위에 있는 언어 선택 메뉴에서 "KO"를 선택하면 된다.
왼쪽 챕터를 보면 알겠지만, 아쉽게도 모든 강의를 한글로 제공해주지는 않는다.
(여러분들의 재능기부를 기대합니다!)
여기까지의 소개로만 끝나면 조금 아쉬움이 남으니.... ^^
HuggingFace를 활용하는 실습 코드들에 대해서 좀 더 알아보도록 하자.
강의 챕터 중 "트랜스포머로 무엇을 할 수 있나요?" 부분을 살펴보자.
가운데 위에 있는 "Open in Colab"을 클릭하자.
내 마음대로 수정하면서 뭔가 해보길 위해서는 "Drive에 사본 저장"을 해야 한다.
그런 다음 하나씩 실행해 보면서 살펴보자.
대체 뭐가 뭔지 모르겠다고!?
HuggingFace를 활용할 수 있게 해주는 transformers의 pipeline을 사용해주고 있다.
여기에서는 감정 분석을 하고자 "pipeline('sentiment-analysis')"를 사용한다.
그리고는 "I've been waiting for a HuggingFace course my whole life." 문장에 대해서 분석해보라고 하고 있다.
그러면 결과는 [{'label': 'POSITIVE', 'score': 0.9598048329353333}] 라고 나오게 된다.
실행 결과 메시지를 보면 현재 어떤 모델을 사용하고 있는지를 알 수 있다.
- https://huggingface.co/distilbert/distilbert-base-uncased-finetuned-sst-2-english
모델에 대한 정말 다양한 정보를 확인할 수 있다.
누가 개발했고, 라이선스는 어떻게 되며 어떻게 사용하는지에 대한 예제도 있고
심지어 위험성이나 편향성까지도 서술해주며, 어떤 데이터로 학습했는지도 알려준다.
오른쪽 부분을 보면 테스트를 해볼 수 있는 인터페이스도 제공해준다.
하지만, 우리는 한국인!!!!
지금 코드는 한글을 제대로 이해하지 못한다.
모델명만 봐도 알겠지만, 한글에 대해서 학습되지 못한 모델이다.
한글을 이해할 수 있는 아이로 해보자.
응?! label이 예쁘게 나오지도 않고 분석 결과도 좀 마음에 들지 않지만,
일단 내가 원하는 모델을 이용하는 방법을 살펴본 것으로 일단 만족해보자.
HuggingFace를 활용하는 것은 계속 더 공부해보도록 하겠다.
'AI_ML > LLM' 카테고리의 다른 글
HuggingFace - LLAMA 3.2 for Korean (2) | 2024.11.12 |
---|---|
HuggingFace - Learn - NLP Course #3 (3) | 2024.11.11 |
HuggingFace - Learn - NLP Course #2 (0) | 2024.11.10 |
Gemini 잔소리꾼 만들기 (1) | 2024.11.08 |
HuggingFace (허깅페이스 소개) (0) | 2024.06.24 |