'ko-llm' 태그의 글 목록

ko-llm

HuggingFace - LLAMA 3.2 for Korean 2024.11.12
HuggingFace - Learn - NLP Course #2 2024.11.10

HuggingFace - LLAMA 3.2 for Korean

2024. 11. 12. 23:33

오늘은 왠지 LLAMA가 눈길을 끌어서 ...

친절하게 예제 코드도 제시해주고 있다.

import torch

from transformers import AutoTokenizer, AutoModelForCausalLM

model_id = 'Bllossom/llama-3.2-Korean-Bllossom-3B'

tokenizer = AutoTokenizer.from_pretrained(model_id)

model = AutoModelForCausalLM.from_pretrained(

model_id,

torch_dtype=torch.bfloat16,

device_map="auto",

)

instruction = "철수가 20개의 연필을 가지고 있었는데 영희가 절반을 가져가고 민수가 남은 5개를 가져갔으면 철수에게 남은 연필의 갯수는 몇개인가요?"

messages = [

{"role": "user", "content": f"{instruction}"}

]

input_ids = tokenizer.apply_chat_template(

messages,

add_generation_prompt=True,

return_tensors="pt"

).to(model.device)

terminators = [

tokenizer.convert_tokens_to_ids("<|end_of_text|>"),

tokenizer.convert_tokens_to_ids("<|eot_id|>")

]

outputs = model.generate(

input_ids,

max_new_tokens=1024,

eos_token_id=terminators,

do_sample=True,

temperature=0.6,

top_p=0.9

)

print(tokenizer.decode(outputs[0][input_ids.shape[-1]:], skip_special_tokens=True))

3B 모델에서 과연 저 문제를 풀 수 있을까?

구글 코랩에서 위 코드를 실행해보자. (나는 GPU도 없는 가난한 머글이니까 ㅠㅠ)

어?! 시키는 그대로 했는데, 왜?!

구글 코랩에서 기본 버전을 업그레이드 해주면 발생하지 않을테지만,

현재는 transformers, tokenizers 버전이 낮아서 발생하는 것으로 보인다.

!pip install --upgrade transformers tokenizers

설치가 끝나면 세션 재시작을 요구한다.

하면 된다.

그리고 나서 실행하면 시간이 좀 걸리지만... 잘 된다.

철수가 20개의 연필을 가지고 있었고 영희가 절반을 가져가면, 영희가 가져간 연필은 20 / 2 = 10개입니다.

철수가 남은 연필은 20 - 10 = 10개입니다. 민수가 5개를 가져가면, 철수가 남은 연필은 10 - 5 = 5개가 됩니다.

따라서 철수가 남은 연필의 갯수는 5개입니다.

그리고, 문제도 잘 푼다!!!

저작자표시 비영리 변경금지

'AI_ML > LLM' 카테고리의 다른 글

HuggingFace - Learn - NLP Course #3 (2)	2024.11.11
HuggingFace - Learn - NLP Course #2 (0)	2024.11.10
HuggingFace - Learn - NLP Course (1)	2024.11.09
Gemini 잔소리꾼 만들기 (1)	2024.11.08
HuggingFace (허깅페이스 소개) (0)	2024.06.24

HuggingFace - Learn - NLP Course #2

2024. 11. 10. 22:57

어제 포스팅 했는데, 뭔가 굉장히 찜찜한 마음이 들어서 추가적으로 공부를 해보고자 한다.

- https://www.whatwant.com/entry/HuggingFace-Learn-NLP

모델을 명시하지 않으면, "distilbert-base-uncased-finetuned-sst-2-english" 모델이 사용된다.

한글을 제대로 인식하지 못하는 모델이기에 다음과 같은 결과가 나온다.

이번에는 나름 유명한 koBert 모델로 지정해서 해보자.

이제는 조금 부정적인 것으로 인지하긴 하지만, 뭔가 부족하다.

한글을 잘 이해하는 모델을 어떻게 찾을 수 있을까?!

한글을 지원하는 LLM들의 성능 순위를 관리하는 곳 중에서 나름 유명한 곳이 있다.

- https://huggingface.co/spaces/upstage/open-ko-llm-leaderboard

Colab에서 실행하기 위해서는 Model Size는 좀 제한을 해야 한다.

내가 만약 A100이라던지 H100을 사용할 수 있다면 성능만 바라보고 할 수 있겠지만...

31.66점이라는 좀 많이 부족한 점수이지만 그래도 작은 사이즈의 모델에서는 어쩔 수 없다.

설명이 많이 부족하다.

사실 개인적으로 올리는 많은 모델들이 다 이렇다 ^^

결과는 와우~!!!

LABEL_0 으로 0.94 score를 주고 있다. 부정적이라고 확신하는 것이다!!!

어제 포스팅에서 한글 모델을 사용했음에도 제대로 감정 분류를 하지 못하는 결과가 나와서 찜찜했는데,

그나마 짧은 시간 투자해서 원하는 수준 이상으로 결과가 나와서 뿌듯하다 ^^

이게 제대로 살펴본 것인지는 확신할 수 없지만, 나름 개인의 만족 !!!

저작자표시 비영리 변경금지

'AI_ML > LLM' 카테고리의 다른 글

HuggingFace - LLAMA 3.2 for Korean (0)	2024.11.12
HuggingFace - Learn - NLP Course #3 (2)	2024.11.11
HuggingFace - Learn - NLP Course (1)	2024.11.09
Gemini 잔소리꾼 만들기 (1)	2024.11.08
HuggingFace (허깅페이스 소개) (0)	2024.06.24

PREV 1 NEXT

머가필요해

ko-llm

HuggingFace - LLAMA 3.2 for Korean

'AI_ML > LLM' 카테고리의 다른 글

HuggingFace - Learn - NLP Course #2

'AI_ML > LLM' 카테고리의 다른 글

+ Recent posts

티스토리툴바