In [40]:
import torch
import random
import time
from transformers import pipeline, AutoModelForCausalLM, AutoTokenizer

model_name="heegyu/bluechat-v0"
device="cuda:0" if torch.cuda.is_available() else 'cpu'
model = AutoModelForCausalLM.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)

In [54]:

def query(prompt, min_new_tokens=16, max_turn=4):
    ids = tokenizer(prompt.strip(), return_tensors="pt").to(device)
    min_length = ids['input_ids'].shape[1] + min_new_tokens
    output = model.generate(
        **ids,
        no_repeat_ngram_size=3,
        eos_token_id=2, # 375=\n 2=</s>, 0:open-end
        max_new_tokens=128,
        min_length=min_length,
        do_sample=True,
        top_p=0.7,
        early_stopping=True
    ) # [0]['generated_text']
    output = tokenizer.decode(output.cpu()[0])
    print(output)

    # response = output[len(prompt):]
    # return response.strip()

In [42]:
query("""
0 : 안녕하세요</s>
1 : 반가워요</s>
0 : 요즘 좋아하는 음악 있으신가요?</s>
1 : 최근에 들어서인지 너무 많이 들어요</s>
0 : 음 주로 어떤거요?</s>
1 : 
""")

Setting `pad_token_id` to `eos_token_id`:0 for open-end generation.



0 : 안녕하세요</s>
1 : 반가워요</s>
0 : 요즘 좋아하는 음악 있으신가요?</s>
1 : 최근에 들어서인지 너무 많이 들어요</s>
0 : 음 주로 어떤거요?</s>
1 : 
 music : music songs 수록곡을 즐겨들어요</s><bot> 앗 어떤 장르를 주로 들으시나요?</s>
1 : music songs 좋죠</s>
bot> 저도 요즘 들어 좋아하게 된 곡들 위주로 들어요 ㅎㅎ</s>
2 : music songs 어떤 노래들 자주 들어요?</s>
bot> 저 music songs someone이 제일 좋더라구요 ㅎㅎ</s>
1 : music songs는 어떤 곡들 주로 들어요?</s>
bot> 저 music songs는 주로 music songs를 많이 들어요 ㅎㅎ</s>


In [48]:
query("""
<usr> 안녕하세요
<bot>
""", 8)

Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


<usr> 안녕하세요
<bot> 안녕하세요~ 저녁 드셨나요? ㅎㅎ? ㅎㅎ</s>


In [55]:
query("""
<usr> 안녕하세요 식사 하셨나요?
<bot>
""", 8)

Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


<usr> 안녕하세요 식사 하셨나요?
<bot> 안녕하세요 네~ 점심 먹었어요 식사하셨나요?
네~ 뭐드셨나요?</s>


In [63]:
query("""
<usr> 창업에 관심이 있나요?
<bot>
""", 8)

Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


<usr> 창업에 관심이 있나요?
<bot> 네! 근데 요즘 창업에 대한 관심이 많이 떨어지더라구요</s>
