텍스트 전용 데이터 훈련 관련 오류 발생
안녕하세요!
해당 모델을 텍스트 전용 데이터로 파인튜닝을 진행하려할 때 다음과 같은 오류가 발생하고 있습니다.
File "/home/work/.cache/huggingface/modules/transformers_modules/naver-hyperclovax/HyperCLOVAX-SEED-Vision-Instruct-3B/cd33a27fcc2348f809bb70b8bc0623547279bf0b/modeling_hyperclovax.py", line 621, in forward
[rank1]: inputs_embeds = self.extract_inputs_embeds(
[rank1]: ^^^^^^^^^^^^^^^^^^^^^^^^^^^
[rank1]: File "/home/work/.cache/huggingface/modules/transformers_modules/naver-hyperclovax/HyperCLOVAX-SEED-Vision-Instruct-3B/cd33a27fcc2348f809bb70b8bc0623547279bf0b/modeling_hyperclovax.py", line 823, in extract_inputs_embeds
[rank1]: len_pixel_values = [len(pixel_value) for pixel_value in pixel_values]
[rank1]: ^^^^^^^^^^^^
[rank1]: TypeError: 'NoneType' object is not iterable
모델의 modeling_hyperclovax.py 파일에 있는 forward 메서드를 확인해보니 pixel_values 인자가 Optional로 정의되어 있지만,
extract_inputs_embeds 함수 내부에서는 pixel_values가 None인지 확인하지 않고 곧바로 순회하려는 로직이 있는 것으로 보이는데
이로 인해 pixel_values가 제공되지 않을 때 에러가 발생하는 것으로 파악하고 있습니다.
해당 모델이 순수한 텍스트 데이터만으로 훈련이 가능한지, 가능하다면 pixel_values를 어떻게 처리하는 것이 권장되는지 알려주시면 감사하겠습니다.