๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

๐˜ผ๐™„10

์ธ๊ณต์ง€๋Šฅ koBERT ๋ชจ๋ธ ํ•™์Šต ์ถ”์ฒœ์‹œ์Šคํ…œ์— ์“ฐ์ผ 'ํƒœ๊ทธ'๋ฅผ ๋‹ฌ๊ธฐ ์œ„ํ•ด ๋ชจ๋ธ์„ ํ•˜๋‚˜ ์ œ์ž‘ํ•˜๊ณ  ์žˆ๋‹ค. ๋‹ค๋ฅธ ๋ชจ๋ธ๋“ค๋„ ๋งŽ์ง€๋งŒ koELECTRA์™€ ๊ธฐํƒ€ ๋ชจ๋ธ์€ ๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ๋ฅผ ๋ชจ๋ธ์— ๋งž๊ฒŒ ํ•ด์ฃผ์ง€ ์•Š์•„์„œ ๊ทธ๋Ÿฐ๊ฐ€ ์ •ํ™•๋„๊ฐ€ ๋†’์ง€ ์•Š์•˜๋‹ค. ๊ทธ๋ž˜์„œ ๊ทธ๋‚˜๋งˆ ๋†’์€ ์ •ํ™•๋„๋ฅผ ๋ณด์—ฌ์ค€ koBERTํ•™์Šต ํ›„๊ธฐ๋ฅผ ๋‚จ๊ธธ๊นŒ ํ•œ๋‹ค. 1. BERT๋Š” ๋ฌด์—‡์ธ๊ฐ€? ๋จผ์ € BERT๋ผ๋Š” ๊ฒƒ์€ ์œ„ํ‚คํ”ผ๋””์•„(25์–ต ๋‹จ์–ด)์™€ BooksCorpus(8์–ต ๋‹จ์–ด)๋กœ pretrain ๋˜์–ด ์žˆ๋Š” ๊ธฐ๊ณ„๋ฒˆ์—ญ ๋ชจ๋ธ์ด๋‹ค. ํ•˜์ง€๋งŒ ์™ธ๊ตญ์—์„œ ๋งŒ๋“  ๊ฒƒ์ด๋‹ค ๋ณด๋‹ˆ ์˜์–ด์— ๋Œ€ํ•ด ์ •ํ™•๋„๊ฐ€ ๋†’๋‹ค. ํ•œ๊ตญ์–ด์— ๋Œ€ํ•ด์„œ๋Š” ์˜์–ด๋ณด๋‹ค ์ •ํ™•๋„๊ฐ€ ๋–จ์–ด์ง„๋‹ค. ์ข‹์€ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๊ฐ–๊ณ  ์žˆ๋Š” BERT ๋ชจ๋ธ์„ ํ•œ๊ตญ์–ด์—๋„ ์ž˜ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๋„๋ก ๋งŒ๋“ค์–ด์ง„ ๊ฒƒ ์ค‘์— ํ•˜๋‚˜๊ฐ€ ๋ฐ”๋กœ SKT์—์„œ ๋งŒ๋“  KoBERT๋ชจ๋ธ(https://github.com/SK.. 2023. 2. 11.