미등록페이지

미등록페이지

유사한 성능을 가진 대규모 언어

test
2025.01.28 09:42 107 0

본문

최근, 챗GPT와 유사한 성능을 가진 대규모 언어 모델'딥시크-V3'를 약 600만 달러 미만의 비용으로 개발했다고 발표해 큰 화제를 모았다.


이 개발 비용은 기존의 미국 AI 기업들이 요구하는 비용과 비교했을 때 혁신적으로 낮은 수준이며, 산업 전반의 비용 효율성에 대한 새로운 논의의 출발점이 되고 있다.


이같은 '저렴한' AI 모델 개발 방식이 확산한다면 그동안 비싼 최신 AI 칩을 앞세워 막대한 매출과 순이익을 거뒀던 엔비디아 같은 반도체 기업은 큰 타격을 받을 수 있다는 보고서가 발표되기도 했습니다.


#딥시크#v3#엔비디아 #인공지능 #스타트업 #트럼프.


반면,딥시크가 개발한 AI 모델 'V3'에 투입된 비용은 557만6천달러(약 78억8천만원)에 달하는 것으로 알려졌다.


이는 AI 개발 비용에 수백억 원에서, 많게는수십조원을 쏟아붓는 빅테크에 비해 크게 낮은 수준이다.


딥시크의 '저렴한' AI 모델 개발 방식이 확산한다면 엔비디아가 그동안 비싼 최신 AI 칩을.


이어 차례로 내놓은딥시크-V3과딥시크-R1은 이 회사의 이름을 세계에 알리는 계기가 됐다.


딥시크는V3와 R1이 모두 미국의 주요 AI 모델보다 성능이 더 낫거나 비슷한 수준이라고 자신했다.


특히 미국 수학경시대회인 AIME 2024 벤치마크 테스트에서 R1은 79.


8%를 얻어 오픈AI 'o1'의 79.


딥시크는 저성능 칩으로 ‘V3’ 등 자사 AI 모델을 훈련하고도 미국 빅테크 기업들의 모델과 비교해 유사하거나 능가하는 성능을 낸다는 평가를 받고 있다.


‘V3’에 투입한 비용은 557만6000달러(약 80억원) 수준으로, 미국 기업들이 투자한 수십조원과 비교하면 현저하게 적다.


트럼프 대통령은딥시크AI와.


딥시크가 공개한 자료에 따르면,딥시크-V3(DeepSeek-V3) 모델은 폐쇄형 모델과 비슷한 수준의 성능을 구현했다는 평가를 받았으며, 오픈소스 AI 모델 가운데서도 선두권에 속한다고 알려졌다.


앱 데이터 분석업체 센서 타워(Sensor Tower)는딥시크의 앱이 1월 10일 출시 이후 미국 시장에서 가파른 다운로드.


딥시크는V3모델 훈련에 엔비디아 H800을 사용했다.


미국 정부의 AI 반도체 수출 규제를 피하기 위해 성능을 낮춘 것이다.


딥시크가 AI 모델에 투입한 비용은 557만6000달러(약 78억8000만원)에 불과한 것으로 알려졌다.


고가의 엔비디아 AI 칩이 필요하지 않을 수 있다는 전망이 나오는 이유다.


앞서딥시크는 기술보고서에서 자사의 AI 모델V3를 훈련하는 데 엔비디아의 저렴한 칩인 'H800' 2천여개를 사용했다고 밝혀 업계에 큰 충격을 줬다.


H800은 엔비디아가 미 정부의 수출 규제를 피하기 위해 만든 중국 수출용 제품으로, 성능을 낮춰 훨씬 더 저렴하다.


그동안 미국의 AI 선두 기업들은 수만개의.


http://www.lannathai.co.kr/


딥시크가 공개 보고서에 따르면,딥시크의 'V3'모델에 투입된 개발 비용은 557만6000달러(약 78억8000만원)에 그쳤다.


AI 모델 훈련엔 엔비디아가 중국 수출용으로 성능을 낮춰 출시한 H800 칩을 사용했다.


오픈AI 경쟁사 '앤트로픽'의 다리오 아모데이 최고경영자(CEO)가 앞서 밝힌 AI 모델 개발 비용은 적게는.


딥시크는 지난달 말 무료 오픈소스 대형 언어 모델'딥시크-V3'을 출시하면서 600만달러(약 87억원) 미만의 비용으로 단 2개월 만에 개발했다고 밝힌 데 이어 지난주 챗GPT 개발사 오픈AI의 최신 모델 'o1'보다 뛰어난 성능을 보인 것으로 알려진 추론 모델 'R1'을 출시했다.

댓글목록 0

등록된 댓글이 없습니다.

댓글쓰기

확인
자동등록방지 숫자를 순서대로 입력하세요.