یکی از قویترین مدلهای «هوش مصنوعی باز» رونمایی شد
به نقل از تک کرانچ، دیپسیک وی۳ میتواند طیف گستردهای از کارها و وظایف مبتنی بر متن را مانند کدنویسی، ترجمه و نوشتن مقاله و ایمیل با توجه به درخواست انجام دهد. براساس آزمایشهای داخلی شرکت دیپسیک، دیپسیک وی۳ هم از مدلهای قابل دانلود «باز» در دسترس و هم از مدلهای «بسته» هوش مصنوعی که فقط از طریق API قابل دسترسی هستند، بهتر عمل میکند. در زیرمجموعهای از رقابتهای کدنویسی که در پلتفرم «کدفورسز» (Codeforces) میزبانی میشوند، دیپسیک وی۳ توانست بهتر از مدلهای دیگر مانند «Llama ۳.۱ ۴۰۵B» شرکت «متا»(Meta) ،«GPT-۴o» شرکت «اوپنایآی» (OpenAI) و «Qwen ۲.۵ ۷۲B» شرکت «علیبابا» (Alibaba)عمل میکند.
دیپسیک گفت که دیپسیکوی۳ روی یک مجموعه داده متشکل از ۱۴.۸تریلیون توکن آموزش دیده است. در علم داده، توکنها برای نمایش بیتهای داده خام استفاده میشوند. یکمیلیون توکن معادل حدود ۷۵۰هزار کلمه است.
اگرچه دیپسیکوی۳ کاربردیترین مدل نیست، اما از برخی جهات یک دستاورد بهشمار میرود. دیپسیک توانست این مدل را با استفاده از مرکز داده پردازندههای گرافیکی H۸۰۰ شرکت «انویدیا» (Nvidia) در حدود ۲ماه آموزش دهد. این شرکت خاطرنشان کرد فقط ۵.۵میلیون دلار برای آموزش دیپسیکوی۳ هزینه کرده که کسری از هزینه توسعه مدلهایی مانند GPT-۴ است.