موبنا : شرکت یاهو به منظور استفاده هرچه بهتر از سیستم‌های یادگیری ماشینی با انتشار بیانیه‌ای اعلام کرد بزرگ‌ترین مجموعه داده‌ها در جهان را جمع‌آوری کرده است تا دانشمندان علوم یادگیری ماشینی بتوانند از آن بهره‌مند شوند.این داده‌ها مجموعه‌ای از اطلاعات مربوط به کاربران ناشناخته است که در بخش‌های Yahoo News و Yahoo Sport فعالیت کرده‌اند. شرکت یاهو اعلام کرد در این اقدام بیش از ۱۱۰ میلیارد فایل اطلاعاتی مربوط به اتفاقات مختلف را گردآوری کرده است که به عبارت دیگر می‌توان گفت۱۱۰ میلیارد رکورد اطلاعاتی بر اساس کلیک کاربران روی اخبار یا اقدامات مشابه جمع‌آوری شده‌اند. حجم این میزان اطلاعات در مجموع 5/ 13 ترابایت محاسبه شده است که البته یاهو با فشرده سازی آن را به 5/ 1 ترابایت تغییر داده است. این رقم نسبت به حجم داده‌هایی که یاهو پیش از این جمع‌آوری کرده بود ۱۰ برابر بیشتر است.شرکت یاهو در بیانیه خود توضیح داد: «داده‌ها مایه حیات برای سیستم‌های یادگیری ماشینی محسوب می‌شوند. دسترسی به حجم گسترده اطلاعات به دانشمندان این امکان را می‌دهد تا بتوانند به صورت دقیق‌تر در این زمینه مطالعه کنند و خدمات بهتر و کارآمدتری را ارائه دهند.