گوگل مدعی است مدل هوش مصنوعی جدید آن به نام جمینی ۱.۵ میتواند تا یک میلیون توکن ورودی معادل ۸۰۰ هزار واژه را مدیریت کند که ۷۰۰ بار بیشتر از قدرت سیستم جدید هوش مصنوعی اوپن ایآی است. به گزارش اینترستینگ انجینرینگ، به نظر میرسد گوگل سعی دارد به رقیبی جدی برای شرکتهای فعال در حوزه هوش مصنوعی تبدیل شود.
این شرکت حدود یک هفته قبل جمینی ۱.۰ اولترا قدرتمندترین مدل هوش مصنوعی خود را راهاندازی و اکنون جانشین آن یعنی جمینی ۱.۵ را معرفی کرده است. این نسل از مدلهای هوش مصنوعی سریعتر، هوشمندتر و ماهرتر از نمونههای قبلی است. جمینی ۱.۵ حاصل نوآوریهای خستگیناپذیر گوگل در حوزه پردازش زبان طبیعی (NLP) است. NLP شاخهای هوش مصنوعی مرتبط با درک و تولید زبان انسان است. گوگل مدعی است جمینی ۱.۵ میتواند تا یک میلیون توکن ورودی معادل ۴ میلیون کاراکتر یا ۸۰۰ هزار واژه را کنترل کند. این رقم ۷۰۰ بار بیشتر از رکورد جیپیتی-۴ (رکورددار قبلی این حوزه) است که قادر به پردازش ۱۲۸ هزار توکن است. چنین آمار و ارقامی بدان معنا است که جمینی ۱.۵ میتواند متون طولانیتر و پیچیدهتر مانند رمان، مقالات یا سخنرانیها را درک و تولید و همزمان هماهنگی و کیفیت را حفظ کند.
از سوی دیگر جمینی ۱.۵ میتواند دادههای ورودی چندوجهی مانند متن، عکس، صوت و ویدئو را مدیریت و بازدههایی در هریک از این فرمتها تولید کند. به عنوان مثال جمینی ۱.۵ میتواند با توجه به یک ویدئوکلیپ به سوالات پاسخ دهد یا براساس متن، شعری بسازد. علاوه بر آنچه گفته شد، جمینی ۱.۵ یک مدل نیست، بلکه خانوادهای از مدلهای هوش مصنوعی است که نیازهای مختلفی دارند و برای مقاصد متفاوتی به کار میروند. جمینی ۱.۵ پرو یک مدل چند منظورهتر وسیع به حساب میآید که از نظر عملکرد با جمینی ۱.۰ اولترا قابلمقایسه است. اما قدرت رایانشی کمتری را به کار میگیرد. این آن را برای موارد استفاده در دنیای واقعی کارآمدتر و مقیاسپذیرتر میکند. جمینی ۱.۵ پرو همچنین نخستین مدلی است که از تکنیک جدیدی به نامMixture-of-Experts )MoE) (ترکیب کارشناسان) استفاده میکند. این امر به آن اجازه میدهد تا به جای آنکه در هر بار جستوجو کل مدل به کار گرفته شود، بخشهای مرتبط انتخاب شوند.
/مهر