0

Project Genie معرفی شد؛ هوش مصنوعی گوگل که با دستورات متنی، جهان‌های تعاملی می‌سازد [تماشا کنید]

Project Genie معرفی شد؛ هوش مصنوعی گوگل که با دستورات متنی، جهان‌های تعاملی می‌سازد [تماشا کنید]
بازدید 1

گوگل با معرفی Project Genie، گام بلند دیگری در مسیر دستیابی به هوش جامع مصنوعی (AGI) برداشته است. این ابزار مبتنی‌بر هوش مصنوعی که در دسترس کاربران دارای اشتراک AI Ultra در آمریکا قرار گرفته، به کاربران اجازه می‌دهد تنها با نوشتن چند خط متن، جهان‌های تعاملی و قابل تجربه خلق کنند.

Genie 3 در واقع یک «مدل جهانی» (World Model) همه‌منظوره است که محیط‌های متنوع و تعاملی را شبیه‌سازی می‌کند. برخلاف مدل‌های قبلی گوگل دیپ‌مایند که برای محیط‌های خاصی مثل شطرنج یا بازی Go طراحی شده بودند، این مدل برای درک تنوع دنیای واقعی و پیش‌بینی نحوه تکامل محیط براساس کنش‌های کاربر ساخته شده است.

ساخت جهان‌های تعاملی با ابزار هوش مصنوعی جدید گوگل

در این نمونه اولیه تحقیقاتی، شما ابتدا محیط موردنظر خود را توصیف می‌کنید؛ مثلاً مشخص می‌کنید که قصد دارید جهان را چگونه کاوش کنید (پیاده، پرواز، رانندگی یا…) و زاویه دید شما اول‌شخص یا سوم‌شخص باشد.

پس از تعیین شخصیت (انسان، حیوان یا حتی یک شیء)، مدل Nano Banana Pro تصویری پیش‌فرض یا همان طرح اولیه جهان شما را ارائه می‌کند. این ویژگی به شما اجازه می‌دهد پیش از ورود کامل به دنیای ساخته شده، ظاهر آن را بررسی و در صورت نیاز ویرایش کنید. پس از تأیید، با انتخاب دکمه Create world وارد یک تجربه 60 ثانیه‌ای می‌شوید.

جهان‌های ساخته شده با کیفیت 720p و نرخ فریم 20 تا 24 فریم‌برثانیه اجرا می‌شوند. نکته خیره‌کننده اینکه با حرکت شما، Genie 3 مسیرهای بعدی را به‌صورت لحظه‌ای و براساس اقدامات شما خلق می‌کند.

Project Genie همچنین قابلیتی به نام Remix Worlds دارد که به کاربران اجازه می‌دهد جهان‌های موجود یا آثار دیگران در گالری را برداشته و با تغییر دستورات (Prompts)، نسخه‌ای جدید از آنها تولید کنند. همچنین امکان دانلود ویدیو این جهان‌ها وجود دارد.

گوگل برای نمایش قدرت این مدل، چند ویدیو منتشر کرده که براساس دستورات متنی (Prompts) ساخته شده‌اند.

بااین‌حال، گوگل صراحتاً به برخی محدودیت‌های مدل خود اشاره کرده است. ازجمله اینکه محیط‌های تولید شده ممکن است همیشه کاملاً واقع‌گرایانه نباشند یا صددرصد از قوانین فیزیک پیروی نکنند. علاوه‌براین، کنترل شخصیت‌ها گاهی دشوار است یا با تأخیر (Latency) همراه می‌شود و مدت زمان هر جلسه درحال‌حاضر محدود به ۶۰ ثانیه است.

هدف گوگل از عرضه این فناوری، درک بهتر نحوه استفاده کاربران از مدل‌های جهانی در تحقیقات هوش مصنوعی است. اما در مقیاسی بزرگ‌تر، این فناوری بخشی از مأموریت آزمایشگاه گوگل دیپ‌مایند برای رسیدن به AGI است.

در‌حال‌حاضر، دسترسی به این ابزار تنها برای کاربران بالای 18 سال در ایالات متحده که اشتراک پریمیوم گوگل دارند میسر است، اما این شرکت وعده داده که به‌زودی آن را در دسترس افراد بیشتری قرار می‌دهد.

نظرات کاربران

  •  چنانچه دیدگاهی توهین آمیز باشد و متوجه نویسندگان و سایر کاربران باشد تایید نخواهد شد.
  •  چنانچه دیدگاه شما جنبه ی تبلیغاتی داشته باشد تایید نخواهد شد.
  •  چنانچه از لینک سایر وبسایت ها و یا وبسایت خود در دیدگاه استفاده کرده باشید تایید نخواهد شد.
  •  چنانچه در دیدگاه خود از شماره تماس، ایمیل و آیدی تلگرام استفاده کرده باشید تایید نخواهد شد.
  • چنانچه دیدگاهی بی ارتباط با موضوع آموزش مطرح شود تایید نخواهد شد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

بیشتر بخوانید