Gemini 2.0: nowy model agenta AI od Google

Google prezentuje Gemini 2.0, nasz jak dotąd najbardziej zaawansowany model AI z nowymi osiągnięciami w zakresie multimodalności – takimi jak natywne generowanie obrazów i dźwięku. Model może także natywnie wywoływać narzędzia takie jak wyszukiwarka Google, wykonywać kod oraz uruchamiać zewnętrzne funkcje określone przez użytkownika.

Gemini 2.0 Flash – dostępny już dziś

Google już dzisiaj wprowadza pierwszy model z serii Gemini 2.0: wersję eksperymentalną Gemini 2.0 Flash. Jest to wszechstronny model wyróżniający się niskimi opóźnieniami i lepszą wydajnością.

Model eksperymentalny Gemini 2.0 Flash jest teraz dostępny dla deweloperów w ramach interfejsu Gemini API w Google AI Studio oraz Vertex AI.
Od dzisiaj użytkownicy Gemini na całym świecie mogą też korzystać ze wspomnianego modelu, wybierając go w menu w aplikacji internetowej na komputerze lub telefonie. Wkrótce będzie on również dostępny w aplikacji mobilnej Gemini. Dzięki nowemu modelowi asystent Gemini będzie jeszcze bardziej pomocny i przydatny.

Funkcja Deep Research

Użytkownicy Gemini Advanced uzyskają również dostęp do nowej funkcji o nazwie Deep Research. Deep Research z pomocą AI bada złożone tematy i prezentuje znalezione informacje w rozbudowanych, łatwych do czytania raportach.

Eksperymenty na przyszłość

Google dzieli się również postępami badań nad agentami, prezentując prototypy oparte na natywnych multimodalnych możliwościach Gemini 2.0.

Aby przetestować, jak agentowe doświadczenia mogą działać bezpiecznie i w praktycznych warunkach, Google udostępnia szereg prototypów badawczych i eksperymentów społeczności zaufanych testerów:

agenci korzystający z analizy multimodalnej do rozumienia rzeczywistego świata: Project Astra, prototyp badawczy Google, który bada możliwości uniwersalnego asystenta AI, jest lepszy z wersją 2.0 i jest teraz dostępny dla grupy zaufanych testerów. Na przykład dzięki modelowi Gemini 2.0 prototyp Project Astra może korzystać z wyszukiwarki Google, Obiektywu oraz Map, co sprawia, że może być znacznie bardziej przydatny na co dzień jako asystent;
agenci pomagający w wykonywaniu złożonych zadań: Project Mariner to wczesny prototyp badawczy zbudowany przy użyciu Gemini 2.0, który bada przyszłość interakcji między człowiekiem a agentem, zaczynając od przeglądarki. Jako prototyp badawczy jest w stanie zrozumieć i przeanalizować informacje znajdujące się na ekranie przeglądarki, w tym piksele i elementy internetowe, takie jak tekst, kod, obrazy i formularze, a następnie wykorzystuje te informacje za pośrednictwem eksperymentalnego rozszerzenia Chrome do wykonywania zadań za użytkownika. Jest również dostępny dla ograniczonej grupy zaufanych testerów;
agenci dla deweloperów: Jules, eksperymentalny agent kodujący oparty na sztucznej inteligencji, który integruje się bezpośrednio z przepływem pracy GitHub. który jest zintegrowany bezpośrednio z przepływem pracy platformy GitHub. Potrafi on rozwiązywać problemy, opracowywać plany i je realizować, a wszystko to pod kierunkiem i nadzorem dewelopera. Jest dostępny dla zaufanych testerów już dziś;
agenci stosowani w innych dziedzinach: Google stworzył agentów korzystających z Gemini 2.0, którzy mogą pomóc poruszać się po wirtualnym świecie gier wideo, oraz agentów, którzy mogą pomóc w świecie fizycznym, stosując możliwości rozumowania przestrzennego Gemini 2.0 w robotyce.