На конференции разработчиков Google I/O в мае 2023 года генеральный директор Сундар Пичаи анонсировал будущую систему искусственного интеллекта (ИИ) компании Gemini.
Модель большого языка (LLM) разработана подразделением Google DeepMind (Brain Team + DeepMind). Он может конкурировать с системами искусственного интеллекта, такими как ChatGPT от OpenAI, и, возможно, превзойти их.
Подробностей пока мало, но вот что мы можем почерпнуть из последних интервью и отчетов о Google Gemini.
Содержание
- 1 Google Gemini станет мультимодальным
- 2 Gemini может использовать инструменты и API
- 3 Он поставляется с разными размерами и опциями.
- 4 Ранние результаты Близнецов многообещающие
- 5 Продвинутые чат-боты как универсальные персональные помощники
- 6 Конкуренты заинтересованы в производительности Gemini
- 7 Отдельные компании получили ранний доступ к Gemini
- 8 Meta работает над LLM, чтобы конкурировать с OpenAI
- 9 Обратный отсчет до Google Gemini
Google Gemini станет мультимодальным
Пичаи заявил, что Gemini сочетает в себе сильные стороны системы AlphaGo компании DeepMind, известной своим мастерством в сложной игре Го, с обширными возможностями языкового моделирования.
Он сказал, что с нуля он спроектирован как мультимодальный, объединяющий текст, изображения и другие типы данных. Это может позволить развить более естественные разговорные навыки.
Пичаи тоже подразумеваемый на будущие способности, такие как память и планирование, которые могут позволить решать задачи, требующие рассуждения.
Gemini может использовать инструменты и API
В обновлении своего профессионального био Летом главный научный сотрудник Google Джеффри Дин заявил, что Gemini — это одна из «мультимодальных моделей нового поколения», которую он помогает возглавлять.
Он сказал, что будет использовать Pathways, новую инфраструктуру искусственного интеллекта Google, чтобы обеспечить масштабирование обучения на различных наборах данных.
Это говорит о том, что Gemini потенциально является крупнейшей языковой моделью, созданной на сегодняшний день, вероятно, превышающей размер GPT-3 более чем на 175 миллиардов параметров.
Он поставляется с разными размерами и опциями.
Более подробную информацию сообщил Демис Хассабис, генеральный директор DeepMind.
В июне он рассказал Кабель что методы AlphaGo, такие как обучение с подкреплением и поиск по деревьям, могут дать Близнецам новые способности, такие как рассуждение и решение проблем.
Хассабис заявил, что Gemini — это «серия моделей», которая будет доступна в разных размерах и вариантах.
Он также упомянул, что Gemini могут использовать память, проверку фактов по таким источникам, как поиск Google, и расширенное обучение с подкреплением, чтобы повысить точность и уменьшить опасный галлюцинаторный контент.
Ранние результаты Близнецов многообещающие
В сентябре Время В интервью Хассабис подтвердил, что Gemini стремится объединить масштаб и инновации.
Он сказал, что включение планирования и памяти находится на ранних стадиях исследования.
Хассабис также заявил, что Gemini может использовать методы поиска для печати целых блоков информации, а не для пословной генерации, чтобы улучшить фактическую согласованность.
Он рассказал, что Gemini основывается на мультимодальной работе DeepMind, такой как система субтитров Flamingo.
В целом Хассабис сказал, что Gemini демонстрирует «очень многообещающие первые результаты».
Продвинутые чат-боты как универсальные персональные помощники
В интервью с Кабельвыпущенный несколькими днями позже, Пичаи дал наиболее недвусмысленное представление о том, как Gemini вписывается в дорожную карту продукта Google.
Он сказал, что диалоговые системы искусственного интеллекта, такие как Bard, «не являются конечным состоянием», а являются отправными точками, ведущими к созданию более продвинутых чат-ботов.
Пичаи сказал, что Gemini и будущие версии в конечном итоге станут «невероятными универсальными личными помощниками», интегрированными в повседневную жизнь людей в таких областях, как путешествия, работа и развлечения.
Он повторил, что Gemini объединит сильные стороны текста и изображений, заявив, что сегодняшние чат-боты будут «выглядеть тривиально» по сравнению с ними через несколько лет.
Конкуренты заинтересованы в производительности Gemini
Генеральный директор OpenAI написал в Твиттере, что выглядело как ответ на платный доступ.Статья сообщает, что Google Gemini может превзойти GPT-4.
Цифры неправильные?
— Илон Маск (@elonmusk) 30 августа 2023 г.
Официального ответа на дополнительный вопрос Илона Маска о том, верны ли цифры SemiAnaанализа, не последовало.
Отдельные компании получили ранний доступ к Gemini
Еще больше информации о прогрессе Близнецов на этой неделе: Что Информация сообщил, что Google предоставил небольшой группе разработчиков, не связанных с Google, ранний доступ к Gemini.
Это говорит о том, что Gemini вскоре может быть готова к выпуску бета-версии и интеграции с такими сервисами, как Google Cloud Vertex AI.
Meta работает над LLM, чтобы конкурировать с OpenAI
Хотя новости о Gemini пока многообещающие, Google, как сообщается, не единственная компания, готовая запустить новую программу LLM, чтобы конкурировать с OpenAI.
В соответствии с Журнал “Уолл СтритMeta также работает над моделью искусственного интеллекта, которая будет конкурировать с моделью GPT, лежащей в основе ChatGPT.
Meta недавно объявила о выпуске Llama 2, модели искусственного интеллекта с открытым исходным кодом, в сотрудничестве с Microsoft. Похоже, компания стремится ответственно создавать более доступный ИИ.
Обратный отсчет до Google Gemini
То, что мы знаем на данный момент, указывает на то, что Gemini может представлять собой значительный прогресс в обработке естественного языка.
Объединение последних исследований DeepMind в области искусственного интеллекта с огромными вычислительными ресурсами Google делает потенциальное воздействие сложно переоценить.
Если Gemini оправдает ожидания, это может привести к сдвигу в интерактивном искусственном интеллекте, который соответствует амбициям Google «принести ИИ ответственным образом к миллиардам людей».
Последние новости от Meta и Google появились всего через несколько дней после первого форума AI Insight Forum, на котором руководители технологических компаний встретились в частном порядке с частью Сената США, чтобы обсудить будущее искусственного интеллекта.
Рекомендованное изображение: Фотографии VDB/Shutterstock